3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

画像生成
GitHub
via54Design
via54Designは、人間のインスピレーションとAIを融合させ、物語からビデオ、プレゼンテーション、クリエイティブ画像…
★ 1 NOASSERTION 2026-06-24
ASR / 音声認識
GitHub
ae-auto-subtitles
AED Subtitlesは、Adobe After Effects向けにDescriptスタイルのローカルWhisperキャプションを提供するツールです。…
★ 1 2026-06-15
動画生成
GitHub
claude-higgsfield-skill
Claude Higgsfield Skillは、アイデアから映画レベルのキャラクターシート、ストーリーボード、ショット、サムネイル…
★ 1 ⑂ 1 MIT 2026-06-21
動画生成
GitHub
flow
オープンソースの自律型動画生成パイプライン「Flow」。トピックを与えるだけで、LLMによるスクリプト作成、AI動画(…
★ 1 ⑂ 1 MIT 2026-06-24
ASR / 音声認識
GitHub
livekit-starter
LiveKit Voice AI Starterは、ブラウザ上でAIエージェントとリアルタイムで音声対話を行うためのフルスタックなスタ…
★ 1 MIT 2026-06-18
動画生成
GitHub
awesome-ai-restaurant-video-prompts
このGitHubリポジトリは、AIを活用したレストランおよび食品マーケティングのビデオプロンプト、反復可能なワークフ…
★ 1 2026-04-28
マルチモーダル
GitHub
uitars-mcp
UI-TARS MCPは、AIエージェントがデスクトップとウェブブラウザを操作するための「目と手」を提供するサーバーツール…
★ 1 Apache-2.0 2026-06-07
LLM
GitHub
awesome-opd
「Awesome On-Policy Distillation」は、強化学習におけるOn-Policy Distillation (OPD) に関する厳選されたリソース…
★ 1 2026-05-15
ASR / 音声認識
GitHub
The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
ComfyUI
GitHub
comfyui-cloud-storage
comfyui-cloud-storageは、画像生成AIツールComfyUI用のカスタムノードパッケージです。ComfyUIで生成された画像、動…
★ 1 ⑂ 1 MIT 2026-05-06
動画生成
GitHub
ai-kissing-video-generator
「AI Kissing Video Generator」は、2枚のポートレート写真を統合し、AIでロマンチックなキス動画を生成するオープン…
★ 1 ⑂ 3 2026-06-16
ASR / 音声認識
GitHub
VoiceAgentAI
このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識(STT)と音声合成(TTS)をシー…
★ 1 MIT 2026-05-25
ComfyUI
GitHub
comfyui-touch-connect
comfyui-touch-connectは、タッチデバイス上でのComfyUIにおけるノード接続の正確性を大幅に向上させるツールです。…
★ 1 MIT 2026-06-13
音声生成 / TTS
GitHub
Voice-Command
Voice-Commandは、AI(Claude Desktop、Cowork、Claude Code、Codex CLI、Gemini CLI、LM Studioなど)を音声で完全…
★ 1 ⑂ 1 Apache-2.0 2026-06-23
3D / NeRF
GitHub
NeRF.cpp
NeRF.cppは、C++とLibTorchを用いてNeRF(Neural Radiance Fields)を実装したツールです。静止したシーンのRGB画像…
★ 1 BSD-3-Clause 2026-05-17
画像生成
GitHub
hermes-lemonade-llm-image-support
このプラグインは、Hermesエージェント向けにLemonade Serverを介した高速なローカル画像生成とLLM利用を可能にしま…
★ 1 MIT 2026-06-03
3D / NeRF
GitHub
MultiBEST—Multiscale-Multiphase-Bridging-Experiment-and-Simulation-Toolkit
MultiBESTは、実験で得られた2D顕微鏡写真、2D/3D EBSDデータ、またはユーザーのスケッチから、原子レベルおよび連続…
★ 1 GPL-3.0 2026-06-09
LLM
GitHub
model-monitor
「模型 API 监控工具」は、OpenAI、DeepSeek、MiMoなど、複数のモデルAPIの利用状況をリアルタイムで監視・管理する…
★ 1 MIT 2026-06-25
AIエージェント
GitHub
skill-document-analysis
Document Analysisは、標準化された「識別→分解→評価→出力」プロセスを通じて、あらゆる種類のドキュメントを実行可…
★ 1 MIT 2026-06-15
画像生成
GitHub
diffusion-models-from-scratch
NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル(DDPM、U-Net、CFG、CLIPコサイン類似度)をFashionMNIS…
★ 1 MIT 2026-05-08
3D / NeRF
GitHub
classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
AIエージェント
GitHub
txfence
txfenceは、EVM、Solana、Cosmosといった主要なブロックチェーン上で動作する自律エージェントの行動を安全に管理す…
★ 1 MIT 2026-05-19
音声生成 / TTS
GitHub
RustyClaw
RustyClawは、Rustで実装されたClaude Code CLIで、コードベースの効率的なRAGインデックス作成、スマートなモデルル…
★ 1 Apache-2.0 2026-05-08
音楽生成
GitHub
musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04