3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub LabVLA
LabVLAは、Qwen3-VL-4B-Instructビジョン言語モデルを、DiTフローマッチングアクションエキスパートと独自のπ0.5レシ…
★ 72 ⑂ 4 MIT 2026-06-22
ASR / 音声認識 GitHub ai-video-editing-skill
このAIエージェントスキルは、旅行で撮影した大量の動画素材から、自動的にVlogを生成します。ユーザーは素材フォル…
★ 72 ⑂ 8 MIT 2026-04-27
ComfyUI GitHub ComfyUI-Doctor
ComfyUI-Doctorは、ComfyUI向けのリアルタイム診断およびデバッグ支援ツールです。ランタイムエラーを捕捉し、ノード…
★ 72 ⑂ 4 MIT 2026-06-24
音声生成 / TTS GitHub kikiri-tts
このプロジェクト「kikiri-tts」(旧kokoro-deutsch)は、既存のKokoro-82Mモデルをドイツ語向けにファインチューニ…
★ 72 ⑂ 19 Apache-2.0 2026-06-21
LLM GitHub VersperClaw
VersperClawは、検索、ブラウザ制御、コーディング、および長時間のセッション継続能力を統合したエージェント型研究…
★ 71 ⑂ 4 2026-06-29
音声生成 / TTS GitHub personaplex-mlx
PersonaPlex-MLXは、NVIDIAのフルデュプレックス音声対音声モデル「PersonaPlex」をApple Silicon向けにMLXで移植し…
★ 71 ⑂ 14 MIT 2026-02-18
画像生成 GitHub Pulse-of-Motion
「Pulse of Motion: Measuring Physical Frame Rate from Visual Dynamics」は、動画のコンテナメタデータに依らず、…
★ 71 ⑂ 5 2026-03-26
AIエージェント GitHub matryca-logseq-llm-wiki
Matryca Logseq LLM Wikiは、Andrej KarpathyのLLM WikiをアウトライナーパラダイムにもたらすヘッドレスなMCPサーバ…
★ 71 ⑂ 9 Apache-2.0 2026-06-23
音楽生成 GitHub tadpole-studio
Tadpole Studioは、AIによる音楽生成をローカル環境で完結できる多機能な音楽スタジオです。テキストからの音楽生成…
★ 71 ⑂ 10 MIT 2026-03-05
音声生成 / TTS GitHub BlueTTS
Blueは、ONNX Runtimeを活用した高速なオープンソースのテキスト読み上げ(TTS)推論ツールです。Python 3.12以降を…
★ 71 ⑂ 10 MIT 2026-04-30
マルチモーダル GitHub CourtSI
CourtSIは、スポーツ分野における空間知能を評価するための大規模データセットとベンチマークです。100万以上の質問…
★ 71 Apache-2.0 2026-03-15
ASR / 音声認識 GitHub mediascribe
MediaScribeは、音声、ビデオ、テキストの文字起こしと、LLMを活用した要約を提供するコマンドラインツールです。そ…
★ 70 MIT 2026-04-16
音声生成 / TTS GitHub ZeusHammer
ZeusHammerは、AIエージェントのコスト、速度、プライバシー、オフライン利用、記憶能力といった課題を解決するため…
★ 70 ⑂ 15 2026-04-25
ComfyUI GitHub sd-lora-trainer
edenartlab/sd-lora-trainerは、Stable Diffusion v1.5およびSDXL用のLoRaモジュールを学習およびフルファインチュー…
★ 70 ⑂ 12 NOASSERTION 2025-08-04
LLM GitHub mxcp
MXCPは、企業向けのAIアプリケーションを本番環境で構築するための、Model Execution + Context Protocol (MCP) フレ…
★ 69 ⑂ 9 NOASSERTION 2026-06-25
音楽生成 GitHub theDAW
「theDAW」はGANTASMOが開発したAI音楽制作のためのオールインワンスタジオです。既存のオーディオ、テキストプロン…
★ 68 ⑂ 14 MIT 2026-06-26
ComfyUI GitHub ComfyUI-Depth-Visualization
このComfyUI拡張機能は、Depth Mapが適用された画像をComfyUI内で視覚的に表示するためのビューアーです。あらゆるDe…
★ 68 ⑂ 10 GPL-3.0 2026-01-11
動画生成 GitHub MIND
MINDは、ワールドモデルの記憶一貫性と行動制御能力を評価するための、初のオープンエンドな閉ループ再訪問ベンチマ…
★ 68 ⑂ 2 MIT 2026-05-25
音声生成 / TTS GitHub omnivoice-server
omnivoice-serverは、OmniVoiceテキスト読み上げモデルのOpenAI互換HTTPサーバーです。OpenAIのTTSエンドポイントの…
★ 68 ⑂ 22 MIT 2026-06-26
動画生成 GitHub video-to-video
「Reshoot-Anything」は、単眼ビデオを新しいカメラ軌道で再撮影するための自己教師ありビデオ拡散モデルです。既存…
★ 67 ⑂ 8 Apache-2.0 2026-04-27
3D / NeRF GitHub awesome-dynamic-NeRF
このリポジトリは、動的シーンのためのニューラルラディアンスフィールド(NeRF)に関する優れたリソースのキュレー…
★ 67 ⑂ 2 2026-04-21
AIエージェント GitHub harness-forge
Harness Forgeは、Claude Codeのスキルとして提供されるツールで、固定された大規模言語モデル(LLM)の「ハーネス」…
★ 67 ⑂ 6 MIT 2026-06-14
音声生成 / TTS GitHub korean-voice-acting-engine
Korean Voice Acting Engine (KVAE) は、韓国語音声に特化したローカルファーストのツールキットです。ユーザーが自…
★ 67 ⑂ 5 NOASSERTION 2026-05-05
ASR / 音声認識 GitHub pi-listen
pi-listenは、Pi CLI (コーディングエージェント) 向けのハンズフリー音声入力ツールです。Deepgramによるクラウドス…
★ 66 ⑂ 13 MIT 2026-05-01