3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル

GitHub

LabVLA

LabVLAは、Qwen3-VL-4B-Instructビジョン言語モデルを、DiTフローマッチングアクションエキスパートと独自のπ0.5レシ…

#CLI #GPU必須 #Python

★ 72 ⑂ 4 MIT 2026-06-22

ASR / 音声認識

GitHub

ai-video-editing-skill

このAIエージェントスキルは、旅行で撮影した大量の動画素材から、自動的にVlogを生成します。ユーザーは素材フォル…

#AI Agent #CLI #Python

★ 72 ⑂ 8 MIT 2026-04-27

ComfyUI

GitHub

ComfyUI-Doctor

ComfyUI-Doctorは、ComfyUI向けのリアルタイム診断およびデバッグ支援ツールです。ランタイムエラーを捕捉し、ノード…

#ComfyUI対応 #LLM連携 #Python

★ 72 ⑂ 4 MIT 2026-06-24

音声生成 / TTS

GitHub

kikiri-tts

このプロジェクト「kikiri-tts」（旧kokoro-deutsch）は、既存のKokoro-82Mモデルをドイツ語向けにファインチューニ…

#CLI #GPU必須 #Python

★ 72 ⑂ 19 Apache-2.0 2026-06-21

LLM

GitHub

VersperClaw

VersperClawは、検索、ブラウザ制御、コーディング、および長時間のセッション継続能力を統合したエージェント型研究…

#Claude対応 #CLI #Docker

★ 71 ⑂ 4 2026-06-29

音声生成 / TTS

GitHub

personaplex-mlx

PersonaPlex-MLXは、NVIDIAのフルデュプレックス音声対音声モデル「PersonaPlex」をApple Silicon向けにMLXで移植し…

#Apple Silicon Mac #CLI #Hugging Face

★ 71 ⑂ 14 MIT 2026-02-18

画像生成

GitHub

Pulse-of-Motion

「Pulse of Motion: Measuring Physical Frame Rate from Visual Dynamics」は、動画のコンテナメタデータに依らず、…

#AI/MLモデル #CLI #Hugging Face

★ 71 ⑂ 5 2026-03-26

AIエージェント

GitHub

matryca-logseq-llm-wiki

Matryca Logseq LLM Wikiは、Andrej KarpathyのLLM WikiをアウトライナーパラダイムにもたらすヘッドレスなMCPサーバ…

#AIエージェント #CLI #LLM

★ 71 ⑂ 9 Apache-2.0 2026-06-23

音楽生成

GitHub

tadpole-studio

Tadpole Studioは、AIによる音楽生成をローカル環境で完結できる多機能な音楽スタジオです。テキストからの音楽生成…

#AI音楽生成 #GPU推奨 #Python

★ 71 ⑂ 10 MIT 2026-03-05

音声生成 / TTS

GitHub

BlueTTS

Blueは、ONNX Runtimeを活用した高速なオープンソースのテキスト読み上げ（TTS）推論ツールです。Python 3.12以降を…

#CLI #GPU対応 #ONNX Runtime

★ 71 ⑂ 10 MIT 2026-04-30

マルチモーダル

GitHub

CourtSI

CourtSIは、スポーツ分野における空間知能を評価するための大規模データセットとベンチマークです。100万以上の質問…

#GPU推奨 #Python #VLM

★ 71 Apache-2.0 2026-03-15

ASR / 音声認識

GitHub

mediascribe

MediaScribeは、音声、ビデオ、テキストの文字起こしと、LLMを活用した要約を提供するコマンドラインツールです。そ…

#ASR #CLI #LLM

★ 70 MIT 2026-04-16

音声生成 / TTS

GitHub

ZeusHammer

ZeusHammerは、AIエージェントのコスト、速度、プライバシー、オフライン利用、記憶能力といった課題を解決するため…

#AIエージェント #CLI #Python

★ 70 ⑂ 15 2026-04-25

ComfyUI

GitHub

sd-lora-trainer

edenartlab/sd-lora-trainerは、Stable Diffusion v1.5およびSDXL用のLoRaモジュールを学習およびフルファインチュー…

#CLI #ComfyUI対応 #GPU必須

★ 70 ⑂ 12 NOASSERTION 2025-08-04

LLM

GitHub

mxcp

MXCPは、企業向けのAIアプリケーションを本番環境で構築するための、Model Execution + Context Protocol (MCP) フレ…

#AI開発 #CLI #Python

★ 69 ⑂ 9 NOASSERTION 2026-06-25

音楽生成

GitHub

theDAW

「theDAW」はGANTASMOが開発したAI音楽制作のためのオールインワンスタジオです。既存のオーディオ、テキストプロン…

#AI生成 #GPU必須 #Linux

★ 68 ⑂ 14 MIT 2026-06-26

ComfyUI

GitHub

ComfyUI-Depth-Visualization

このComfyUI拡張機能は、Depth Mapが適用された画像をComfyUI内で視覚的に表示するためのビューアーです。あらゆるDe…

#ComfyUI対応 #Python #Web UI

★ 68 ⑂ 10 GPL-3.0 2026-01-11

動画生成

GitHub

MIND

MINDは、ワールドモデルの記憶一貫性と行動制御能力を評価するための、初のオープンエンドな閉ループ再訪問ベンチマ…

#Python #Unreal Engine 5 #ビデオデータセット

★ 68 ⑂ 2 MIT 2026-05-25

音声生成 / TTS

GitHub

omnivoice-server

omnivoice-serverは、OmniVoiceテキスト読み上げモデルのOpenAI互換HTTPサーバーです。OpenAIのTTSエンドポイントの…

#CLI #GPU対応 #OpenAI互換

★ 68 ⑂ 22 MIT 2026-06-26

動画生成

GitHub

video-to-video

「Reshoot-Anything」は、単眼ビデオを新しいカメラ軌道で再撮影するための自己教師ありビデオ拡散モデルです。既存…

#CLI #GPU必須 #Python

★ 67 ⑂ 8 Apache-2.0 2026-04-27

3D / NeRF

GitHub

awesome-dynamic-NeRF

このリポジトリは、動的シーンのためのニューラルラディアンスフィールド（NeRF）に関する優れたリソースのキュレー…

#3D再構築 #GPU必須 #Python

★ 67 ⑂ 2 2026-04-21

AIエージェント

GitHub

harness-forge

Harness Forgeは、Claude Codeのスキルとして提供されるツールで、固定された大規模言語モデル（LLM）の「ハーネス」…

#Claude Code対応 #CLI #LLMハーネス最適化

★ 67 ⑂ 6 MIT 2026-06-14

音声生成 / TTS

GitHub

korean-voice-acting-engine

Korean Voice Acting Engine (KVAE) は、韓国語音声に特化したローカルファーストのツールキットです。ユーザーが自…

#AI Voice Catalog #Audio Review #CLI

★ 67 ⑂ 5 NOASSERTION 2026-05-05

ASR / 音声認識

GitHub

pi-listen

pi-listenは、Pi CLI (コーディングエージェント) 向けのハンズフリー音声入力ツールです。Deepgramによるクラウドス…

#CLI #npm #Python

★ 66 ⑂ 13 MIT 2026-05-01