3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ComfyUI
GitHub
ComfyUI-LavaSR
「NightMean/ComfyUI-LavaSR」は、ComfyUI用のカスタムノードとして、軽量なLavaSR音声強調モデルを統合します。この…
★ 2 Apache-2.0 2026-03-03
3D / NeRF
GitHub
3D-Scene-Generator
このツールは、テキスト記述から完全な3Dシーンや環境を生成する画期的なAIです。ニューラルラディエンスフィールド…
★ 2 2025-11-02
音声生成 / TTS
GitHub
GPT-SoVITS-ko
このツールは、韓国語に特化した音声複製TTS(Text-to-Speech)サービスです。既存のGPT-SoVITSプロジェクトを基盤と…
★ 2 ⑂ 1 MIT 2026-05-27
画像生成
GitHub
mythforgemtg
Myth Forgeは、単一のテーマプロンプトから、AIが生成したカスタムカードアートとプロキシフレームを用いて、テーマ…
★ 2 ⑂ 1 2026-06-18
LLM
GitHub
builder-ai
builder-aiは、AIアシスタントがLLM(大規模言語モデル)を活用した機能を開発する際、プロダクション環境の厳格な品…
★ 2 ⑂ 2 MIT 2026-06-23
ASR / 音声認識
GitHub
parley
Parleyは、音声指示型Vision-Language-Action(VLA)パイプライン向けのベンチマークツールキットです。このツールは…
★ 2 MIT 2026-06-23
画像生成
GitHub
dify-plugin-muapi
このツールは、MuAPIをDifyに統合するカスタムプラグインです。Difyのワークフロー、チャットフロー、エージェントか…
★ 2 ⑂ 1 2026-06-15
ComfyUI
GitHub
ComfyUI-Caption-Cleaner
ComfyUI上で、Florence-2やCogVLM、JoyTagなどのVLMが生成した自然文キャプションを、LoRA学習向けに自動整形するカ…
★ 2 ⑂ 1 2026-03-05
LLM
GitHub
flash-opd
FlashOPDは、わずか650行のコアコードでOn-Policy Distillation (OPD) を完全に実装した軽量なツールです。既存の複…
★ 2 2026-04-22
音声生成 / TTS
GitHub
voice-channel
このツールは「voice-channel」と名付けられ、Claude Codeエージェントをハンズフリーで音声操作するためのローカル…
★ 2 NOASSERTION 2026-06-23
マルチモーダル
GitHub
visualdocqa-kit
VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…
★ 2 MIT 2026-06-22
画像生成
GitHub
dreamina-web-interface
DreamWeaver CLIは、テキストによる指示を視覚的な作品に変えるインテリジェントなコマンドラインツールです。参照画…
★ 2 2026-06-26
3D / NeRF
GitHub
worldsplat
WorldSplatは、テキストプロンプトからナビゲーション可能な3Dガウスプラットシーンを生成するオープンソースツール…
★ 2 NOASSERTION 2026-03-28
ASR / 音声認識
GitHub
shizi
「拾字 · Voicetype Studio」は、動画をテキストに変換し、ローカルでダウンロード・処理を行うmacOS向けのツールで…
★ 2 AGPL-3.0 2026-05-22
画像生成
GitHub
ernie-image-skill
AIwork4me/ernie-image-skillは、Baidu AI StudioのERNIE-ImageおよびERNIE-Image-Turboモデルを使用してローカルPNG…
★ 2 MIT-0 2026-05-02
ComfyUI
GitHub
ComfyUI-PromptDrafter-SceneQueue
ComfyUI-PromptDrafter-SceneQueueは、画像生成AIツールComfyUIの拡張機能であるComfyUI-PromptDrafterのコンパニオ…
★ 2 ⑂ 1 MIT 2026-03-20
ASR / 音声認識
GitHub
macOS-dictate
macOS向けのプライバシーを重視した自己ホスト型音声入力ツールです。ホットキーを押しながら話すことで、音声をテキ…
★ 2 MIT 2026-06-25
LLM
GitHub
MergeFlow-AI
MergeFlow AIは、GitHubのプルリクエストがマージされた後の反復作業を自動化するAIエージェントです。プルリクエス…
★ 2 2026-06-10
その他
GitHub
Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
LLM
GitHub
production-rag-assistant
この「Production RAG Assistant」は、FastAPI、Postgres/pgvector、ハイブリッド検索、評価ゲート、可観測性などを…
★ 2 2026-05-28
ComfyUI
GitHub
ComfyUI_AB_Wildcard
「AB Wildcard - ComfyUI Wildcard Processor」は、ComfyUIのプロンプト作成を劇的に強化するカスタムノードです。ワ…
★ 2 ⑂ 1 MIT 2026-06-13
マルチモーダル
GitHub
MagikaDocumentFromPixel
このツールは、Magikaに触発された軽量な画像品質ゲートで、画像を「シャープ」、「ぼやけ」、「不確実」のいずれか…
★ 2 MIT 2026-04-27
3D / NeRF
GitHub
tju-cv-course-project
このリポジトリは、医用画像の分類、セグメンテーション、および3D再構築に特化したコンピュータビジョンの学術プロ…
★ 2 MIT 2026-03-21
LLM
GitHub
tiny-rag-lab
tiny-rag-labは、リトリーバル・オーグメンテッド・ジェネレーション(RAG)の仕組みをエンドツーエンドで学ぶための…
★ 2 2026-06-25