3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
YOOS-APP
YOOS-APPは、ユーザー自身の執筆スタイルを学習し、その個性を保ったまま新しいコンテンツを生成するユニバーサルな…
★ 1 MIT 2026-06-05
LLM
GitHub
local-ai-lab
「local-ai-lab」は、RAG (Retrieval Augmented Generation)、MCP (Model Context Protocol)、LangChain、LangGraph…
★ 1 MIT 2026-06-20
ASR / 音声認識
GitHub
carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
ComfyUI
GitHub
Comfy_Storyboard
「ComfyUI Storyboard Workspace」は、ComfyUI向けのPureRef風ストーリーボード・リファレンスボード拡張機能です。…
★ 1 MIT 2026-04-13
3D / NeRF
GitHub
gaussian-splat-based-anomaly-detection
本ツールは、UAVで撮影した高層構造物(携帯電話基地局、風力タービン、電柱など)の画像を3D Gaussian Splatting (3…
★ 1 2026-05-17
ComfyUI
GitHub
comfyui-cloud-storage
comfyui-cloud-storageは、画像生成AIツールComfyUI用のカスタムノードパッケージです。ComfyUIで生成された画像、動…
★ 1 ⑂ 1 MIT 2026-05-06
マルチモーダル
GitHub
qwen-visual-training-lab
「Qwen visual training lab」は、Windows環境でAMD GPUとDirectMLを利用し、QwenスタイルのビジュアルLoRA実験の実…
★ 1 2026-05-15
LLM
GitHub
rag-chatbot-university
UniMindは、大学生向けのAIを活用したRAG(検索拡張生成)チャットボットで、大学のノートに関する質問に即座に答え…
★ 1 2026-05-30
画像生成
GitHub
LoRA-Dataset-Coach
「LoRA-Dataset-Coach」は、SDXLやFlux、Wanなどの写真・動画モデル向けLoRAトレーニングデータセットの準備、検証、…
★ 1 NOASSERTION 2026-06-05
ComfyUI
GitHub
niren-drama
泥人剧场 (Niren Drama) は、縦型ショートドラマ制作に特化したフルスタックAIプラットフォームです。このツールは、…
★ 1 MIT 2026-06-02
音楽生成
GitHub
Intuitive_Music
「Intuitives DAW」は、従来の音楽制作の障壁を取り除き、誰もが気軽に音楽制作を楽しめるよう設計された、実験的な…
★ 1 MIT 2026-05-14
LLM
GitHub
Artificial_Intelligence_Driven_Electronic_Design_Automation
AIDEA(Artificial Intelligence Driven Electronic Design Automation)は、AIを活用して半導体設計プロセスを統合…
★ 1 ⑂ 1 2026-06-25
ComfyUI
GitHub
vram8gb_comfyui_wan2.2
vram8gb_comfyui_wan2.2は、8GBのVRAMを持つミドルレンジGPU環境に最適化されたComfyUIワークフローです。Wan2.2(14…
★ 1 2026-06-25
音声生成 / TTS
GitHub
lixaudio
LixAudioは、音声処理、音声認識(STT)、テキスト読み上げ(TTS)、セマンティック音声理解のためのモジュラーなPyt…
★ 1 ⑂ 1 GPL-3.0 2026-02-04
動画生成
GitHub
seedance-2.0-api
Seedance 2.0 APIは、fal.aiを通じて提供されるByteDanceの最先端AI動画生成モデルです。テキスト、画像、または参照…
★ 1 ⑂ 1 MIT 2026-04-16
マルチモーダル
GitHub
control-sci
ControlMindは、MinerUを活用した科学文書インテリジェンスシステムです。生PDFから直接情報を抽出し、科学論文の理…
★ 1 NOASSERTION 2026-05-30
音楽生成
GitHub
rl-beat-generation
このプロジェクトは、強化学習を用いてドラムビートを自動生成するPPOエージェントを開発しています。エージェントは…
★ 1 MIT 2026-05-10
ASR / 音声認識
GitHub
whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
AIエージェント
GitHub
traceforge
TraceForgeは、AIコーディングエージェントやシェルコマンドの実行をローカルで詳細に記録し、監査するためのブラッ…
★ 1 MIT 2026-05-28
動画生成
GitHub
PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
LLM
GitHub
citeguard
CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成(RAG)のための適合偽発見率制御ツールです。本ツールは、…
★ 1 MIT 2026-05-28
ASR / 音声認識
GitHub
spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24
画像生成
GitHub
image_generations
「Partial Image」は、OpenAI GPT-image-2のストリーミング部分画像APIのデバッグとデモンストレーションを目的とし…
★ 1 MIT 2026-06-05
動画生成
GitHub
NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05