3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2211 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
happy-horse-api
Happy Horse APIは、AlibabaのAI動画モデル「Happy Horse」をAPIDot経由で利用するためのAPIと、その実装例を提供す…
★ 1 MIT 2026-05-25
LLM
GitHub
model-monitor
「模型 API 监控工具」は、OpenAI、DeepSeek、MiMoなど、複数のモデルAPIの利用状況をリアルタイムで監視・管理する…
★ 1 MIT 2026-06-25
ComfyUI
GitHub
ComfyUI-Voice
ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…
★ 1 Apache-2.0 2026-06-18
3D / NeRF
GitHub
sam-3d-spark
sam-3d-sparkは、MetaのSAM 3D(BodyおよびObjects)モデルをNVIDIA DGX Spark環境(aarch64/CUDA 13)でローカル実…
★ 1 NOASSERTION 2026-05-03
3D / NeRF
GitHub
classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
動画生成
GitHub
ComfyUI-AceStep_SFT
ComfyUI-AceStep_SFTは、ComfyUI内でAceStep 1.5 SFTの音楽生成を可能にする単一ノードです。テキストプロンプトから…
★ 1 MIT 2026-07-01
ComfyUI
GitHub
comfy-moneta-bridge
comfy-moneta-bridgeは、Comfy-Cozyの自律型ComfyUIエージェントとMonetaのコグニティブ基盤を連携させ、ComfyUIの生…
★ 1 2026-05-27
ASR / 音声認識
GitHub
resilient-stt
Resilient STTは、OpenAI互換のASR(自動音声認識)エンドポイントと連携し、音声ファイルを高精度にテキスト変換す…
★ 1 ⑂ 1 GPL-3.0 2026-06-25
LLM
GitHub
contextcontrol
ContextControlは、ローカル環境でのコードコンテキスト管理、大規模言語モデル(LLM)の利用、およびパッチワークフ…
★ 1 ⑂ 2 NOASSERTION 2026-05-31
マルチモーダル
GitHub
PrismRAG
PrismRAGは、PDFドキュメント内のテキストだけでなく、図、チャート、テーブルといった視覚情報からも質問に答えるマ…
★ 1 MIT 2026-06-20
音楽生成
GitHub
Conditional-Music-Generation
このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…
★ 1 MIT 2026-05-12
AIエージェント
GitHub
orchestrate-skill
「orchestrate」は、Claude Code向けの脳と身体のオーケストレーションスキルです。Claudeを主要な推論者(脳)とし…
★ 1 MIT 2026-06-13
音声生成 / TTS
GitHub
meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
VoxCore
VoxCoreは、サブ秒の低遅延で動作するオープンソースのリアルタイム音声AIエンジンです。ASR(自動音声認識)、LLM(…
★ 1 ⑂ 1 Apache-2.0 2026-05-28
3D / NeRF
GitHub
gaussian-splat-based-anomaly-detection
本ツールは、UAVで撮影した高層構造物(携帯電話基地局、風力タービン、電柱など)の画像を3D Gaussian Splatting (3…
★ 1 2026-05-17
動画生成
GitHub
awesome-ai-media
JuneYaooo/awesome-ai-mediaは、AIを活用した動画作成、ソーシャルメディア自動化、コンテンツ作成ツールを150以上厳…
★ 1 ⑂ 3 2026-06-23
マルチモーダル
GitHub
zero-shot-video-classifier
このツールは、ビジョン言語基盤モデル(CLIP、SigLIP 2、X-CLIP)を用いたゼロショット動画分類器です。タスク固有…
★ 1 2026-06-09
LLM
GitHub
ChatPDF
このプロジェクトは、Streamlitで構築された軽量かつ強力なRAG(検索拡張生成)ベースのPDFチャットアプリケーション…
★ 1 MIT 2026-05-20
AIエージェント
GitHub
pi-context-pruner
pi-context-prunerは、AIエージェントPiのセッションコンテキストを最適化するためのツールです。冗長なセッションか…
★ 1 2026-06-24
LLM
GitHub
tesm
TESM(Token-Entangled State Machine)は、状態空間モデルと局所的なエンタングルメントメカニズムを組み合わせた革…
★ 1 MIT 2026-06-08
ASR / 音声認識
GitHub
tiktok-extractor
このツールは、TikTokのURLから動画のメタデータ、完全な文字起こし、シーンのキーフレーム、画面上のOCRテキストを…
★ 1 MIT 2026-05-24
ASR / 音声認識
GitHub
VoiceAgentAI
このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識(STT)と音声合成(TTS)をシー…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
vision-bridge
Vision Bridgeは、DeepSeek V4 PROやGPT-4o-textのような純粋なテキストベースのLLMに「視覚能力」を付与するツール…
★ 1 NOASSERTION 2026-06-12
LLM
GitHub
seas
SEASとArgoは、AIの最前線で働くための補完的なシステムです。SEASはフロンティアのシグナルから「何が真実か」を探…
★ 1 NOASSERTION 2026-06-26