3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub humanness-index
VapiAIが開発・運用する「Humanness Index™」は、音声AIがどれだけ人間らしく聞こえるかを測定するオープンなベンチ…
★ 21 ⑂ 4 Apache-2.0 2026-06-17
3D / NeRF GitHub gaussian-splatting-studio
「3DGS Studio」は、ブラウザ上で動作する軽量な3D Gaussian Splatting(3DGS)作業環境です。ローカルの3DGSモデル…
★ 21 ⑂ 1 MIT 2026-04-26
音楽生成 GitHub Steerable-music-transformer
このプロジェクトは、論文「Steerable Rhythmic Complexity in Autoregressive Music Generation」の公式PyTorch実装…
★ 21 ⑂ 5 MIT 2026-05-27
音楽生成 GitHub SunoMCP
SunoMCPは、AceDataCloud APIを介してSuno AIの音楽生成機能を提供するModel Context Protocol (MCP) サーバーです。…
★ 21 ⑂ 3 MIT 2026-06-21
マルチモーダル GitHub cognitive-companion
「Cognitive Companion」は、多世代同居家庭の高齢者介護を支援する、プライバシーを最優先したオンプレミスAIシステ…
★ 20 ⑂ 11 AGPL-3.0 2026-06-22
LLM GitHub riskkernel
RiskKernelは、AIエージェントの運用を確実にするためのリスクエンジンです。AIエージェントの暴走を防ぐために、コ…
★ 20 ⑂ 5 Apache-2.0 2026-06-20
動画生成 GitHub Hand2World
「Hand2World」は、自由空間での手のジェスチャーから一人称視点でのインタラクションを自動回帰的に生成する研究プ…
★ 20 2026-06-17
動画生成 GitHub AVGen-Bench
AVGen-Benchは、Text-to-Audio-Video (T2AV) 生成の多段階評価を目的としたタスク駆動型ベンチマークツールです。既…
★ 20 MIT 2026-06-18
マルチモーダル GitHub latent-gate
LatentGateは、VL-JEPAに着想を得たパイプラインで、画像や長いテキストなどの複雑な処理をローカルのOllama(無料)…
★ 20 MIT 2026-06-25
ComfyUI GitHub ComfyUI-ControlOrder-FreeMemory
ComfyUI-ControlOrder-FreeMemoryは、ComfyUIのカスタムノードで、ノードの実行順序を柔軟に制御し、ワークフローの…
★ 20 ⑂ 1 MIT 2026-04-15
ASR / 音声認識 GitHub Bumblebee
Bumblebeeは、ユーザーが指定した長いフレーズを、実際の映画やテレビ番組のセリフを繋ぎ合わせて動画クリップとして…
★ 20 MIT 2026-05-02
3D / NeRF GitHub NanoGS
「NanoGS: Training-Free Gaussian Splat Simplification」は、ガウシアンスプラットモデルをトレーニングなしで手軽…
★ 20 ⑂ 1 NOASSERTION 2026-04-28
LLM GitHub SynapseKit
SynapseKitは、本番環境向けのLLMアプリケーション開発に特化した、最小限かつ非同期ファーストのPythonフレームワー…
★ 20 ⑂ 21 Apache-2.0 2026-06-23
ASR / 音声認識 GitHub decibri
decibriは、Python、Rust、Node.js、ブラウザ向けに統一されたAPIを提供するクロスプラットフォームのオーディオエン…
★ 19 ⑂ 4 Apache-2.0 2026-06-24
LLM GitHub ChipMATE
ChipMATEは、RTLコード生成のためのマルチエージェント推論フレームワークです。Verilog生成エージェントとPython参…
★ 19 ⑂ 2 NOASSERTION 2026-05-29
動画生成 GitHub arena-ai-leaderboards
このツールは、Arena AI (旧 LMSYS Chatbot Arena) のLLM、Vision、Code、Video、Imageなどの全リーダーボードのスナ…
★ 19 ⑂ 4 MIT 2026-06-23
3D / NeRF GitHub SGAD-SLAM
このプロジェクトは、RGBD SLAMにおけるラディアンスフィールドの品質向上を目指す「SGAD-SLAM」という手法を提案し…
★ 19 ⑂ 1 MIT 2026-03-24
ComfyUI GitHub ComfyUI-vslinx-nodes
vslinx/ComfyUI-vslinx-nodesは、ComfyUIのワークフローを効率化・高速化するためのカスタムノード集です。複数画像…
★ 19 ⑂ 3 GPL-3.0 2026-06-23
LLM GitHub Video_Dariy
Video Diaryは、家庭用監視カメラの録画映像をAIで自動分析し、効率的な管理を可能にするシステムです。NASやディレ…
★ 19 ⑂ 1 Apache-2.0 2026-06-14
音声生成 / TTS GitHub XyvaClaw
xyvaClawは、自己進化するAIアシスタントプラットフォームであり、OpenClawランタイムを深度強化したものです。ユー…
★ 19 ⑂ 2 MIT 2026-04-14
音声生成 / TTS GitHub SelenaCore
SelenaCoreは、インターネット接続や月額料金が一切不要な、オフラインファーストのスマートホームハブです。Raspber…
★ 19 ⑂ 1 MIT 2026-04-19
ComfyUI GitHub ComfyUI-Pixal3D
ComfyUI-Pixal3Dは、TencentARCが開発したPixal3D(SIGGRAPH 2026)のComfyUIカスタムノードです。単一の画像からPBR…
★ 19 ⑂ 1 NOASSERTION 2026-05-14
音声生成 / TTS GitHub xiaomiTTS2OpenAITTSAPI
yshtcn/xiaomiTTS2OpenAITTSAPIは、小米MiMo TTS APIをOpenAI互換のTTS APIプロキシサービスに変換するツールです。…
★ 19 ⑂ 1 2026-04-05
音声生成 / TTS GitHub Timbre
Timbreは、複数の話者が混在する音声録音(ポッドキャスト、インタビュー、ストリームなど)から、短い参照クリップ…
★ 19 ⑂ 2 Apache-2.0 2026-06-14