3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
動画生成 GitHub Hand2World
「Hand2World」は、自由空間での手のジェスチャーから一人称視点でのインタラクションを自動回帰的に生成する研究プ…
★ 20 2026-06-17
3D / NeRF GitHub NanoGS
「NanoGS: Training-Free Gaussian Splat Simplification」は、ガウシアンスプラットモデルをトレーニングなしで手軽…
★ 20 ⑂ 1 NOASSERTION 2026-04-28
動画生成 GitHub AVGen-Bench
AVGen-Benchは、Text-to-Audio-Video (T2AV) 生成の多段階評価を目的としたタスク駆動型ベンチマークツールです。既…
★ 20 MIT 2026-06-18
マルチモーダル GitHub cognitive-companion
「Cognitive Companion」は、多世代同居家庭の高齢者介護を支援する、プライバシーを最優先したオンプレミスAIシステ…
★ 20 ⑂ 11 AGPL-3.0 2026-06-22
LLM GitHub SynapseKit
SynapseKitは、本番環境向けのLLMアプリケーション開発に特化した、最小限かつ非同期ファーストのPythonフレームワー…
★ 20 ⑂ 21 Apache-2.0 2026-06-23
ASR / 音声認識 GitHub Bumblebee
Bumblebeeは、ユーザーが指定した長いフレーズを、実際の映画やテレビ番組のセリフを繋ぎ合わせて動画クリップとして…
★ 20 MIT 2026-05-02
マルチモーダル GitHub latent-gate
LatentGateは、VL-JEPAに着想を得たパイプラインで、画像や長いテキストなどの複雑な処理をローカルのOllama(無料)…
★ 20 MIT 2026-06-25
LLM GitHub Video_Dariy
Video Diaryは、家庭用監視カメラの録画映像をAIで自動分析し、効率的な管理を可能にするシステムです。NASやディレ…
★ 19 ⑂ 1 Apache-2.0 2026-06-14
動画生成 GitHub arena-ai-leaderboards
このツールは、Arena AI (旧 LMSYS Chatbot Arena) のLLM、Vision、Code、Video、Imageなどの全リーダーボードのスナ…
★ 19 ⑂ 4 MIT 2026-06-23
ASR / 音声認識 GitHub decibri
decibriは、Python、Rust、Node.js、ブラウザ向けに統一されたAPIを提供するクロスプラットフォームのオーディオエン…
★ 19 ⑂ 4 Apache-2.0 2026-06-24
音声生成 / TTS GitHub XyvaClaw
xyvaClawは、自己進化するAIアシスタントプラットフォームであり、OpenClawランタイムを深度強化したものです。ユー…
★ 19 ⑂ 2 MIT 2026-04-14
3D / NeRF GitHub HairPort
HairPortは、画像内の顔に参照ヘアスタイルを転送する最先端の3D認識型フレームワークです。このツールは、大規模な…
★ 19 ⑂ 1 NOASSERTION 2026-06-12
音声生成 / TTS GitHub xiaomiTTS2OpenAITTSAPI
yshtcn/xiaomiTTS2OpenAITTSAPIは、小米MiMo TTS APIをOpenAI互換のTTS APIプロキシサービスに変換するツールです。…
★ 19 ⑂ 1 2026-04-05
音声生成 / TTS GitHub SelenaCore
SelenaCoreは、インターネット接続や月額料金が一切不要な、オフラインファーストのスマートホームハブです。Raspber…
★ 19 ⑂ 1 MIT 2026-04-19
LLM GitHub ChipMATE
ChipMATEは、RTLコード生成のためのマルチエージェント推論フレームワークです。Verilog生成エージェントとPython参…
★ 19 ⑂ 2 NOASSERTION 2026-05-29
ComfyUI GitHub ComfyUI-Pixal3D
ComfyUI-Pixal3Dは、TencentARCが開発したPixal3D(SIGGRAPH 2026)のComfyUIカスタムノードです。単一の画像からPBR…
★ 19 ⑂ 1 NOASSERTION 2026-05-14
ComfyUI GitHub ComfyUI-vslinx-nodes
vslinx/ComfyUI-vslinx-nodesは、ComfyUIのワークフローを効率化・高速化するためのカスタムノード集です。複数画像…
★ 19 ⑂ 3 GPL-3.0 2026-06-23
音声生成 / TTS GitHub Timbre
Timbreは、複数の話者が混在する音声録音(ポッドキャスト、インタビュー、ストリームなど)から、短い参照クリップ…
★ 19 ⑂ 2 Apache-2.0 2026-06-14
動画生成 GitHub ComfyUI-LTXV-TimeGated-LoRA
ComfyUI-LTXV-TimeGated-LoRAは、ComfyUIのLTX 2.3ワークフローで視覚的なLoRAを時間的に制御するためのノードです。…
★ 19 ⑂ 2 MIT 2026-06-12
動画生成 GitHub WorldReasonBench
WorldReasonBenchは、動画生成モデルが物理的、社会的、論理的、情報的に一貫した未来の世界状態を推論できるかを評…
★ 18 2026-05-19
ASR / 音声認識 GitHub breeze-asr-taigi
本ツールは、MediaTekのBreeze-ASR-26モデルを基盤とした台湾語(台語)に特化した音声文字起こしツールです。NVIDIA…
★ 18 NOASSERTION 2026-06-22
LLM GitHub evret
Evretは、推薦システム、RAG (Retrieval Augmented Generation)、検索システムにおけるリトリーバーの評価に特化した…
★ 18 ⑂ 3 MIT 2026-06-18
画像生成 GitHub civitai-mcp-ultimate
「civitai-mcp-ultimate」は、Civitai APIの機能を包括的に提供するMCPサーバーです。本ツールは、モデルの高速かつ…
★ 18 ⑂ 5 MIT 2026-06-14
音声生成 / TTS GitHub docker-kokoro
このツールは、テキスト読み上げ(TTS)サーバー「Kokoro」をDockerコンテナとして手軽にデプロイできるイメージです…
★ 18 ⑂ 3 NOASSERTION 2026-06-21