3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub Live-Church-Captions
Church Capは、教会向けに開発されたオープンソースかつローカルファーストのリアルタイムキャプションアプリです。…
★ 6 MIT 2026-06-23
3D / NeRF GitHub SLAM-X
SLAM-Xは、NeRF-SLAMおよびGaussian Splatting SLAMシステムの動的なシーンにおけるロバスト性を向上させるためのプ…
★ 6 ⑂ 1 GPL-3.0 2025-12-09
マルチモーダル GitHub egobabyvlm
本リポジトリは、EgoBabyVLMチャレンジのインフラを提供します。これは、乳幼児の一人称視点ビデオデータ(BabyView …
★ 6 NOASSERTION 2026-06-23
ComfyUI GitHub MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 6 ⑂ 3 MIT 2026-06-04
動画生成 GitHub Agnes-AI-Platform
Agnes AI Platformは、Agnes AIのAPI(Agnes Image 2.1 FlashおよびAgnes Video V2.0)を利用した画像・動画生成のた…
★ 6 NOASSERTION 2026-06-25
ComfyUI GitHub ComfyUI-Wildcard-Pipeline
ComfyUIのためのモジュール式プロシージャルプロンプト生成ツールです。ワイルドカード、固定値、結合、派生、制約を…
★ 6 ⑂ 2 GPL-3.0 2026-06-22
音声生成 / TTS GitHub hermes-embodiment
hermes-embodimentは、Hermesエージェントに物理的な具現化レイヤーを提供するツールです。エージェントの「思考中」…
★ 6 MIT 2026-05-31
ComfyUI GitHub TrendCut-Studio
TrendCut Studioは、短編動画運用向けのローカル自動化ワークベンチです。ホットスポット発見、素材分析、スクリプト…
★ 6 ⑂ 2 MIT 2026-06-05
3D / NeRF GitHub LandmarkDiff-public
LandmarkDiffは、単一の顔写真から美容整形手術後の予測画像を生成する革新的なツールです。解剖学的に条件付けされ…
★ 6 ⑂ 11 MIT 2026-05-01
音声生成 / TTS GitHub uttera-tts-hotcold
uttera-tts-hotcoldは、ハイブリッドな「Hot/Cold」ワーカーアーキテクチャとプラグ可能なバックエンド(Coqui XTTS-…
★ 6 ⑂ 2 Apache-2.0 2026-05-15
画像生成 GitHub lora-block-weight-neo
このツールは、Stable Diffusion WebUI Forge - Neo向けの拡張機能であり、LoRAのブロックレベルでの重み付けを詳細…
★ 6 MIT 2026-05-22
画像生成 GitHub codex-gpt-image-2-subscription
このツールは、ChatGPT/Codexのサブスクリプションを利用し、APIキーや従量課金なしでgpt-image-2モデルによる画像生…
★ 6 ⑂ 2 MIT 2026-06-07
ComfyUI GitHub comfyui-ai-studio
ComfyUI AI Studioは、AI画像、動画、音楽生成のためのワークフロー駆動型クリエイティブスタジオです。ComfyUIの強…
★ 6 ⑂ 1 MIT 2026-05-03
マルチモーダル GitHub wgram-lm
W-GRAM-LMは、世界誘導型再帰的アトラクタ言語モデルの研究用コードベースです。潜在世界予測、多軌道推論、解答アト…
★ 6 AGPL-3.0 2026-06-21
AIエージェント GitHub Hive
Hiveは、自律的に協調し、コードを記述し、ツールを使用する永続的なAIエージェントを生成するためのローカルファー…
★ 6 MIT 2026-06-11
3D / NeRF GitHub mutual-info-optimization
このリポジトリは、実際の画像とテクスチャ付き3Dメッシュ間の相互情報量(Mutual Information)を利用して、6自由度…
★ 6 2026-03-20
マルチモーダル GitHub Multimodal-Edge-Node
Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…
★ 6 Apache-2.0 2026-05-01
ComfyUI GitHub ComfyUI-MCP-Server-Python
ComfyUI-MCP-Serverは、ComfyUIのワークフローをAIエージェントが利用可能なパラメータ設定可能なツールに変換するMC…
★ 6 MIT 2026-03-13
音声生成 / TTS GitHub Awesome-Audio-Generation
この「Awesome-Audio-Generation」リポジトリは、音声生成に関する最新の研究論文、コード、およびプロジェクトを厳…
★ 6 ⑂ 1 2025-10-11
動画生成 GitHub ai-film-skills
AI Film Studioは、Claude Code向けに設計されたエンドツーエンドのAI映画制作エージェントスキルです。ストーリーボ…
★ 6 ⑂ 1 MIT 2026-05-05
音声生成 / TTS GitHub NeuTTS-Studio
NeuTTS Studioは、オンデバイスでのテキスト読み上げ(TTS)、音声クローニング、リアルタイムストリーミング機能を…
★ 6 NOASSERTION 2026-03-31
音声生成 / TTS GitHub mlx-indextts
MLX-IndexTTSは、Apple Silicon向けに最適化された高品質なテキスト読み上げ(TTS)ツールで、IndexTTS 1.5および2.0…
★ 6 ⑂ 1 MIT 2026-04-15
画像生成 GitHub kimodo-houdini-bridge
このツールは、NVIDIA Kimodo(テキスト駆動の3D人体モーション生成AIモデル)をSideFX Houdiniに連携させるブリッジ…
★ 6 ⑂ 1 2026-06-10
音声生成 / TTS GitHub BridgeSpeak
BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…
★ 6 ⑂ 2 MIT 2026-05-10