3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
egobabyvlm
本リポジトリは、EgoBabyVLMチャレンジのインフラを提供します。これは、乳幼児の一人称視点ビデオデータ(BabyView …
★ 6 NOASSERTION 2026-06-23
動画生成
GitHub
Agnes-AI-Platform
Agnes AI Platformは、Agnes AIのAPI(Agnes Image 2.1 FlashおよびAgnes Video V2.0)を利用した画像・動画生成のた…
★ 6 NOASSERTION 2026-06-25
マルチモーダル
GitHub
CodeBind
CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…
★ 6 ⑂ 1 MIT 2026-05-19
ComfyUI
GitHub
MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 6 ⑂ 3 MIT 2026-06-04
動画生成
GitHub
seedance-superprompt
Seedance 2.0 Superpromptは、ByteDance Seedance 2.0の動画生成プロンプト作成を支援するポータブルなプロンプトス…
★ 6 ⑂ 2 MIT 2026-05-23
音声生成 / TTS
GitHub
ScriptSmith-Engine
ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…
★ 6 ⑂ 1 MIT 2026-06-23
画像生成
GitHub
CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01
音声生成 / TTS
GitHub
ghost-narrator
Ghost Narratorは、ブログや静的サイト向けに自己ホスト型のAI音声ナレーションを提供するツールです。ElevenLabsの…
★ 6 ⑂ 1 MIT 2026-06-15
AIエージェント
GitHub
Local-Model
このツールは、Kali Linux上でQwen 2.5-7Bモデル(LM Studio経由)を活用する、完全にローカルで自律的なサイバーセ…
★ 6 ⑂ 2 MIT 2026-06-17
AIエージェント
GitHub
Hive
Hiveは、自律的に協調し、コードを記述し、ツールを使用する永続的なAIエージェントを生成するためのローカルファー…
★ 6 MIT 2026-06-11
音声生成 / TTS
GitHub
the-muser
The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…
★ 6 ⑂ 1 MIT 2026-05-27
マルチモーダル
GitHub
wgram-lm
W-GRAM-LMは、世界誘導型再帰的アトラクタ言語モデルの研究用コードベースです。潜在世界予測、多軌道推論、解答アト…
★ 6 AGPL-3.0 2026-06-21
動画生成
GitHub
ai-film-skills
AI Film Studioは、Claude Code向けに設計されたエンドツーエンドのAI映画制作エージェントスキルです。ストーリーボ…
★ 6 ⑂ 1 MIT 2026-05-05
ASR / 音声認識
GitHub
Clippos
Clipposは、長い動画からキャプション付きのバイラル向けソーシャルクリップを生成するAIエージェントスキルです。He…
★ 6 ⑂ 1 MIT 2026-04-26
マルチモーダル
GitHub
Multimodal-Edge-Node
Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…
★ 6 Apache-2.0 2026-05-01
3D / NeRF
GitHub
StoryCore-Engine
StoryCore Engineは、スクリプトから一貫性のある画像、動画、ストーリー、対話、空間オーディオを生成する、ローカ…
★ 6 ⑂ 1 MIT 2026-06-23
ASR / 音声認識
GitHub
ai_interview
このツールは、リアルタイム音声対話、多段階面接、ライブ採点、詳細レポート生成機能を備えたAI駆動型模擬面接プラ…
★ 6 2026-06-15
ComfyUI
GitHub
TrendCut-Studio
TrendCut Studioは、短編動画運用向けのローカル自動化ワークベンチです。ホットスポット発見、素材分析、スクリプト…
★ 6 ⑂ 2 MIT 2026-06-05
音声生成 / TTS
GitHub
mlx-indextts
MLX-IndexTTSは、Apple Silicon向けに最適化された高品質なテキスト読み上げ(TTS)ツールで、IndexTTS 1.5および2.0…
★ 6 ⑂ 1 MIT 2026-04-15
LLM
GitHub
agent-engineering-roadmap
このリポジトリは、プロンプトやRAGの段階を超え、本番環境で利用可能なAIエージェントの構築を目指す開発者向けの、…
★ 6 ⑂ 1 MIT 2026-06-26
画像生成
GitHub
FlowSR
FlowSRは、ICCV 2025で発表された、Consistency Rectified Flowを活用した高速画像超解像ツールです。低解像度画像か…
★ 5 NOASSERTION 2026-06-01
LLM
GitHub
3GPP-Everything
「3GPP-Everything」は、Rel-18/19を含む全ての3GPP 5G仕様書(1270篇、約39万段落)を網羅する生産級RAG(検索拡張…
★ 5 AGPL-3.0 2026-06-05
ASR / 音声認識
GitHub
PARSE
PARSEは、記述言語学のフィールドワークと、それに続く比較分析を支援するブラウザベースのワークステーションです。…
★ 5 MIT 2026-06-27
LLM
GitHub
mini-rag
miniRは、AIエージェント向けの軽量でセルフホスト型のRAG(検索拡張生成)検索バックエンドです。Markdown、Word、P…
★ 5 ⑂ 1 MIT 2026-06-02