3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
visualdocqa-kit
VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…
★ 2 MIT 2026-06-22
LLM
GitHub
builder-ai
builder-aiは、AIアシスタントがLLM(大規模言語モデル)を活用した機能を開発する際、プロダクション環境の厳格な品…
★ 2 ⑂ 2 MIT 2026-06-23
マルチモーダル
GitHub
multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 2 MIT 2026-05-13
ASR / 音声認識
GitHub
slidoc
slidocは、講義ビデオを各スライドとそのクリーンアップされたナレーションが対になったマークダウン形式に変換する…
★ 2 ⑂ 1 MIT 2026-05-15
AIエージェント
GitHub
opus-magnum
Opus Magnum Claude Codeは、長期にわたる複雑なAIコーディングプロジェクトを、コンテキストの損失やエージェントの…
★ 2 MIT 2026-06-11
3D / NeRF
GitHub
prml-vslam
このリポジトリは、スマートフォンからの未校正単眼ビデオストリームに対応したオフデバイスVSLAMベンチマークフレー…
★ 2 MIT 2026-06-26
マルチモーダル
GitHub
aiyeah
AIyeahは、AIアプリケーション開発を簡素化するモジュール型AIプラットフォームです。複数のAIツールやプロバイダー…
★ 2 MIT 2026-05-26
画像生成
GitHub
sdxl_container
SDXL Containerは、SDXL (Stable Diffusion XL) のLoRAアダプターの訓練と推論を実行するためのDockerコンテナです。…
★ 2 Apache-2.0 2026-05-27
3D / NeRF
GitHub
2D-to-Mesh
このツールは、単一の2D RGB画像からテクスチャ付き3Dメッシュを生成するPythonパイプラインです。AppleのDepthProモ…
★ 2 2026-05-31
その他
GitHub
Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
LLM
GitHub
ShopSphere-AI
ShopSphere AIは、Google Gemini 2.5 Flashを搭載したマルチエージェントEコマースアシスタントです。ユーザーからの…
★ 2 NOASSERTION 2026-06-14
マルチモーダル
GitHub
kmetbench-release
K-MetBenchは、気象学における専門家の推論、地域性、マルチモダリティを詳細に評価するための多次元ベンチマークで…
★ 2 MIT 2026-05-24
LLM
GitHub
voice-rag-agent
VoiceRAG Agentは、FastAPIを基盤としたローカル優先の音声対音声RAGアシスタントです。ユーザーは自身のドキュメン…
★ 2 MIT 2026-06-01
音声生成 / TTS
GitHub
vespera
Vesperaは、ユーザーのMacまたはLinuxマシン上で動作するプライベートな自己ホスト型AIアシスタントです。会話内容を…
★ 2 MIT 2026-06-24
LLM
GitHub
tiny-rag-lab
tiny-rag-labは、リトリーバル・オーグメンテッド・ジェネレーション(RAG)の仕組みをエンドツーエンドで学ぶための…
★ 2 2026-06-25
マルチモーダル
GitHub
MagikaDocumentFromPixel
このツールは、Magikaに触発された軽量な画像品質ゲートで、画像を「シャープ」、「ぼやけ」、「不確実」のいずれか…
★ 2 MIT 2026-04-27
画像生成
GitHub
Awesome-World-Models
本リポジトリは、動画、3D、ロボティクス、自動運転など多岐にわたる生成型世界モデルの研究論文と関連リソースを集…
★ 2 2026-06-23
音楽生成
GitHub
strands-strudel
strands-strudelは、AIを活用したライブコーディング音楽ツールで、Strands Agentsのエコシステム内で動作します。リ…
★ 2 2026-04-22
LLM
GitHub
OpenArch
このGitHubリポジトリ「OpenArch」は、Sebastian RaschkaのLLM Architecture Galleryに基づき、現代のオープンソース…
★ 2 ⑂ 1 MIT 2026-06-19
画像生成
GitHub
ComfyUI-AliAn-Ideogram-Magic-Prompt
このツールは、ComfyUIのカスタムノードとして機能し、Ideogramのホスト型Magic Prompt APIを利用して、一般的なテキ…
★ 2 MIT 2026-06-04
マルチモーダル
GitHub
roboclaw-reports
MechMind Chronicleは、AIロボット実験の不透明性を解消し、リッチでレビュー可能なHTMLレポートを生成するオープン…
★ 2 2026-06-26
画像生成
GitHub
chatwalaau
ChatWalaʻauは、完全にローカルで動作するフルスタックAIエージェントランタイムです。最新のチャットUIをAG-UIプロ…
★ 2 Apache-2.0 2026-06-27
ASR / 音声認識
GitHub
shizi
「拾字 · Voicetype Studio」は、動画をテキストに変換し、ローカルでダウンロード・処理を行うmacOS向けのツールで…
★ 2 AGPL-3.0 2026-05-22
動画生成
GitHub
gemini-omni-flash
「Gemini Omni Video Generator」は、Googleの次世代LLM技術を搭載したGemini Omni、Gemini Omni Flash、およびVeo動…
★ 2 2026-05-20