3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

LLM
GitHub
Gemini-chatbot
このGemini Chatbotは、StreamlitとFastAPI、Google Gemini APIを使用して構築されたフルスタックのAIチャットボット…
★ 2 2026-06-16
マルチモーダル
GitHub
multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 2 MIT 2026-05-13
ASR / 音声認識
GitHub
macOS-dictate
macOS向けのプライバシーを重視した自己ホスト型音声入力ツールです。ホットキーを押しながら話すことで、音声をテキ…
★ 2 MIT 2026-06-25
画像生成
GitHub
mythforgemtg
Myth Forgeは、単一のテーマプロンプトから、AIが生成したカスタムカードアートとプロキシフレームを用いて、テーマ…
★ 2 ⑂ 1 2026-06-18
音声生成 / TTS
GitHub
VoxKitchen
VoxKitchenは、生の音声録音をクリーンで検査可能なトレーニングデータセットに変換するための、宣言型音声データ処…
★ 2 Apache-2.0 2026-06-18
画像生成
GitHub
DiffAudit-Research
DiffAudit Researchは、拡散モデルにおけるプライバシーリスクを監査するための再現可能な研究用スキャフォールディ…
★ 2 ⑂ 1 Apache-2.0 2026-06-22
ComfyUI
GitHub
comfyui-cinema-pipeline
このリポジトリは、プロの映画制作に特化したAI/ジェネレーティブパイプラインアーキテクチャ「ComfyUI Cinema Pipel…
★ 2 NOASSERTION 2026-06-15
マルチモーダル
GitHub
meeting-agent
このツールは、会議の録画(動画・音声)、文書(PDF、PPTX、DOCX、XLSX、CSV、TXT)、画像を取り込み、書き起こし、…
★ 2 MIT 2026-06-14
LLM
GitHub
llm-text-organization-rag-system
本ツールは、LLMとRAG技術を駆使した高度なテキスト整理および情報検索システムです。PDFやテキスト文書のアップロー…
★ 2 ⑂ 1 2026-05-19
LLM
GitHub
Text-to-SQL-Queries-Generator
このツールは、自然言語の質問をSQLクエリに変換し、データベースと対話することを可能にする「Text-to-SQL Generato…
★ 2 MIT 2026-06-24
マルチモーダル
GitHub
Viz2Speech
Viz2Speechは、インドネシアの視覚障害者のアクセシビリティを向上させるために開発された、画像から音声への変換エ…
★ 2 ⑂ 1 MIT 2026-05-16
LLM
GitHub
opencrab
opencrabは、タスクをこなすだけでなく、自己の目標を持ち自己進化を追求する「自律生命体」です。他のエージェント…
★ 2 MIT 2026-06-07
ComfyUI
GitHub
comfyui-gallery-loader
comfyui-gallery-loaderは、ComfyUIの画像およびパスウィジェット向けに設計された、タッチフレンドリーなギャラリー…
★ 2 ⑂ 1 MIT 2026-06-24
マルチモーダル
GitHub
rag-multimodal
このプロジェクトは、複雑な表や図を含むPDF文書から情報を抽出するマルチモーダルRAGシステムの実装デモです。マル…
★ 2 MIT 2026-06-21
LLM
GitHub
doc_assistant
Document Assistantは、PDFやEPUBなどの個人文書ライブラリを対象としたローカルファーストのRAG(検索拡張生成)ア…
★ 2 MIT 2026-06-25
ComfyUI
GitHub
Agnes
Agnesは、テキストからビデオを生成する2段階のAIパイプラインを提供するツールです。最大の特徴は、画像生成UIであ…
★ 2 MIT 2026-06-06
LLM
GitHub
schoolwork-rag
schoolwork-ragは、PDFや講義ノートなどのローカルな学習資料を、検索可能な知識ベースに変えるプライバシー重視のRA…
★ 2 MIT 2026-05-25
画像生成
GitHub
dify-plugin-muapi
このツールは、MuAPIをDifyに統合するカスタムプラグインです。Difyのワークフロー、チャットフロー、エージェントか…
★ 2 ⑂ 1 2026-06-15
ASR / 音声認識
GitHub
TermSub
TermSubは、AIを活用して動画コンテンツの文字起こし、翻訳、専門用語管理を行うFastAPIアプリケーションです。マル…
★ 2 MIT 2026-06-23
画像生成
GitHub
Vortelio-python_libraries
Vortelio Python SDKは、ローカル環境でLLM、画像、音声、動画、3Dモデルの生成を可能にするVortelioの公式Pythonク…
★ 2 NOASSERTION 2026-06-12
LLM
GitHub
dsrp-machine-learning-engineering-20261
このリポジトリは、機械学習とAIエンジニアリングを学ぶためのコース教材です。Jupyter Notebook形式で、教師あり学…
★ 2 ⑂ 3 2026-05-28
ASR / 音声認識
GitHub
echopilot
EchoPilotは、macOS向けの会議記録および文字起こしアプリケーションです。システムオーディオとマイクオーディオを…
★ 2 Apache-2.0 2026-06-09
ComfyUI
GitHub
ComfyUI-HiCache
ComfyUI-HiCacheは、ComfyUIでHunyuan3Dの形状生成を加速するための、トレーニング不要なノードです。flow-matching…
★ 2 ⑂ 1 MIT 2026-06-11
画像生成
GitHub
chatwalaau
ChatWalaʻauは、完全にローカルで動作するフルスタックAIエージェントランタイムです。最新のチャットUIをAG-UIプロ…
★ 2 Apache-2.0 2026-06-27