3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2211 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
youtube-caption-tool
「Verbatim · YouTube逐字稿工具」は、YouTube動画の文字起こしを支援するローカルで動作するウェブツールです。主な…
★ 5 2026-05-10
AIエージェント
GitHub
Deep-Research-104
このプロジェクトは、Web検索と高度な推論モデル(OpenAI o3、DeepSeek-R1、ローカルOllamaモデルなど)を組み合わせ…
★ 5 MIT 2026-06-05
ComfyUI
GitHub
ComfyUI-FileManaty
ComfyUI-FileManatyは、人気の画像生成AIツールComfyUIのWeb UI内に統合された強力なファイルマネージャーです。ユー…
★ 5 MIT 2026-06-15
画像生成
GitHub
codex-studio
Codex Studioは、ローカル環境での画像生成と編集に特化したオープンソースのワークスペースです。認証済みのCodex/C…
★ 5 MIT 2026-06-25
マルチモーダル
GitHub
xhs-notes-skill
xhs-notes-skillは、中国のソーシャルメディア「小紅書(XHS/RedNote)」向けの画像とテキストコンテンツ作成を支援…
★ 5 MIT 2026-06-22
AIエージェント
GitHub
thesis-cli
Thesisは、AIがウォーレン・バフェットとベンジャミン・グレアムのバリュー投資戦略に基づき、公開企業の投資リサー…
★ 5 MIT 2026-05-29
ComfyUI
GitHub
ComfyUI-Drawer
ComfyUI-Drawerは、ComfyUIの複雑なワークフローをモバイルフレンドリーなモジュール式UIプラットフォームに変革しま…
★ 5 ⑂ 2 NOASSERTION 2026-05-16
画像生成
GitHub
bizyair-skill
BizyAir Skillは、AI Agent向けにAIGC(AI生成コンテンツ)機能を提供するスキルパッケージです。BizyAirのクラウド…
★ 5 ⑂ 1 MIT 2026-05-27
LLM
GitHub
synthron
SYNTHRONは、実用的なマルチエージェントAIフレームワークで、毎日3500万以上の無料トークンを提供します。7つのLLM…
★ 5 MIT 2026-05-20
LLM
GitHub
rag-document-chats
このツールは、任意のPDFファイルをアップロードし、その内容についてAIと自然言語でチャットできるRAG(Retrieval A…
★ 5 ⑂ 1 MIT 2026-05-25
音声生成 / TTS
GitHub
arietta-voice
Arietta Voiceは、Apple Silicon Mac向けに設計された、ローカルファーストのカスタマイズ可能なAI音声アシスタント…
★ 5 Apache-2.0 2026-04-28
マルチモーダル
GitHub
multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
3D / NeRF
GitHub
Spatial-Intelligence-Handbook
この「Spatial Intelligence Handbook」は、SLAM、VIO、3D表現、センサー、デプロイメントの課題を、ロボットアーム…
★ 5 NOASSERTION 2026-06-14
AIエージェント
GitHub
fablize-for-hermes
fablize-for-hermesは、fablizeの検証済み手順をHermes Agentエコシステムに適合させたプロジェクトです。検証の根拠…
★ 5 MIT 2026-06-17
ASR / 音声認識
GitHub
wisprflow-sdk
WisprFlow SDKは、Wispr Flowデスクトップクライアントの非公式Python SDKです。Wispr Flowの音声APIをリバースエン…
★ 5 ⑂ 1 MIT 2026-06-09
音声生成 / TTS
GitHub
openvoice-cloning
OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…
★ 5 MIT 2026-06-13
マルチモーダル
GitHub
Auto_Translator
Auto-Translatorは、複数のエージェントを活用したPDFコンテンツの自動翻訳ツールです。原文のフォーマットを完璧に…
★ 5 ⑂ 1 2026-04-16
ASR / 音声認識
GitHub
Auto-Vod-Trimmer
VOD Auto Trimmerは、長時間のVODを手動で編集する手間を省くためのマルチスレッドPythonツールです。ローカルAI(Wh…
★ 5 ⑂ 1 GPL-3.0 2026-06-06
LLM
GitHub
OpenMetaMate
MetaMateは、LLM(大規模言語モデル)を活用し、PDFからのデータ抽出を効率化するAIアシストツールです。系統的レビ…
★ 5 NOASSERTION 2026-06-20
LLM
GitHub
Customer-Support-Chatbot-102
このツールは、RAG(Retrieval-Augmented Generation)、高度なプロンプトエンジニアリング、ハイブリッド検索、リラ…
★ 5 MIT 2026-06-04
ASR / 音声認識
GitHub
Mynah
Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…
★ 5 NOASSERTION 2026-06-11
AIエージェント
GitHub
AeroGraph
AeroGraphは、AIエージェントのワークフローに特化したオープンソースの視覚的デバッガー兼フライトレコーダーです。…
★ 5 ⑂ 2 Apache-2.0 2026-06-21
音声生成 / TTS
GitHub
nano-codec
nano-codecは、最小限のニューラルオーディオコーデックであり、16kHzモノラルの音声を128倍に圧縮し、10.2kbpsの低…
★ 5 2026-03-31
ASR / 音声認識
GitHub
whisper-install
hwdsl2/whisper-installは、Whisperの音声認識・翻訳APIサーバーをUbuntu, Debian, AlmaLinux, Rocky Linux, CentOS,…
★ 5 NOASSERTION 2026-06-22