3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2211 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub youtube-caption-tool
「Verbatim · YouTube逐字稿工具」は、YouTube動画の文字起こしを支援するローカルで動作するウェブツールです。主な…
★ 5 2026-05-10
AIエージェント GitHub Deep-Research-104
このプロジェクトは、Web検索と高度な推論モデル(OpenAI o3、DeepSeek-R1、ローカルOllamaモデルなど)を組み合わせ…
★ 5 MIT 2026-06-05
ComfyUI GitHub ComfyUI-FileManaty
ComfyUI-FileManatyは、人気の画像生成AIツールComfyUIのWeb UI内に統合された強力なファイルマネージャーです。ユー…
★ 5 MIT 2026-06-15
画像生成 GitHub codex-studio
Codex Studioは、ローカル環境での画像生成と編集に特化したオープンソースのワークスペースです。認証済みのCodex/C…
★ 5 MIT 2026-06-25
マルチモーダル GitHub xhs-notes-skill
xhs-notes-skillは、中国のソーシャルメディア「小紅書(XHS/RedNote)」向けの画像とテキストコンテンツ作成を支援…
★ 5 MIT 2026-06-22
AIエージェント GitHub thesis-cli
Thesisは、AIがウォーレン・バフェットとベンジャミン・グレアムのバリュー投資戦略に基づき、公開企業の投資リサー…
★ 5 MIT 2026-05-29
ComfyUI GitHub ComfyUI-Drawer
ComfyUI-Drawerは、ComfyUIの複雑なワークフローをモバイルフレンドリーなモジュール式UIプラットフォームに変革しま…
★ 5 ⑂ 2 NOASSERTION 2026-05-16
画像生成 GitHub bizyair-skill
BizyAir Skillは、AI Agent向けにAIGC(AI生成コンテンツ)機能を提供するスキルパッケージです。BizyAirのクラウド…
★ 5 ⑂ 1 MIT 2026-05-27
LLM GitHub synthron
SYNTHRONは、実用的なマルチエージェントAIフレームワークで、毎日3500万以上の無料トークンを提供します。7つのLLM…
★ 5 MIT 2026-05-20
LLM GitHub rag-document-chats
このツールは、任意のPDFファイルをアップロードし、その内容についてAIと自然言語でチャットできるRAG(Retrieval A…
★ 5 ⑂ 1 MIT 2026-05-25
音声生成 / TTS GitHub arietta-voice
Arietta Voiceは、Apple Silicon Mac向けに設計された、ローカルファーストのカスタマイズ可能なAI音声アシスタント…
★ 5 Apache-2.0 2026-04-28
マルチモーダル GitHub multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
3D / NeRF GitHub Spatial-Intelligence-Handbook
この「Spatial Intelligence Handbook」は、SLAM、VIO、3D表現、センサー、デプロイメントの課題を、ロボットアーム…
★ 5 NOASSERTION 2026-06-14
AIエージェント GitHub fablize-for-hermes
fablize-for-hermesは、fablizeの検証済み手順をHermes Agentエコシステムに適合させたプロジェクトです。検証の根拠…
★ 5 MIT 2026-06-17
ASR / 音声認識 GitHub wisprflow-sdk
WisprFlow SDKは、Wispr Flowデスクトップクライアントの非公式Python SDKです。Wispr Flowの音声APIをリバースエン…
★ 5 ⑂ 1 MIT 2026-06-09
音声生成 / TTS GitHub openvoice-cloning
OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…
★ 5 MIT 2026-06-13
マルチモーダル GitHub Auto_Translator
Auto-Translatorは、複数のエージェントを活用したPDFコンテンツの自動翻訳ツールです。原文のフォーマットを完璧に…
★ 5 ⑂ 1 2026-04-16
ASR / 音声認識 GitHub Auto-Vod-Trimmer
VOD Auto Trimmerは、長時間のVODを手動で編集する手間を省くためのマルチスレッドPythonツールです。ローカルAI(Wh…
★ 5 ⑂ 1 GPL-3.0 2026-06-06
LLM GitHub OpenMetaMate
MetaMateは、LLM(大規模言語モデル)を活用し、PDFからのデータ抽出を効率化するAIアシストツールです。系統的レビ…
★ 5 NOASSERTION 2026-06-20
LLM GitHub Customer-Support-Chatbot-102
このツールは、RAG(Retrieval-Augmented Generation)、高度なプロンプトエンジニアリング、ハイブリッド検索、リラ…
★ 5 MIT 2026-06-04
ASR / 音声認識 GitHub Mynah
Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…
★ 5 NOASSERTION 2026-06-11
AIエージェント GitHub AeroGraph
AeroGraphは、AIエージェントのワークフローに特化したオープンソースの視覚的デバッガー兼フライトレコーダーです。…
★ 5 ⑂ 2 Apache-2.0 2026-06-21
音声生成 / TTS GitHub nano-codec
nano-codecは、最小限のニューラルオーディオコーデックであり、16kHzモノラルの音声を128倍に圧縮し、10.2kbpsの低…
★ 5 2026-03-31
ASR / 音声認識 GitHub whisper-install
hwdsl2/whisper-installは、Whisperの音声認識・翻訳APIサーバーをUbuntu, Debian, AlmaLinux, Rocky Linux, CentOS,…
★ 5 NOASSERTION 2026-06-22