3,636 repos GH 3,521 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2216 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
scenelens
Scenelensは、Claudeにスマートな動画入力機能を提供するツールです。動画からシーン変化に基づいて最適なフレームを…
★ 3 MIT 2026-05-04
音声生成 / TTS
GitHub
SpeechifyPDF
SpeechifyPDFは、PDFドキュメントを自然で高品質な音声に変換し、読み上げてくれるアプリケーションです。通勤中やマ…
★ 3 MIT 2026-06-05
マルチモーダル
GitHub
blink-skill
Blink Skillは、PC上でのユーザーのアクティビティ(会議、ドキュメント作業、動画視聴、コーディングなど)をAIが能…
★ 3 MIT 2026-05-02
ComfyUI
GitHub
comfyui-mcp-panel
「ComfyUI MCP Panel」は、ComfyUIのサイドバーにClaude Codeセッションを統合し、AIエージェントがComfyUIのグラフ…
★ 3 ⑂ 2 MIT 2026-06-27
音楽生成
GitHub
music-agent
music-agentは、ターミナル中心のワークフローのために設計されたオープンソースのAI音楽エージェントです。Hermesや…
★ 3 MIT 2026-04-16
音声生成 / TTS
GitHub
auto-audiobook
「Auto-Audiobook」は、EPUB、MOBI、PDF形式の電子書籍を、構造化されたMP3オーディオブックに自動変換するエンジン…
★ 3 MIT 2026-06-27
AIエージェント
GitHub
ai-agent-stack
このGitHubリポジトリは、AIエージェント、オーケストレーション、およびLLM開発ツールに関する優れたオープンソース…
★ 3 MIT 2026-06-16
動画生成
GitHub
volcengine-hermes-plugin
このプラグインは、Hermes Agentに火山引擎(Volcengine)のDoubao LLM(大規模言語モデル)、Doubao Seedream(画像…
★ 3 2026-05-25
LLM
GitHub
openmodels
OpenModels Registryは、大規模言語モデル(LLM)とその推論プロバイダー、および両者のマッピングに関する情報を集…
★ 3 ⑂ 1 2026-06-19
音声生成 / TTS
GitHub
crashout-buddy
Crashout Buddyは、Vision AgentsとStream Video上に構築された、リアルタイムで感情認識を行う音声AIエージェントの…
★ 3 MIT 2026-05-15
マルチモーダル
GitHub
opencode-vision
opencode-visionは、マルチモーダルに対応していないOpenCodeモデルに画像認識機能を追加するツールです。ユーザーが…
★ 3 MIT 2026-06-24
LLM
GitHub
llm-observability-platform
この「LLM Observability Platform: Core Python Infrastructure」は、LLMアプリケーション向けに設計された高性能な…
★ 3 ⑂ 1 Apache-2.0 2026-06-23
画像生成
GitHub
cover-xiaohongshu
「cover-xiaohongshu」は、小紅書(Xiaohongshu)のカバー画像を生成およびレイアウトを分析するためのCodex/Claude …
★ 3 MIT 2026-05-28
動画生成
GitHub
imagine-mcp
「imagine-mcp」は、Google Gemini、OpenAI、Grokといった主要なAIモデルを横断し、画像や動画の理解および生成を可…
★ 3 MIT 2026-06-24
ASR / 音声認識
GitHub
hexy
HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…
★ 3 ⑂ 1 2026-05-10
ASR / 音声認識
GitHub
astrbot_plugin_volcengine_asr
本ツールは、AstrBot向けの火山引擎豆包语音ASRプラグインです。QQおよびNapCatからの音声メッセージをテキストに変…
★ 3 2026-05-13
マルチモーダル
GitHub
tri-ai
Tri-AIは、Claude、Codex、Kimiなどの複数のAIモデルを連携させるためのポータブルなディスパッチプロトコルです。Cl…
★ 3 2026-04-14
LLM
GitHub
GEORank
GEOrankは、GEO(生成式エンジン最適化)に特化したオープンソースのワークベンチです。AI検索におけるウェブサイト…
★ 3 ⑂ 1 Apache-2.0 2026-06-18
動画生成
GitHub
manudesign
Manu Designは、チーム向けのオープンソースAIデザインワークフローエンジンです。ブランディングに沿った高品質な画…
★ 3 MIT 2026-05-19
画像生成
GitHub
awesome-ai-image-prompts
このリポジトリは、GPT-Image-2、Nano Banana、Seedance、Qwen-VL、Gemini ImagenなどのAI画像生成モデル向けの、955…
★ 3 ⑂ 2 Apache-2.0 2026-05-26
ASR / 音声認識
GitHub
smart-meeting-assistant
「拼好会-智能会議辅助系统」は、AIを活用したリアルタイム会議支援ソフトウェアです。PCの音声とマイク入力を同時に…
★ 3 2026-05-25
マルチモーダル
GitHub
kaggle-llm-server
このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。無料のKaggle …
★ 3 ⑂ 4 2026-05-24
音声生成 / TTS
GitHub
supertonic_embeddings_trainer
Supertonic Embeddings Trainerは、SupertonicTTS向けのローカルボイスクローニングパイプラインです。WAVファイルを…
★ 3 MIT 2026-05-26
ASR / 音声認識
GitHub
OmniVid
OmniVidは、YouTube、Bilibili、抖音、TikTokを含む1800以上の動画プラットフォームに対応した万能動画ダウンロード…
★ 3 2026-06-16