3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ComfyUI GitHub comfyui-mirror-panel
ComfyUI Mirror Panelは、ComfyUIの複雑なワークフローの操作性とパフォーマンスを大幅に向上させるプラグインです。…
★ 3 GPL-3.0 2026-05-05
動画生成 GitHub bernini-studio-ui
Bernini Studio UIは、ByteDanceの強力な画像・動画生成AIモデル「Bernini」の推論を、より操作しやすくするために開…
★ 3 Apache-2.0 2026-06-14
音声生成 / TTS GitHub PocketClaude
Pocket Claudeは、AnthropicのClaudeを自己ホストできるチャットフロントエンドです。ユーザー自身のPro/Maxサブスク…
★ 3 ⑂ 1 MIT 2026-06-22
LLM GitHub provenance-energy-rag-chatbot
本ツールは、太陽光発電やエネルギー機器のマニュアルに対応した、信頼性の高いドキュメント指向型RAGチャットボット…
★ 3 MIT 2026-06-08
音声生成 / TTS GitHub supertonic3-book-reader
「EPUB TTS Reader API」は、EPUBファイルをテキストに変換し、Supertonic-3モデルを使用してテキスト読み上げ(TTS…
★ 3 MIT 2026-05-15
マルチモーダル GitHub AI-Book-Discovery-App
Perspicuaは、図書館や書店での「選択のパラドックス」を解決するために設計された、高性能なAI駆動型セマンティック…
★ 3 GPL-3.0 2026-05-10
LLM GitHub Lestro-Dataset-Generator
Lestro Dataset Generatorは、GoogleのGemini APIを利用し、DevOpsやシステムエンジニアリング分野のLLMファインチュ…
★ 3 2026-05-25
ASR / 音声認識 GitHub scenelens
Scenelensは、Claudeにスマートな動画入力機能を提供するツールです。動画からシーン変化に基づいて最適なフレームを…
★ 3 MIT 2026-05-04
音声生成 / TTS GitHub SpeechifyPDF
SpeechifyPDFは、PDFドキュメントを自然で高品質な音声に変換し、読み上げてくれるアプリケーションです。通勤中やマ…
★ 3 MIT 2026-06-05
マルチモーダル GitHub blink-skill
Blink Skillは、PC上でのユーザーのアクティビティ(会議、ドキュメント作業、動画視聴、コーディングなど)をAIが能…
★ 3 MIT 2026-05-02
ComfyUI GitHub comfyui-mcp-panel
「ComfyUI MCP Panel」は、ComfyUIのサイドバーにClaude Codeセッションを統合し、AIエージェントがComfyUIのグラフ…
★ 3 ⑂ 2 MIT 2026-06-27
音声生成 / TTS GitHub Stable-Audio-Insight
Stable Audio Insightは、Stability AIの「Stable Audio Open 1.0」を基盤としたWindows向けのローカルオーディオ生…
★ 3 NOASSERTION 2026-04-30
マルチモーダル GitHub browserground
browsergroundは、ハイブリッドAIエージェント向けのローカルUIグラウンディングツールです。スクリーンショットとテ…
★ 3 2026-05-21
動画生成 GitHub volcengine-hermes-plugin
このプラグインは、Hermes Agentに火山引擎(Volcengine)のDoubao LLM(大規模言語モデル)、Doubao Seedream(画像…
★ 3 2026-05-25
LLM GitHub openmodels
OpenModels Registryは、大規模言語モデル(LLM)とその推論プロバイダー、および両者のマッピングに関する情報を集…
★ 3 ⑂ 1 2026-06-19
ComfyUI GitHub VisualBrowserNodes-by-LX
LXによるCivitaiビジュアルブラウザノードは、ComfyUIユーザーがローカルのLoRA、チェックポイント、拡散モデルを効…
★ 3 ⑂ 1 2026-05-11
音声生成 / TTS GitHub crashout-buddy
Crashout Buddyは、Vision AgentsとStream Video上に構築された、リアルタイムで感情認識を行う音声AIエージェントの…
★ 3 MIT 2026-05-15
マルチモーダル GitHub opencode-vision
opencode-visionは、マルチモーダルに対応していないOpenCodeモデルに画像認識機能を追加するツールです。ユーザーが…
★ 3 MIT 2026-06-24
LLM GitHub llm-observability-platform
この「LLM Observability Platform: Core Python Infrastructure」は、LLMアプリケーション向けに設計された高性能な…
★ 3 ⑂ 1 Apache-2.0 2026-06-23
画像生成 GitHub cover-xiaohongshu
「cover-xiaohongshu」は、小紅書(Xiaohongshu)のカバー画像を生成およびレイアウトを分析するためのCodex/Claude …
★ 3 MIT 2026-05-28
動画生成 GitHub imagine-mcp
「imagine-mcp」は、Google Gemini、OpenAI、Grokといった主要なAIモデルを横断し、画像や動画の理解および生成を可…
★ 3 MIT 2026-06-24
LLM GitHub LongShuGameDev
LongShu (龙枢) は、ゲーム開発に特化した大規模言語モデルです。複雑なゲームシステムの要件を分解し、実行可能な開…
★ 3 NOASSERTION 2026-04-10
ASR / 音声認識 GitHub hexy
HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…
★ 3 ⑂ 1 2026-05-10
ASR / 音声認識 GitHub astrbot_plugin_volcengine_asr
本ツールは、AstrBot向けの火山引擎豆包语音ASRプラグインです。QQおよびNapCatからの音声メッセージをテキストに変…
★ 3 2026-05-13