3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2211 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub ovos-tts-plugin-kokoro
ovos-tts-plugin-kokoroは、Open Voice OS (OVOS) 音声アシスタント向けに開発された、多言語テキスト読み上げ(TTS…
★ 3 NOASSERTION 2026-05-03
音声生成 / TTS GitHub seshat-tts
Seshat TTSは、Windows向けのGUIユーティリティで、ゲームやアプリケーション向けにリアルタイムの音声ストリーミン…
★ 3 ⑂ 1 NOASSERTION 2026-06-19
マルチモーダル GitHub SmolVLM2-Edge-Vision-Agent
SmolVLM2-2.2Bを搭載したエッジ展開可能なビジョンエージェントで、CPUのみのハードウェア(16GB RAM)で動作します…
★ 3 2026-04-27
動画生成 GitHub video-distillation
video-distillationは、動画、キーフレーム、スクリーンショット、ナレーションスクリプト、プロット概要などを、動…
★ 3 ⑂ 1 MIT 2026-06-24
画像生成 GitHub SuGPT-kexue
SuGPTは、中国の著名なAI/NLPブロガー、蘇剣林(科学空間 kexue.fm)氏の公開記事をAI Agentが直接照会できる知識ベ…
★ 3 NOASSERTION 2026-05-27
音声生成 / TTS GitHub feinschmiede
「feinschmiede」は、Claude Code向けのブランドメディアプラグイン集です。プレゼンテーション資料(PowerPoint)、…
★ 3 ⑂ 1 MIT 2026-06-22
ComfyUI GitHub anima-verse
AIパワードの仮想キャラクター(エージェント)との対話と画像生成を深く統合した、フルスタックのWebアプリケーショ…
★ 3 NOASSERTION 2026-06-25
画像生成 GitHub gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 3 MIT 2026-05-08
LLM GitHub MCP-Production-Business-Agent
本ツールは、Model Context Protocol、LangGraph、FastMCPを活用した自律的な買掛金AIシステムです。請求書のデータ…
★ 3 MIT 2026-06-23
音声生成 / TTS GitHub ComfyUI_RH_VoxCPM
ComfyUI_RH_VoxCPMは、ComfyUIのノードベースワークフロー内でVoxCPMの機能を統合するプラグインです。これにより、…
★ 3 Apache-2.0 2026-06-28
ComfyUI GitHub nodeguard
nodeguardは、ComfyUIのカスタムノードやノードベースのワークフロープラグイン向けのセキュリティスキャナーです。…
★ 3 ⑂ 2 Apache-2.0 2026-05-29
ComfyUI GitHub isometric-game-skills
このリポジトリは、AIエージェントがアイソメトリックゲームを構築するための、20の専門スキルセットを提供します。A…
★ 3 MIT 2026-06-16
マルチモーダル GitHub Crucible
Crucibleは、ロボットのデモンストレーションデータを評価・キュレーションするための多軸VLM(Vision-Language Mode…
★ 3 MIT 2026-05-10
マルチモーダル GitHub browserground
browsergroundは、ハイブリッドAIエージェント向けのローカルUIグラウンディングツールです。スクリーンショットとテ…
★ 3 2026-05-21
音声生成 / TTS GitHub AIBLI
AIBLIは、スクリプトから字幕付きショートビデオまでを一貫して自動生成する、AI仮想キャラクターの音声・動画合成パ…
★ 3 ⑂ 1 2026-05-17
ComfyUI GitHub ComfyUI-NVML-Monitor
ComfyUI-NVML-Monitorは、ComfyUI上でNVIDIA製GPUのリアルタイムハードウェア監視を可能にする軽量な拡張機能です。C…
★ 3 ⑂ 1 MIT 2026-06-02
LLM GitHub rag-contract
「rag-contract」は、RAG(Retrieval-Augmented Generation)アプリケーションのドキュメント検索品質を検証するため…
★ 3 MIT 2026-04-30
ASR / 音声認識 GitHub streamscribe
streamscribeは、クラウドやAPIキーに依存せず、通常のCPUで動作するリアルタイム放送転写・分析ツールです。複数の…
★ 3 2026-06-11
LLM GitHub spaturzu-sdks
spaturzu SDKは、AIエージェントごとのLLM(大規模言語モデル)利用コストを追跡・帰属させ、予算の強制、およびプロ…
★ 3 MIT 2026-06-11
ComfyUI GitHub ai-cinema-studio-engine
PopTech Studioが提供するAI Cinema Studio Engineは、自社ホスト型のAI映画制作エンジンです。Higgsfield Cinema St…
★ 3 ⑂ 2 MIT 2026-04-13
3D / NeRF GitHub gaussian_lic_ros2
このツールは、LiDAR-Inertial-Camera Gaussian Splatting SLAMのROS2ネイティブポートであり、Gaussian-LIC/Gaussia…
★ 3 GPL-3.0 2026-06-21
音声生成 / TTS GitHub mellifluous
mellifluousは、Markdown形式のテキストを構造やインラインコンテンツを考慮し、自然な間合いで読み上げるツールです…
★ 3 MIT 2026-06-22
マルチモーダル GitHub reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-21
マルチモーダル GitHub LangSlice
LangSliceは、Vision-Language Model (VLM) を活用し、組織学的脳切片をBrainGlobeアトラスに自動で高精度に位置合わ…
★ 3 BSD-3-Clause 2026-06-03