3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2216 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub zero-shot-video-classifier
このツールは、ビジョン言語基盤モデル(CLIP、SigLIP 2、X-CLIP)を用いたゼロショット動画分類器です。タスク固有…
★ 1 2026-06-09
LLM GitHub ChatPDF
このプロジェクトは、Streamlitで構築された軽量かつ強力なRAG(検索拡張生成)ベースのPDFチャットアプリケーション…
★ 1 MIT 2026-05-20
AIエージェント GitHub pi-context-pruner
pi-context-prunerは、AIエージェントPiのセッションコンテキストを最適化するためのツールです。冗長なセッションか…
★ 1 2026-05-30
音声生成 / TTS GitHub hermes-weixin-voice
hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…
★ 1 MIT 2026-05-25
LLM GitHub yuri-os
Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー(DAG)を設計し、…
★ 1 2026-06-04
音声生成 / TTS GitHub lux-tts
LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…
★ 1 NOASSERTION 2026-05-10
LLM GitHub citeguard
CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成(RAG)のための適合偽発見率制御ツールです。本ツールは、…
★ 1 MIT 2026-05-28
ASR / 音声認識 GitHub jarvis-local-ai
Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…
★ 1 2026-05-31
マルチモーダル GitHub Qwen-Image-Edit-Object-Manipulator
Qwen-Image-Edit-Object-Manipulatorは、画像内のオブジェクトを簡単かつ高精度に操作できるツールです。ロゴ、アク…
★ 1 ⑂ 1 Apache-2.0 2026-06-25
音声生成 / TTS GitHub agentic-podcast
このツールは、データ駆動型のポッドキャストを人間が介入することなく毎日自動で生成し、ナレーションを付け、Spoti…
★ 1 MIT 2026-06-10
動画生成 GitHub explainer-video
本ツールは、Claude Codeのスキルおよびプラグインとして機能し、製品のスクリーンショットや画面録画から、ナレーシ…
★ 1 MIT 2026-06-10
画像生成 GitHub ComfyUI-Mutantwork
ComfyUI-Mutantworkは、ComfyUI向けのカスタムノードスイートで、プロンプトの最適化、ローカルでのAI画像鑑識、およ…
★ 1 ⑂ 1 2026-06-12
LLM GitHub rag-document-engine
「Buffden/rag-document-engine」は、Pythonでゼロから構築されたプログレッシブなRAG(検索拡張生成)システムです…
★ 1 2026-06-27
ASR / 音声認識 GitHub Jarvis
Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…
★ 1 2026-06-17
音楽生成 GitHub MAZ-MUSIC
MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…
★ 1 ⑂ 1 MIT 2026-06-15
音声生成 / TTS GitHub mlx-indextts-webui
このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。FastAPIをバックエン…
★ 1 NOASSERTION 2026-05-20
音声生成 / TTS GitHub claude-speech-skill
「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…
★ 1 MIT 2026-06-21
画像生成 GitHub comfyui-amd-plug-and-play
miradorventus/comfyui-amd-plug-and-play は、AMD GPU(Ubuntu/Mint)上でComfyUIのセットアップと実行を大幅に簡素…
★ 1 2026-05-31
LLM GitHub whiskershelf
AI WhiskerShelfは、ローカルで動作するLLM(大規模言語モデル)駆動の論文ライブラリマネージャーです。PDFファイル…
★ 1 MIT 2026-06-07
ASR / 音声認識 GitHub livekit-starter
LiveKit Voice AI Starterは、ブラウザ上でAIエージェントとリアルタイムで音声対話を行うためのフルスタックなスタ…
★ 1 MIT 2026-06-18
音楽生成 GitHub synt-audio
Auratuneは、Lofi Girlのような没入型体験にインスパイアされた、Lo-fiスタイルのデジタルコンテンツ作成システムで…
★ 1 2026-04-21
ASR / 音声認識 GitHub voxi
Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…
★ 1 MIT 2026-05-25
ComfyUI GitHub comfyui-cloud-storage
comfyui-cloud-storageは、画像生成AIツールComfyUI用のカスタムノードパッケージです。ComfyUIで生成された画像、動…
★ 1 ⑂ 1 MIT 2026-05-06
ComfyUI GitHub comfy-moneta-bridge
comfy-moneta-bridgeは、Comfy-Cozyの自律型ComfyUIエージェントとMonetaのコグニティブ基盤を連携させ、ComfyUIの生…
★ 1 2026-05-27