3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2216 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル

GitHub

zero-shot-video-classifier

このツールは、ビジョン言語基盤モデル（CLIP、SigLIP 2、X-CLIP）を用いたゼロショット動画分類器です。タスク固有…

#Docker #HuggingFace Transformers #Python

★ 1 2026-06-09

LLM

GitHub

ChatPDF

このプロジェクトは、Streamlitで構築された軽量かつ強力なRAG（検索拡張生成）ベースのPDFチャットアプリケーション…

#Python #RAG #Web UI

★ 1 MIT 2026-05-20

AIエージェント

GitHub

pi-context-pruner

pi-context-prunerは、AIエージェントPiのセッションコンテキストを最適化するためのツールです。冗長なセッションか…

#AI/LLM #CLI #Pi

★ 1 2026-05-30

音声生成 / TTS

GitHub

hermes-weixin-voice

hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…

#CLI #Python #WeChat連携

★ 1 MIT 2026-05-25

LLM

GitHub

yuri-os

Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー（DAG）を設計し、…

#Generative AI #Python #Web UI

★ 1 2026-06-04

音声生成 / TTS

GitHub

lux-tts

LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…

#Google Colab #GPU必須 #Python

★ 1 NOASSERTION 2026-05-10

LLM

GitHub

citeguard

CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成（RAG）のための適合偽発見率制御ツールです。本ツールは、…

#CLI #Python #RAG

★ 1 MIT 2026-05-28

ASR / 音声認識

GitHub

jarvis-local-ai

Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…

#CLI #GPU必須 #Python

★ 1 2026-05-31

マルチモーダル

GitHub

Qwen-Image-Edit-Object-Manipulator

Qwen-Image-Edit-Object-Manipulatorは、画像内のオブジェクトを簡単かつ高精度に操作できるツールです。ロゴ、アク…

#CLI #Linux #macOS

★ 1 ⑂ 1 Apache-2.0 2026-06-25

音声生成 / TTS

GitHub

agentic-podcast

このツールは、データ駆動型のポッドキャストを人間が介入することなく毎日自動で生成し、ナレーションを付け、Spoti…

#AWS #Claude #CLI

★ 1 MIT 2026-06-10

動画生成

GitHub

explainer-video

本ツールは、Claude Codeのスキルおよびプラグインとして機能し、製品のスクリーンショットや画面録画から、ナレーシ…

#Claude Code #CLI #GPU推奨

★ 1 MIT 2026-06-10

画像生成

GitHub

ComfyUI-Mutantwork

ComfyUI-Mutantworkは、ComfyUI向けのカスタムノードスイートで、プロンプトの最適化、ローカルでのAI画像鑑識、およ…

#ComfyUI対応 #GPU推奨 #Python

★ 1 ⑂ 1 2026-06-12

LLM

GitHub

rag-document-engine

「Buffden/rag-document-engine」は、Pythonでゼロから構築されたプログレッシブなRAG（検索拡張生成）システムです…

#Chroma #CLI #OpenAI

★ 1 2026-06-27

ASR / 音声認識

GitHub

Jarvis

Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…

#AI / 機械学習 #CLI #OpenCV

★ 1 2026-06-17

音楽生成

GitHub

MAZ-MUSIC

MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…

#AI生成 #GPU必須 #Python

★ 1 ⑂ 1 MIT 2026-06-15

音声生成 / TTS

GitHub

mlx-indextts-webui

このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。FastAPIをバックエン…

#Apple Silicon対応 #FastAPI #GPU必須

★ 1 NOASSERTION 2026-05-20

音声生成 / TTS

GitHub

claude-speech-skill

「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…

#Claude Code対応 #Python #TTS

★ 1 MIT 2026-06-21

画像生成

GitHub

comfyui-amd-plug-and-play

miradorventus/comfyui-amd-plug-and-play は、AMD GPU（Ubuntu/Mint）上でComfyUIのセットアップと実行を大幅に簡素…

#AMD ROCm #CLI #ComfyUI対応

★ 1 2026-05-31

LLM

GitHub

whiskershelf

AI WhiskerShelfは、ローカルで動作するLLM（大規模言語モデル）駆動の論文ライブラリマネージャーです。PDFファイル…

#API連携 #CLI #LLM

★ 1 MIT 2026-06-07

ASR / 音声認識

GitHub

livekit-starter

LiveKit Voice AI Starterは、ブラウザ上でAIエージェントとリアルタイムで音声対話を行うためのフルスタックなスタ…

#Docker #FastAPI #Python

★ 1 MIT 2026-06-18

音楽生成

GitHub

synt-audio

Auratuneは、Lofi Girlのような没入型体験にインスパイアされた、Lo-fiスタイルのデジタルコンテンツ作成システムで…

#AI生成 #CLI #MIDI対応

★ 1 2026-04-21

ASR / 音声認識

GitHub

voxi

Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…

#AIアシスタント連携 (MCP) #CLI #Python

★ 1 MIT 2026-05-25

ComfyUI

GitHub

comfyui-cloud-storage

comfyui-cloud-storageは、画像生成AIツールComfyUI用のカスタムノードパッケージです。ComfyUIで生成された画像、動…

#Boto3 #ComfyUI対応 #Python

★ 1 ⑂ 1 MIT 2026-05-06

ComfyUI

GitHub

comfy-moneta-bridge

comfy-moneta-bridgeは、Comfy-Cozyの自律型ComfyUIエージェントとMonetaのコグニティブ基盤を連携させ、ComfyUIの生…

#AIワークフロー #CLI #ComfyUI対応

★ 1 2026-05-27