3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

3D / NeRF

GitHub

Marble-x-Nuke

「Marble x Nuke」は、Nuke 17+にWorld Labs Marble APIを統合したツールです。コンポジターやVFXアーティストは、テ…

#3D #AI生成 #API連携

★ 1 MIT 2026-05-11

音声生成 / TTS

GitHub

voiceclone-guard

「VoiceClone Guard」は、AI音声ディープフェイクを無料で検出するオープンソースのツールです。Webブラウザから音声…

#APIキー不要 #Python #Web UI

★ 1 MIT 2026-05-23

音声生成 / TTS

GitHub

hermes-weixin-voice

hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…

#CLI #Python #WeChat連携

★ 1 MIT 2026-05-25

LLM

GitHub

yuri-os

Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー（DAG）を設計し、…

#Generative AI #Python #Web UI

★ 1 2026-06-04

音声生成 / TTS

GitHub

lux-tts

LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…

#Google Colab #GPU必須 #Python

★ 1 NOASSERTION 2026-05-10

LLM

GitHub

citeguard

CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成（RAG）のための適合偽発見率制御ツールです。本ツールは、…

#CLI #Python #RAG

★ 1 MIT 2026-05-28

ASR / 音声認識

GitHub

jarvis-local-ai

Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…

#CLI #GPU必須 #Python

★ 1 2026-05-31

マルチモーダル

GitHub

Qwen-Image-Edit-Object-Manipulator

Qwen-Image-Edit-Object-Manipulatorは、画像内のオブジェクトを簡単かつ高精度に操作できるツールです。ロゴ、アク…

#CLI #Linux #macOS

★ 1 ⑂ 1 Apache-2.0 2026-06-25

音声生成 / TTS

GitHub

agentic-podcast

このツールは、データ駆動型のポッドキャストを人間が介入することなく毎日自動で生成し、ナレーションを付け、Spoti…

#AWS #Claude #CLI

★ 1 MIT 2026-06-10

動画生成

GitHub

explainer-video

本ツールは、Claude Codeのスキルおよびプラグインとして機能し、製品のスクリーンショットや画面録画から、ナレーシ…

#Claude Code #CLI #GPU推奨

★ 1 MIT 2026-06-10

画像生成

GitHub

ComfyUI-Mutantwork

ComfyUI-Mutantworkは、ComfyUI向けのカスタムノードスイートで、プロンプトの最適化、ローカルでのAI画像鑑識、およ…

#ComfyUI対応 #GPU推奨 #Python

★ 1 ⑂ 1 2026-06-12

LLM

GitHub

rag-document-engine

「Buffden/rag-document-engine」は、Pythonでゼロから構築されたプログレッシブなRAG（検索拡張生成）システムです…

#Chroma #CLI #OpenAI

★ 1 2026-06-27

ASR / 音声認識

GitHub

Jarvis

Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…

#AI / 機械学習 #CLI #OpenCV

★ 1 2026-06-17

3D / NeRF

GitHub

gmnerf

このリポジトリは、ICLR 2026で発表された「Weight Space Representation Learning on Diverse NeRF Architectures」…

#CLI #GPU必須 #Hugging Face

★ 1 MIT 2026-04-03

ComfyUI

GitHub

ConfyUI_Post_Processing_PRO

「Post_Processing_PRO for ComfyUI」は、ComfyUI向けにキュレーションされたプロフェッショナルかつ高忠実度の後処…

#ComfyUI対応 #Python #カメラシミュレーション

★ 1 ⑂ 1 GPL-3.0 2026-04-14

LLM

GitHub

multi-agent-recovery-pipeline

この「Multi-Agent Failure Recovery Pipeline」は、大規模言語モデル（LLM）が自身の誤答を自動で検知し、修正する…

#AI #CLI #Gemini

★ 1 2026-05-23

音楽生成

GitHub

musicgen-api

「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…

#AI音楽生成 #Docker #GPU対応

★ 1 ⑂ 1 MIT 2026-06-04

音声生成 / TTS

GitHub

claude-speech-skill

「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…

#Claude Code対応 #Python #TTS

★ 1 MIT 2026-06-21

画像生成

GitHub

comfyui-amd-plug-and-play

miradorventus/comfyui-amd-plug-and-play は、AMD GPU（Ubuntu/Mint）上でComfyUIのセットアップと実行を大幅に簡素…

#AMD ROCm #CLI #ComfyUI対応

★ 1 2026-05-31

LLM

GitHub

whiskershelf

AI WhiskerShelfは、ローカルで動作するLLM（大規模言語モデル）駆動の論文ライブラリマネージャーです。PDFファイル…

#API連携 #CLI #LLM

★ 1 MIT 2026-06-07

ASR / 音声認識

GitHub

livekit-starter

LiveKit Voice AI Starterは、ブラウザ上でAIエージェントとリアルタイムで音声対話を行うためのフルスタックなスタ…

#Docker #FastAPI #Python

★ 1 MIT 2026-06-18

画像生成

GitHub

diffusion-models-from-scratch

NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル（DDPM、U-Net、CFG、CLIPコサイン類似度）をFashionMNIS…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-08

マルチモーダル

GitHub

ControlFoley_test

ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…

#CLI #GPU必須 #Hugging Face

★ 1 Apache-2.0 2026-04-17

音声生成 / TTS

GitHub

SoviaMate

SoviaMateは、エンドツーエンドの音声対話システム（SDS）構築に向けたオープンな研究プロジェクトです。特に、大規…

#CLI #Hugging Face #Python

★ 1 Apache-2.0 2026-05-18