3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2214 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
3D / NeRF GitHub Marble-x-Nuke
「Marble x Nuke」は、Nuke 17+にWorld Labs Marble APIを統合したツールです。コンポジターやVFXアーティストは、テ…
★ 1 MIT 2026-05-11
音声生成 / TTS GitHub voiceclone-guard
「VoiceClone Guard」は、AI音声ディープフェイクを無料で検出するオープンソースのツールです。Webブラウザから音声…
★ 1 MIT 2026-05-23
音声生成 / TTS GitHub hermes-weixin-voice
hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…
★ 1 MIT 2026-05-25
LLM GitHub yuri-os
Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー(DAG)を設計し、…
★ 1 2026-06-04
音声生成 / TTS GitHub lux-tts
LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…
★ 1 NOASSERTION 2026-05-10
LLM GitHub citeguard
CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成(RAG)のための適合偽発見率制御ツールです。本ツールは、…
★ 1 MIT 2026-05-28
ASR / 音声認識 GitHub jarvis-local-ai
Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…
★ 1 2026-05-31
マルチモーダル GitHub Qwen-Image-Edit-Object-Manipulator
Qwen-Image-Edit-Object-Manipulatorは、画像内のオブジェクトを簡単かつ高精度に操作できるツールです。ロゴ、アク…
★ 1 ⑂ 1 Apache-2.0 2026-06-25
音声生成 / TTS GitHub agentic-podcast
このツールは、データ駆動型のポッドキャストを人間が介入することなく毎日自動で生成し、ナレーションを付け、Spoti…
★ 1 MIT 2026-06-10
動画生成 GitHub explainer-video
本ツールは、Claude Codeのスキルおよびプラグインとして機能し、製品のスクリーンショットや画面録画から、ナレーシ…
★ 1 MIT 2026-06-10
画像生成 GitHub ComfyUI-Mutantwork
ComfyUI-Mutantworkは、ComfyUI向けのカスタムノードスイートで、プロンプトの最適化、ローカルでのAI画像鑑識、およ…
★ 1 ⑂ 1 2026-06-12
LLM GitHub rag-document-engine
「Buffden/rag-document-engine」は、Pythonでゼロから構築されたプログレッシブなRAG(検索拡張生成)システムです…
★ 1 2026-06-27
ASR / 音声認識 GitHub Jarvis
Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…
★ 1 2026-06-17
3D / NeRF GitHub gmnerf
このリポジトリは、ICLR 2026で発表された「Weight Space Representation Learning on Diverse NeRF Architectures」…
★ 1 MIT 2026-04-03
ComfyUI GitHub ConfyUI_Post_Processing_PRO
「Post_Processing_PRO for ComfyUI」は、ComfyUI向けにキュレーションされたプロフェッショナルかつ高忠実度の後処…
★ 1 ⑂ 1 GPL-3.0 2026-04-14
LLM GitHub multi-agent-recovery-pipeline
この「Multi-Agent Failure Recovery Pipeline」は、大規模言語モデル(LLM)が自身の誤答を自動で検知し、修正する…
★ 1 2026-05-23
音楽生成 GitHub musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
音声生成 / TTS GitHub claude-speech-skill
「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…
★ 1 MIT 2026-06-21
画像生成 GitHub comfyui-amd-plug-and-play
miradorventus/comfyui-amd-plug-and-play は、AMD GPU(Ubuntu/Mint)上でComfyUIのセットアップと実行を大幅に簡素…
★ 1 2026-05-31
LLM GitHub whiskershelf
AI WhiskerShelfは、ローカルで動作するLLM(大規模言語モデル)駆動の論文ライブラリマネージャーです。PDFファイル…
★ 1 MIT 2026-06-07
ASR / 音声認識 GitHub livekit-starter
LiveKit Voice AI Starterは、ブラウザ上でAIエージェントとリアルタイムで音声対話を行うためのフルスタックなスタ…
★ 1 MIT 2026-06-18
画像生成 GitHub diffusion-models-from-scratch
NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル(DDPM、U-Net、CFG、CLIPコサイン類似度)をFashionMNIS…
★ 1 MIT 2026-05-08
マルチモーダル GitHub ControlFoley_test
ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…
★ 1 Apache-2.0 2026-04-17
音声生成 / TTS GitHub SoviaMate
SoviaMateは、エンドツーエンドの音声対話システム(SDS)構築に向けたオープンな研究プロジェクトです。特に、大規…
★ 1 Apache-2.0 2026-05-18