3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2211 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ComfyUI

GitHub

WavTTS-ComfyUI

WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。参照音声とテキス…

#ComfyUI対応 #GPU必須 #Python

★ 6 ⑂ 1 MIT 2026-06-04

音声生成 / TTS

GitHub

ScriptSmith-Engine

ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…

#AI活用 #CLI #FFmpeg

★ 6 ⑂ 1 MIT 2026-06-23

音声生成 / TTS

GitHub

claude-code-audio-recap

このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…

#Claude Code Plugin #CLI #macOS

★ 6 Apache-2.0 2026-06-18

画像生成

GitHub

PiD-Image-Upscaler

PiD-Image-Upscalerは、NVIDIAのPiD（Pixel Diffusion Decoder）フレームワークを基盤とした、実験的な高機能超解像…

#GPU必須 #NVIDIA PiD #Python

★ 6 ⑂ 2 Apache-2.0 2026-06-14

ASR / 音声認識

GitHub

Live-Church-Captions

Church Capは、教会向けに開発されたオープンソースかつローカルファーストのリアルタイムキャプションアプリです。…

#CLI #Python #Web UI

★ 6 MIT 2026-06-23

マルチモーダル

GitHub

egobabyvlm

本リポジトリは、EgoBabyVLMチャレンジのインフラを提供します。これは、乳幼児の一人称視点ビデオデータ（BabyView …

#Python #PyTorch #VLM

★ 6 NOASSERTION 2026-06-23

ComfyUI

GitHub

MisoTTS-ComfyUI

MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ（TTS）ノードです。Miso TTS 8BモデルとMimiオーディオトークン…

#ComfyUI対応 #GPU必須 #Python

★ 6 ⑂ 3 MIT 2026-06-04

動画生成

GitHub

Agnes-AI-Platform

Agnes AI Platformは、Agnes AIのAPI（Agnes Image 2.1 FlashおよびAgnes Video V2.0）を利用した画像・動画生成のた…

#Agnes AI API対応 #FastAPI #GPU必須

★ 6 NOASSERTION 2026-06-25

音声生成 / TTS

GitHub

hermes-embodiment

hermes-embodimentは、Hermesエージェントに物理的な具現化レイヤーを提供するツールです。エージェントの「思考中」…

#Hermes Agent対応 #Python #Raspberry Pi対応

★ 6 MIT 2026-05-31

ComfyUI

GitHub

TrendCut-Studio

TrendCut Studioは、短編動画運用向けのローカル自動化ワークベンチです。ホットスポット発見、素材分析、スクリプト…

#AI #ComfyUI対応 #Node.js

★ 6 ⑂ 2 MIT 2026-06-05

LLM

GitHub

consulting-tools

Consulting Toolsは、コンサルタント向けに特化したAIツールスイートです。Claude 3.5やGeminiなどのAIを活用し、商…

#CLI #FastAPI #Google Workspace連携

★ 6 MIT 2026-03-22

画像生成

GitHub

codex-gpt-image-2-subscription

このツールは、ChatGPT/Codexのサブスクリプションを利用し、APIキーや従量課金なしでgpt-image-2モデルによる画像生…

#ChatGPT Subscription #Claude Code Skill #CLI

★ 6 ⑂ 2 MIT 2026-06-07

音声生成 / TTS

GitHub

chorus

Chorusは、YouTubeの長い動画コンテンツを効率的に消費するための画期的なツールです。YouTubeのURLまたは思想家の名…

#AI活用 #CLI #Python

★ 6 2026-04-25

AIエージェント

GitHub

noah-gen3-type2

「noah-gen3-type2」は、コンテキスト管理、記憶閉ループ、自律進化を特徴とする汎用型AI認知アーキテクチャです。「…

#AI Agent #CLI #Python

★ 6 2026-06-24

音声生成 / TTS

GitHub

vocalis

Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…

#CLI #GPU必須 #LLM連携

★ 6 MIT 2026-05-21

マルチモーダル

GitHub

CodeBind

CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…

#CLI #GPU必須 #Hugging Face対応

★ 6 ⑂ 1 MIT 2026-05-19

3D / NeRF

GitHub

StoryCore-Engine

StoryCore Engineは、スクリプトから一貫性のある画像、動画、ストーリー、対話、空間オーディオを生成する、ローカ…

#ComfyUI対応 #Python #React

★ 6 ⑂ 1 MIT 2026-06-25

マルチモーダル

GitHub

wgram-lm

W-GRAM-LMは、世界誘導型再帰的アトラクタ言語モデルの研究用コードベースです。潜在世界予測、多軌道推論、解答アト…

#AGPLライセンス #CLI #Hugging Face Transformers

★ 6 AGPL-3.0 2026-06-21

AIエージェント

GitHub

Hive

Hiveは、自律的に協調し、コードを記述し、ツールを使用する永続的なAIエージェントを生成するためのローカルファー…

#CLI #Python #SDK

★ 6 MIT 2026-06-11

画像生成

GitHub

nanoDLM

「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル（MDM）の実装です。約110…

#CLI #GPU推奨 #Python

★ 6 ⑂ 1 2026-05-16

画像生成

GitHub

chatgpt-web-gen

このツールは、ChatGPT Plus/Pro/Teamアカウントを持つユーザー向けに、APIキーなしでChatGPT Webの画像生成機能を利…

#ChatGPT #CLI #Python

★ 6 ⑂ 1 MIT 2026-06-07

ComfyUI

GitHub

ComfyUI-MCP-Server-Python

ComfyUI-MCP-Serverは、ComfyUIのワークフローをAIエージェントが利用可能なパラメータ設定可能なツールに変換するMC…

#AIエージェント連携 #ComfyUI対応 #MCP Protocol

★ 6 MIT 2026-03-13

音声生成 / TTS

GitHub

Awesome-Audio-Generation

この「Awesome-Audio-Generation」リポジトリは、音声生成に関する最新の研究論文、コード、およびプロジェクトを厳…

#Curation #Documentation #GitHub

★ 6 ⑂ 1 2025-10-11

音声生成 / TTS

GitHub

NeuTTS-Studio

NeuTTS Studioは、オンデバイスでのテキスト読み上げ（TTS）、音声クローニング、リアルタイムストリーミング機能を…

#Python #オンデバイス #テキスト読み上げ

★ 6 NOASSERTION 2026-03-31