3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

Clippos

Clipposは、長い動画からキャプション付きのバイラル向けソーシャルクリップを生成するAIエージェントスキルです。He…

#Claude Code対応 #CLI #Codex対応

★ 6 ⑂ 1 MIT 2026-04-26

画像生成

GitHub

codex-gpt-image-2-subscription

このツールは、ChatGPT/Codexのサブスクリプションを利用し、APIキーや従量課金なしでgpt-image-2モデルによる画像生…

#ChatGPT Subscription #Claude Code Skill #CLI

★ 6 ⑂ 2 MIT 2026-06-07

音声生成 / TTS

GitHub

chorus

Chorusは、YouTubeの長い動画コンテンツを効率的に消費するための画期的なツールです。YouTubeのURLまたは思想家の名…

#AI活用 #CLI #Python

★ 6 2026-04-25

音声生成 / TTS

GitHub

ghost-narrator

Ghost Narratorは、ブログや静的サイト向けに自己ホスト型のAI音声ナレーションを提供するツールです。ElevenLabsの…

#AIナレーション #Docker #Ghost CMS対応

★ 6 ⑂ 1 MIT 2026-06-15

音声生成 / TTS

GitHub

BridgeSpeak

BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…

#AIエージェント対応 #CLI #Python

★ 6 ⑂ 2 MIT 2026-05-10

3D / NeRF

GitHub

higs

HiGSは、SIGGRAPH Asia 2025で発表された「Inverse Radiative Transport for Infrared Scenes with Gaussian Primiti…

#CLI #CUDA #GPU必須

★ 6 ⑂ 1 2026-06-09

マルチモーダル

GitHub

Multimodal-Edge-Node

Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…

#GPU必須 #Python #Web UI

★ 6 Apache-2.0 2026-05-01

ASR / 音声認識

GitHub

Live-Church-Captions

Church Capは、教会向けに開発されたオープンソースかつローカルファーストのリアルタイムキャプションアプリです。…

#CLI #Python #Web UI

★ 6 MIT 2026-06-23

ComfyUI

GitHub

WavTTS-ComfyUI

WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。参照音声とテキス…

#ComfyUI対応 #GPU必須 #Python

★ 6 ⑂ 1 MIT 2026-06-04

画像生成

GitHub

nanoDLM

「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル（MDM）の実装です。約110…

#CLI #GPU推奨 #Python

★ 6 ⑂ 1 2026-05-16

マルチモーダル

GitHub

AlignedNorm

AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…

#ICML論文 #Python #Vision-Language Models

★ 6 MIT 2026-06-12

3D / NeRF

GitHub

LandmarkDiff-public

LandmarkDiffは、単一の顔写真から美容整形手術後の予測画像を生成する革新的なツールです。解剖学的に条件付けされ…

#CLI #GPU必須 #Hugging Face Space

★ 6 ⑂ 11 MIT 2026-05-01

マルチモーダル

GitHub

egobabyvlm

本リポジトリは、EgoBabyVLMチャレンジのインフラを提供します。これは、乳幼児の一人称視点ビデオデータ（BabyView …

#Python #PyTorch #VLM

★ 6 NOASSERTION 2026-06-23

動画生成

GitHub

Agnes-AI-Platform

Agnes AI Platformは、Agnes AIのAPI（Agnes Image 2.1 FlashおよびAgnes Video V2.0）を利用した画像・動画生成のた…

#Agnes AI API対応 #FastAPI #GPU必須

★ 6 NOASSERTION 2026-06-25

ComfyUI

GitHub

MisoTTS-ComfyUI

MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ（TTS）ノードです。Miso TTS 8BモデルとMimiオーディオトークン…

#ComfyUI対応 #GPU必須 #Python

★ 6 ⑂ 3 MIT 2026-06-04

音声生成 / TTS

GitHub

ScriptSmith-Engine

ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…

#AI活用 #CLI #FFmpeg

★ 6 ⑂ 1 MIT 2026-06-23

画像生成

GitHub

M2GenCO

M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…

#CLI #GPU必須 #Python

★ 6 2026-05-26

3D / NeRF

GitHub

StoryCore-Engine

StoryCore Engineは、スクリプトから一貫性のある画像、動画、ストーリー、対話、空間オーディオを生成する、ローカ…

#ComfyUI対応 #Python #React

★ 6 ⑂ 1 MIT 2026-06-23

画像生成

GitHub

CAM

このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…

#CLI #GPU必須 #Python

★ 6 2026-06-01

音声生成 / TTS

GitHub

the-muser

The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…

#CLI #Docker対応 #GPU必須

★ 6 ⑂ 1 MIT 2026-05-27

AIエージェント

GitHub

Local-Model

このツールは、Kali Linux上でQwen 2.5-7Bモデル（LM Studio経由）を活用する、完全にローカルで自律的なサイバーセ…

#CLI #Kali Linux #LLM

★ 6 ⑂ 2 MIT 2026-06-17

AIエージェント

GitHub

Hive

Hiveは、自律的に協調し、コードを記述し、ツールを使用する永続的なAIエージェントを生成するためのローカルファー…

#CLI #Python #SDK

★ 6 MIT 2026-06-11

画像生成

GitHub

dbmsolver

DBMSolverは、高品質な画像間変換（Image-to-Image Translation）を実現するための、トレーニング不要な拡散ブリッジ…

#GPU必須 #I2I変換 #Python

★ 6 2026-06-05

音声生成 / TTS

GitHub

vocalis

Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…

#CLI #GPU必須 #LLM連携

★ 6 MIT 2026-05-21