3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS

GitHub

claude-code-audio-recap

このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…

#Claude Code Plugin #CLI #macOS

★ 6 Apache-2.0 2026-06-18

ComfyUI

GitHub

WavTTS-ComfyUI

WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。参照音声とテキス…

#ComfyUI対応 #GPU必須 #Python

★ 6 ⑂ 1 MIT 2026-06-04

マルチモーダル

GitHub

35gateway

「35Gateway」は、35m.aiが開発・運営するソース利用可能なAIゲートウェイです。テキスト、画像、動画、音声、音楽と…

#AI Gateway #OpenAI互換 #Web UI

★ 6 ⑂ 1 NOASSERTION 2026-04-15

画像生成

GitHub

M2GenCO

M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…

#CLI #GPU必須 #Python

★ 6 2026-05-26

音声生成 / TTS

GitHub

NeuTTS-Studio

NeuTTS Studioは、オンデバイスでのテキスト読み上げ（TTS）、音声クローニング、リアルタイムストリーミング機能を…

#Python #オンデバイス #テキスト読み上げ

★ 6 NOASSERTION 2026-03-31

AIエージェント

GitHub

Hive

Hiveは、自律的に協調し、コードを記述し、ツールを使用する永続的なAIエージェントを生成するためのローカルファー…

#CLI #Python #SDK

★ 6 MIT 2026-06-11

音声生成 / TTS

GitHub

chorus

Chorusは、YouTubeの長い動画コンテンツを効率的に消費するための画期的なツールです。YouTubeのURLまたは思想家の名…

#AI活用 #CLI #Python

★ 6 2026-04-25

音楽生成

GitHub

mlx-swift-audio

mlx-swift-audioは、テキストから音声への変換（TTS）と音声からテキストへの変換（STT）機能をアプリケーションに提…

#Apple Silicon対応 #iOS #macOS

★ 6 ⑂ 2 MIT 2026-06-25

音声生成 / TTS

GitHub

Awesome-Audio-Generation

この「Awesome-Audio-Generation」リポジトリは、音声生成に関する最新の研究論文、コード、およびプロジェクトを厳…

#Curation #Documentation #GitHub

★ 6 ⑂ 1 2025-10-11

ComfyUI

GitHub

MisoTTS-ComfyUI

MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ（TTS）ノードです。Miso TTS 8BモデルとMimiオーディオトークン…

#ComfyUI対応 #GPU必須 #Python

★ 6 ⑂ 3 MIT 2026-06-04

マルチモーダル

GitHub

AlignedNorm

AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…

#ICML論文 #Python #Vision-Language Models

★ 6 MIT 2026-06-12

画像生成

GitHub

nanoDLM

「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル（MDM）の実装です。約110…

#CLI #GPU推奨 #Python

★ 6 ⑂ 1 2026-05-16

3D / NeRF

GitHub

4dgs-human-avatar-comfyui-nodes-dataset

このリポジトリは、ComfyUI向けの究極の4DGS（4D Gaussian Splatting）モジュール「Shramko-Volumetric-Bridge」と、…

#ComfyUI対応 #GPU必須 #Python

★ 6 Apache-2.0 2026-06-19

ComfyUI

GitHub

ComfyUI-Wildcard-Pipeline

ComfyUIのためのモジュール式プロシージャルプロンプト生成ツールです。ワイルドカード、固定値、結合、派生、制約を…

#ComfyUI対応 #Node.js #Python

★ 6 ⑂ 2 GPL-3.0 2026-06-22

ASR / 音声認識

GitHub

voxrt-asr-models

このリポジトリは、VoxRTオンデバイスランタイム向けに最適化されたASR（自動音声認識）モデルのウェイトを提供しま…

#Android #ASR #iOS

★ 6 NOASSERTION 2026-05-28

ASR / 音声認識

GitHub

ai_interview

このツールは、リアルタイム音声対話、多段階面接、ライブ採点、詳細レポート生成機能を備えたAI駆動型模擬面接プラ…

#AI-powered #Docker #Python

★ 6 2026-06-15

ComfyUI

GitHub

ComfyUI-MCP-Server-Python

ComfyUI-MCP-Serverは、ComfyUIのワークフローをAIエージェントが利用可能なパラメータ設定可能なツールに変換するMC…

#AIエージェント連携 #ComfyUI対応 #MCP Protocol

★ 6 MIT 2026-03-13

ASR / 音声認識

GitHub

soyle

SöyleはmacOS向けのプッシュツートーク型音声認識ツールです。キーを押しながら話すと、話した内容がデバイス上で100…

#Apple Silicon必須 #macOS対応 #Swift

★ 6 MIT 2026-06-21

マルチモーダル

GitHub

Multimodal-Edge-Node

Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…

#GPU必須 #Python #Web UI

★ 6 Apache-2.0 2026-05-01

動画生成

GitHub

seedance-superprompt

Seedance 2.0 Superpromptは、ByteDance Seedance 2.0の動画生成プロンプト作成を支援するポータブルなプロンプトス…

#Claude Code対応 #CLI不要 #LLM対応

★ 6 ⑂ 2 MIT 2026-05-23

画像生成

GitHub

codex-gpt-image-2-subscription

このツールは、ChatGPT/Codexのサブスクリプションを利用し、APIキーや従量課金なしでgpt-image-2モデルによる画像生…

#ChatGPT Subscription #Claude Code Skill #CLI

★ 6 ⑂ 2 MIT 2026-06-07

3D / NeRF

GitHub

SLAM-X

SLAM-Xは、NeRF-SLAMおよびGaussian Splatting SLAMシステムの動的なシーンにおけるロバスト性を向上させるためのプ…

#Gaussian Splatting対応 #NeRF対応 #Python

★ 6 ⑂ 1 GPL-3.0 2025-12-09

音声生成 / TTS

GitHub

ScriptSmith-Engine

ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…

#AI活用 #CLI #FFmpeg

★ 6 ⑂ 1 MIT 2026-06-23

画像生成

GitHub

PiD-Image-Upscaler

PiD-Image-Upscalerは、NVIDIAのPiD（Pixel Diffusion Decoder）フレームワークを基盤とした、実験的な高機能超解像…

#GPU必須 #NVIDIA PiD #Python

★ 6 ⑂ 2 Apache-2.0 2026-06-14