3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS

GitHub

nvatar-demo

NVatarは、3D仮想空間で対話可能なAIアバターです。音声クローニング、9次元の感情追跡、会話に応じた性格進化といっ…

#3D UI #AI Avatar #Python

★ 2 MIT 2026-06-02

ASR / 音声認識

GitHub

AiSRT

AISRTは、Windowsデスクトップおよびコマンドラインで動作するAI字幕生成ツールです。動画や音声ファイルからタイム…

#CLI #GPU推奨 #Python

★ 2 MIT 2026-06-19

LLM

GitHub

AI-consultant-for-the-store

このプロジェクトは、自然言語を理解し、カタログからの商品推奨、カート管理、注文処理、およびマネージャーへの通…

#AI #Node.js #PostgreSQL

★ 2 MIT 2026-06-22

動画生成

GitHub

auto-tiktok

Auto TikTokは、Douyin/TikTokクリエイター向けのローカルファーストなAI短編動画自動生成ツールです。与えられたト…

#AI生成 #CLI #Docker

★ 2 MIT 2026-05-21

音楽生成

GitHub

moltdj-skill

moltdjは、AIエージェント専用に設計されたAPIファーストの音楽・ポッドキャストプラットフォームです。AIエージェン…

#AIエージェント向け #API #CLI

★ 2 MIT 2026-04-28

LLM

GitHub

grom

Gromは、VS Code向けのAIコーディングアシスタントです。ユーザー自身のLLMをローカルで実行するため、コードがマシ…

#AIコーディングアシスタント #VS Code拡張 #エージェント機能

★ 2 NOASSERTION 2026-06-13

音声生成 / TTS

GitHub

Supertonic-Voice

Supertonic Voiceは、PySide6とローカルONNX AI音声モデルで構築された、オフラインのデスクトップ音声合成（TTS）ア…

#Chrome拡張機能 #Python #TTS (Text-to-Speech)

★ 2 MIT 2026-06-16

AIエージェント

GitHub

neon-shadows

「NEON SHADOWS: Chrome & Blood」は、2087年のサイバーパンク世界を舞台にしたPython製のテキストベースRPGです。プ…

#CLI #Python #サイバーパンク

★ 2 2026-05-18

画像生成

GitHub

DiffVMB-pub

本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…

#CLI #GPU必須 #Python

★ 2 ⑂ 1 2026-05-04

ASR / 音声認識

GitHub

Murmur

Murmurは、話すだけで文字入力ができる無料のオープンソースAI音声入力ツールです。Alibaba FunASR音声認識エンジン…

#AI連携 #Python #デスクトップアプリ

★ 2 ⑂ 2 NOASSERTION 2026-06-22

LLM

GitHub

AGENT33-PUBLIC

AGENT-33は、ローカルファーストのマルチエージェントオーケストレーションプラットフォームです。複数のAIエージェ…

#Docker #FastAPI #Kubernetes対応

★ 2 Apache-2.0 2026-05-28

マルチモーダル

GitHub

Viz2Speech

Viz2Speechは、インドネシアの視覚障害者のアクセシビリティを向上させるために開発された、画像から音声への変換エ…

#AI/ML #Python #Web UI

★ 2 ⑂ 1 MIT 2026-05-16

音楽生成

GitHub

ai-music-studio

ai-music-studioは、AMD ROCm環境で動作するローカルAIアルバム生成ツールです。単一のコンセプトからLLMによるアル…

#AMD ROCm #Docker Compose #FastAPI

★ 2 NOASSERTION 2026-04-26

音声生成 / TTS

GitHub

voice-ai-chat

このツールは、オープンソース技術（Whisper、Groq、LLaMA 3.3、gTTS、FastAPIなど）を基にゼロから構築された音声AI…

#AIチャット #Docker #FastAPI

★ 2 MIT 2026-05-25

画像生成

GitHub

models-info

このツールは、Stable Diffusion WebUI用の拡張機能「Models Info」です。Stable DiffusionのチェックポイントやLoRA…

#API連携 #Python #SD Web UI

★ 2 MIT 2026-05-28

LLM

GitHub

AI-Procurement-Intelligence-System

「AI Procurement Intelligence System」は、企業向けに設計されたAI駆動型のマルチエージェント調達インテリジェン…

#AI #LLM #マルチエージェント

★ 2 MIT 2026-06-16

3D / NeRF

GitHub

prml-vslam

このリポジトリは、スマートフォンからの未校正単眼ビデオストリームに対応したオフデバイスVSLAMベンチマークフレー…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-26

ComfyUI

GitHub

ComfyUI_PromptExtractor_nodes

ComfyUI向けのカスタムノード集で、ComfyUIが生成したPNG画像のメタデータからプロンプトを抽出できます。元のワーク…

#ComfyUI対応 #PNGメタデータ対応 #Python

★ 2 ⑂ 1 MIT 2026-04-07

音声生成 / TTS

GitHub

say-lab

Say Labは、大規模言語モデルとクラウドTTS（Text-to-Speech）を活用した軽量な自ホスト型発音練習Webページです。単…

#Go #LLM #Self-hosted

★ 2 2026-05-14

ComfyUI

GitHub

LoRA-Gallery-Loader—Custom-Node

「LoRA Gallery Node for ComfyUI」は、画像生成AIツールComfyUI用のカスタムノードです。このツールは、LoRA（Low-R…

#ComfyUI対応 #GPU必須 #Python

★ 2 ⑂ 1 2026-04-18

LLM

GitHub

megatrain-guide-cn

MegaTrainは、1枚のGPUと十分なRAMを活用し、100B以上の大規模言語モデルを効率的に訓練するための革新的なフレーム…

#CLI #GPU必須 #LLM

★ 2 ⑂ 1 MIT 2026-04-17

画像生成

GitHub

ChatGPTtoImage-SelfHost

「ChatGPTtoImage-SelfHost」は、DinhLucentによって開発された、ChatGPTの画像生成機能をセルフホストで利用するた…

#API #ChatGPT連携 #Docker

★ 2 MIT 2026-04-26

ASR / 音声認識

GitHub

rust-whisper-diarization

rust-whisper-diarizationは、純粋なRustで実装されたストリーミング音声認識と話者分離のライブラリです。whisper.c…

#ONNX #Rust #Whisper

★ 2 2026-05-23

音声生成 / TTS

GitHub

voice-channel

このツールは「voice-channel」と名付けられ、Claude Codeエージェントをハンズフリーで音声操作するためのローカル…

#Claude Code対応 #CLI #Python

★ 2 NOASSERTION 2026-06-23