3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

マルチモーダル

GitHub

awesome-gemini-omni

このリポジトリは、Googleの次世代マルチモーダルAIモデル「Gemini Omni」に関する厳選されたリソース集です。テキス…

#AIモデル #Gemini Omni #Webプラットフォーム

★ 24 ⑂ 1 CC0-1.0 2026-05-31

マルチモーダル

GitHub

MOSAIC

MOSAICは、強化学習（RL）、大規模言語モデル（LLM）、視覚言語モデル（VLM）、そして人間の意思決定者といった異な…

#GPU必須 #LLM #Python

★ 24 ⑂ 4 MIT 2026-04-21

ComfyUI

GitHub

ComfyUI-LongCat-Avatar

rookiestar28/ComfyUI-LongCat-Avatarは、ComfyUI用のカスタムノード集で、LongCat Video Avatar 1.5のオーディオ駆…

#AI/ML (推論) #ComfyUI対応 #GPU必須

★ 24 ⑂ 2 MIT 2026-06-15

動画生成

GitHub

awesome-video-diffusions

このツールは、arXivのビデオ拡散・ビデオ生成に関する最新研究論文、プロジェクト、リソースを自動更新で収集し、キ…

#arXiv連携 #BibTeXエクスポート #CLI

★ 24 2026-06-22

ASR / 音声認識

GitHub

SayIt

SayItは、音声入力とAIによるテキスト修正（潤色）を組み合わせたオープンソースツールであり、Typelessの代替となる…

#Windows対応 #中国語対応

★ 24 ⑂ 4 AGPL-3.0 2026-07-03

ComfyUI

GitHub

ComfyUI-Sapiens2-Easy

「ComfyUI-Sapiens2-Easy」は、Meta Sapiens2モデルをComfyUIのネイティブノードとして統合するツールです。単一の画…

#3D生成 #ComfyUI対応 #GPU必須

★ 24 ⑂ 2 NOASSERTION 2026-05-04

3D / NeRF

GitHub

HairPort

HairPortは、画像内の顔に参照ヘアスタイルを転送する最先端の3D認識型フレームワークです。このツールは、大規模な…

#3D認識型 #GPU必須 #Python

★ 23 ⑂ 1 NOASSERTION 2026-06-12

音声生成 / TTS

GitHub

ElBruno.Realtime

「ElBruno.Realtime」は、.NET向けのプラグイン可能なリアルタイム音声会話フレームワークです。ローカルでVAD（音声…

#.NET #LLM #リアルタイム

★ 23 ⑂ 2 MIT 2026-05-05

音声生成 / TTS

GitHub

Jarvis

JARVISは、Tony StarkのAIアシスタントに触発されたMac上で動作するパーソナルAIアシスタントです。音声対話、映画の…

#CLI #macOS #Python

★ 23 ⑂ 7 2026-06-11

音声生成 / TTS

GitHub

claude-voice

このツールは、Claude CodeのAIチャットでClaudeの応答を音声で聞くための、完全にローカルなTTS（Text-to-Speech）…

#Claude Code対応 #CLI #Python

★ 23 ⑂ 5 MIT 2026-06-15

動画生成

GitHub

awesome-grok-imagine-prompts

このリポジトリは、xAIのGrok Imagine向けに厳選された高品質な動画生成プロンプト集です。映画のような映像、アクシ…

#AI推薦 #Grok Imagine対応 #Web UI

★ 23 ⑂ 2 NOASSERTION 2026-07-01

LLM

GitHub

gemini-cli-extension

Pinecone Gemini CLI拡張機能は、Pineconeの公式拡張ツールです。このツールを利用することで、ターミナルから直接、…

#AI Agent #CLI #Document Q&A

★ 23 ⑂ 1 MIT 2026-05-20

LLM

GitHub

provenant

Provenantは、AIコーディングエージェント向けに最適化されたローカルコードベースメモリソリューションです。コード…

#AIエージェント連携 #CLI #Git連携

★ 23 ⑂ 12 2026-05-28

画像生成

GitHub

JustRayzist

JustRayzistは、Rayzist Z-Image Turboファインチューンを中心に構築された軽量なCUDAベースのローカル画像生成プラ…

#CLI #GPU必須 #Python

★ 23 ⑂ 1 Apache-2.0 2026-05-19

マルチモーダル

GitHub

ETCHR

ETCHR (Editing To Clarify and Harness Reasoning)は、質問条件に基づいて推論を意識した画像エディタです。マルチ…

#CLI #GPU必須 #Hugging Face

★ 23 NOASSERTION 2026-05-25

ASR / 音声認識

GitHub

ariontalk

ArionTalkは、ウェブページに音声AIエージェントを追加するツールです。ユーザーがウェブページと自然な会話をできる…

#Gemini Live API #Node.js #TypeScript

★ 23 MIT 2026-04-30

動画生成

GitHub

Hand2World

「Hand2World」は、自由空間での手のジェスチャーから一人称視点でのインタラクションを自動回帰的に生成する研究プ…

#Python #PyTorch #VR/AR関連

★ 23 2026-06-30

音声生成 / TTS

GitHub

mimo-mcp

mimo-mcpは、XiaomiのMiMo全モーダルAI機能（多モーダル対話、画像/動画理解、テキスト音声合成、音声クローン、音声…

#Claude Code対応 #CLI #Codex対応

★ 23 ⑂ 2 MIT 2026-06-28

ComfyUI

GitHub

comfyui_stereoscopic

comfyui_stereoscopic は、ComfyUI向けのカスタムノード、ワークフロー、補助スクリプトをまとめたパッケージで、通…

#CLI #ComfyUI対応 #Python

★ 23 ⑂ 5 NOASSERTION 2026-06-26

音楽生成

GitHub

suno-cli

suno-cliは、人気のAI音楽生成サービスSunoのv5.5機能をターミナルからフル活用できるCLIツールです。Sunoの公式API…

#AI音楽生成 #CLI #Rust

★ 22 ⑂ 9 MIT 2026-05-04

動画生成

GitHub

NextFrame

NextFrameは、AIを活用した革新的なビデオエディターおよびランタイムです。構造化されたJSONデータからビデオを生成…

#AI搭載 #CLI #macOS対応

★ 22 ⑂ 8 MIT 2026-04-26

LLM

GitHub

EEP

EEP（Entity Engagement Protocol）は、デジタルエンティティとそれに追従するクライアント（エージェント）間の、プ…

#CloudEvents対応 #TypeScript #エージェント連携

★ 22 ⑂ 6 Apache-2.0 2026-07-01

ASR / 音声認識

GitHub

anti-vocale

Anti-Vocaleは、Androidデバイス上で動作する音声メッセージ文字起こしアプリです。WhatsAppやTelegramなどから共有…

#Android App #オフライン #プライバシー重視

★ 22 MIT 2026-06-29

ASR / 音声認識

GitHub

shorts-saver-bot

「YouTube Shorts Bot」は、YouTubeショート動画のURLを処理し、AI（LLMとオプションのVision機能）を活用して動画か…

#Docker #LLM活用 #Notion連携

★ 22 ⑂ 10 MIT 2026-05-14