3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS

GitHub

claude-tts

claude-ttsは、Claude CodeのAI応答を自動的に音声で読み上げるためのプラグインです。ElevenLabs、OpenAI、Google、…

#Claude Code対応 #CLI #Linux

★ 25 ⑂ 5 2026-05-29

動画生成

GitHub

image-to-animation-offline

このツールは、画像をスケッチスタイルの手描きアニメーション動画に変換するオフラインのオープンソースアプリケー…

#Android #GUI #Linux

★ 25 ⑂ 14 MIT 2026-06-11

音声生成 / TTS

GitHub

silma-tts

SILMA Arabic TTS v1は、SILMA AIによって開発された軽量かつ高性能なバイリンガル（アラビア語と英語）テキスト音声…

#CLI #GPU必須 #Python

★ 25 ⑂ 4 MIT 2026-05-07

音声生成 / TTS

GitHub

OpenAudioBookify

OpenAudioBookifyは、プレーンテキスト、マークダウン、HTML、EPUB形式のドキュメントをM4Aオーディオファイルに変換…

#Android #Ebook変換 #オフライン

★ 24 ⑂ 4 BSD-2-Clause 2026-05-26

ComfyUI

GitHub

ComfyUI-LongCat-Avatar

rookiestar28/ComfyUI-LongCat-Avatarは、ComfyUI用のカスタムノード集で、LongCat Video Avatar 1.5のオーディオ駆…

#AI/ML (推論) #ComfyUI対応 #GPU必須

★ 24 ⑂ 2 MIT 2026-06-15

ComfyUI

GitHub

ComfyUI-Sapiens2-Easy

「ComfyUI-Sapiens2-Easy」は、Meta Sapiens2モデルをComfyUIのネイティブノードとして統合するツールです。単一の画…

#3D生成 #ComfyUI対応 #GPU必須

★ 24 ⑂ 2 NOASSERTION 2026-05-04

LLM

GitHub

dotnet-rag-pgvector

.NET環境でRetrieval-Augmented Generation（RAG）とセマンティック検索を効率的に実装するためのプロジェクトです。…

#.NET #CLI #LLM

★ 24 ⑂ 6 MIT 2026-03-22

ASR / 音声認識

GitHub

SayIt

SayItは、音声入力とAIによるテキスト修正（潤色）を組み合わせたオープンソースツールであり、Typelessの代替となる…

#Windows対応 #中国語対応

★ 24 ⑂ 4 AGPL-3.0 2026-07-03

マルチモーダル

GitHub

MOSAIC

MOSAICは、強化学習（RL）、大規模言語モデル（LLM）、視覚言語モデル（VLM）、そして人間の意思決定者といった異な…

#GPU必須 #LLM #Python

★ 24 ⑂ 4 MIT 2026-04-21

動画生成

GitHub

awesome-video-diffusions

このツールは、arXivのビデオ拡散・ビデオ生成に関する最新研究論文、プロジェクト、リソースを自動更新で収集し、キ…

#arXiv連携 #BibTeXエクスポート #CLI

★ 24 2026-06-22

3D / NeRF

GitHub

EAG-PT

EAG-PTは、SIGGRAPH 2026で発表された、屋内の拡散反射シーンの再構築と編集を行うための研究プロジェクトです。Emis…

#3Dグラフィックス #CLI #GPU必須

★ 24 ⑂ 4 MIT 2026-05-22

マルチモーダル

GitHub

awesome-gemini-omni

このリポジトリは、Googleの次世代マルチモーダルAIモデル「Gemini Omni」に関する厳選されたリソース集です。テキス…

#AIモデル #Gemini Omni #Webプラットフォーム

★ 24 ⑂ 1 CC0-1.0 2026-05-31

3D / NeRF

GitHub

m2m-vector-search

「AIAI Hub」は、GitHub上のAI関連オープンソースソフトウェアを自動的に発見、要約、カテゴリ分類し、WordPressサイ…

#CLI #GitHub連携 #LLM対応

★ 24 ⑂ 8 AGPL-3.0 2026-06-21

3D / NeRF

GitHub

varsplat

VarSplatは、不確実性認識型の3D Gaussian Splattingを基盤とした堅牢なRGB-D SLAMシステムです。個々のスプラットの…

#3D Gaussian Splatting #CLI #GPU必須

★ 24 MIT 2026-06-14

マルチモーダル

GitHub

proctorai

ProctorAIは、AIを活用したリモート試験監視システムです。顔認証、ウェブカメラ、ブラウザ、音声チェックを通じて試…

#AI #Flask #Python

★ 24 2026-04-26

AIエージェント

GitHub

awesome-ai-security-tools

「Awesome AI Security Tools」は、AIセキュリティおよびAIを活用したサイバーセキュリティのための厳選されたツール…

#AIセキュリティ #サイバーセキュリティ #公開ソース

★ 24 ⑂ 9 NOASSERTION 2026-06-30

LLM

GitHub

provenant

Provenantは、AIコーディングエージェント向けに最適化されたローカルコードベースメモリソリューションです。コード…

#AIエージェント連携 #CLI #Git連携

★ 23 ⑂ 12 2026-05-28

ComfyUI

GitHub

comfyui_stereoscopic

comfyui_stereoscopic は、ComfyUI向けのカスタムノード、ワークフロー、補助スクリプトをまとめたパッケージで、通…

#CLI #ComfyUI対応 #Python

★ 23 ⑂ 5 NOASSERTION 2026-06-26

音声生成 / TTS

GitHub

mimo-mcp

mimo-mcpは、XiaomiのMiMo全モーダルAI機能（多モーダル対話、画像/動画理解、テキスト音声合成、音声クローン、音声…

#Claude Code対応 #CLI #Codex対応

★ 23 ⑂ 2 MIT 2026-06-28

ASR / 音声認識

GitHub

ariontalk

ArionTalkは、ウェブページに音声AIエージェントを追加するツールです。ユーザーがウェブページと自然な会話をできる…

#Gemini Live API #Node.js #TypeScript

★ 23 MIT 2026-04-30

3D / NeRF

GitHub

HairPort

HairPortは、画像内の顔に参照ヘアスタイルを転送する最先端の3D認識型フレームワークです。このツールは、大規模な…

#3D認識型 #GPU必須 #Python

★ 23 ⑂ 1 NOASSERTION 2026-06-12

音声生成 / TTS

GitHub

Jarvis

JARVISは、Tony StarkのAIアシスタントに触発されたMac上で動作するパーソナルAIアシスタントです。音声対話、映画の…

#CLI #macOS #Python

★ 23 ⑂ 7 2026-06-11

画像生成

GitHub

JustRayzist

JustRayzistは、Rayzist Z-Image Turboファインチューンを中心に構築された軽量なCUDAベースのローカル画像生成プラ…

#CLI #GPU必須 #Python

★ 23 ⑂ 1 Apache-2.0 2026-05-19

マルチモーダル

GitHub

ETCHR

ETCHR (Editing To Clarify and Harness Reasoning)は、質問条件に基づいて推論を意識した画像エディタです。マルチ…

#CLI #GPU必須 #Hugging Face

★ 23 NOASSERTION 2026-05-25