3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
claude-tts
claude-ttsは、Claude CodeのAI応答を自動的に音声で読み上げるためのプラグインです。ElevenLabs、OpenAI、Google、…
★ 25 ⑂ 5 2026-05-29
動画生成
GitHub
image-to-animation-offline
このツールは、画像をスケッチスタイルの手描きアニメーション動画に変換するオフラインのオープンソースアプリケー…
★ 25 ⑂ 14 MIT 2026-06-11
音声生成 / TTS
GitHub
silma-tts
SILMA Arabic TTS v1は、SILMA AIによって開発された軽量かつ高性能なバイリンガル(アラビア語と英語)テキスト音声…
★ 25 ⑂ 4 MIT 2026-05-07
音声生成 / TTS
GitHub
OpenAudioBookify
OpenAudioBookifyは、プレーンテキスト、マークダウン、HTML、EPUB形式のドキュメントをM4Aオーディオファイルに変換…
★ 24 ⑂ 4 BSD-2-Clause 2026-05-26
ComfyUI
GitHub
ComfyUI-LongCat-Avatar
rookiestar28/ComfyUI-LongCat-Avatarは、ComfyUI用のカスタムノード集で、LongCat Video Avatar 1.5のオーディオ駆…
★ 24 ⑂ 2 MIT 2026-06-15
ComfyUI
GitHub
ComfyUI-Sapiens2-Easy
「ComfyUI-Sapiens2-Easy」は、Meta Sapiens2モデルをComfyUIのネイティブノードとして統合するツールです。単一の画…
★ 24 ⑂ 2 NOASSERTION 2026-05-04
LLM
GitHub
dotnet-rag-pgvector
.NET環境でRetrieval-Augmented Generation(RAG)とセマンティック検索を効率的に実装するためのプロジェクトです。…
★ 24 ⑂ 6 MIT 2026-03-22
ASR / 音声認識
GitHub
SayIt
SayItは、音声入力とAIによるテキスト修正(潤色)を組み合わせたオープンソースツールであり、Typelessの代替となる…
★ 24 ⑂ 4 AGPL-3.0 2026-07-03
マルチモーダル
GitHub
MOSAIC
MOSAICは、強化学習(RL)、大規模言語モデル(LLM)、視覚言語モデル(VLM)、そして人間の意思決定者といった異な…
★ 24 ⑂ 4 MIT 2026-04-21
動画生成
GitHub
awesome-video-diffusions
このツールは、arXivのビデオ拡散・ビデオ生成に関する最新研究論文、プロジェクト、リソースを自動更新で収集し、キ…
★ 24 2026-06-22
3D / NeRF
GitHub
EAG-PT
EAG-PTは、SIGGRAPH 2026で発表された、屋内の拡散反射シーンの再構築と編集を行うための研究プロジェクトです。Emis…
★ 24 ⑂ 4 MIT 2026-05-22
マルチモーダル
GitHub
awesome-gemini-omni
このリポジトリは、Googleの次世代マルチモーダルAIモデル「Gemini Omni」に関する厳選されたリソース集です。テキス…
★ 24 ⑂ 1 CC0-1.0 2026-05-31
3D / NeRF
GitHub
m2m-vector-search
「AIAI Hub」は、GitHub上のAI関連オープンソースソフトウェアを自動的に発見、要約、カテゴリ分類し、WordPressサイ…
★ 24 ⑂ 8 AGPL-3.0 2026-06-21
3D / NeRF
GitHub
varsplat
VarSplatは、不確実性認識型の3D Gaussian Splattingを基盤とした堅牢なRGB-D SLAMシステムです。個々のスプラットの…
★ 24 MIT 2026-06-14
マルチモーダル
GitHub
proctorai
ProctorAIは、AIを活用したリモート試験監視システムです。顔認証、ウェブカメラ、ブラウザ、音声チェックを通じて試…
★ 24 2026-04-26
LLM
GitHub
provenant
Provenantは、AIコーディングエージェント向けに最適化されたローカルコードベースメモリソリューションです。コード…
★ 23 ⑂ 12 2026-05-28
ComfyUI
GitHub
comfyui_stereoscopic
comfyui_stereoscopic は、ComfyUI向けのカスタムノード、ワークフロー、補助スクリプトをまとめたパッケージで、通…
★ 23 ⑂ 5 NOASSERTION 2026-06-26
音声生成 / TTS
GitHub
mimo-mcp
mimo-mcpは、XiaomiのMiMo全モーダルAI機能(多モーダル対話、画像/動画理解、テキスト音声合成、音声クローン、音声…
★ 23 ⑂ 2 MIT 2026-06-28
ASR / 音声認識
GitHub
ariontalk
ArionTalkは、ウェブページに音声AIエージェントを追加するツールです。ユーザーがウェブページと自然な会話をできる…
★ 23 MIT 2026-04-30
3D / NeRF
GitHub
HairPort
HairPortは、画像内の顔に参照ヘアスタイルを転送する最先端の3D認識型フレームワークです。このツールは、大規模な…
★ 23 ⑂ 1 NOASSERTION 2026-06-12
音声生成 / TTS
GitHub
Jarvis
JARVISは、Tony StarkのAIアシスタントに触発されたMac上で動作するパーソナルAIアシスタントです。音声対話、映画の…
★ 23 ⑂ 7 2026-06-11
画像生成
GitHub
JustRayzist
JustRayzistは、Rayzist Z-Image Turboファインチューンを中心に構築された軽量なCUDAベースのローカル画像生成プラ…
★ 23 ⑂ 1 Apache-2.0 2026-05-19
マルチモーダル
GitHub
ETCHR
ETCHR (Editing To Clarify and Harness Reasoning)は、質問条件に基づいて推論を意識した画像エディタです。マルチ…
★ 23 NOASSERTION 2026-05-25