3,631 repos GH 3,516 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

LLM

GitHub

mothrag

MothRAGは、GPUやファインチューニングを必要とせず、市販のLLM APIのみで研究SOTAと同等の性能を発揮する、決定論的…

#CLI #GPU不要 #LLM API統合

★ 15 ⑂ 1 Apache-2.0 2026-06-23

音声生成 / TTS

GitHub

Auris

Aurisは、EPUB、PDF、TXT形式の電子書籍をオフラインでオーディオブックとして楽しむためのツールです。ローカルで動…

#CLI #GPU対応 #Python

★ 15 ⑂ 1 MIT 2026-05-12

LLM

GitHub

Forge-Agentic-Coding-CLI

Forgeは、ローカルファーストで計画重視のマルチエージェント型ソフトウェアエンジニアリング実行環境です。Claude C…

#CLI #LLM連携 #Node.js

★ 15 ⑂ 9 MIT 2026-06-29

画像生成

GitHub

npedit

NP-Editは、画像編集モデルの学習において画像編集ペアデータが不要な画期的な手法を提案する、ICLR 2026で発表され…

#CLI #GPU必須 #HuggingFace

★ 15 ⑂ 1 MIT 2026-05-05

LLM

GitHub

pi-diff-review

「pi-diff-review」は、`pi`プラットフォームに統合されたコードレビューツールです。開発者は`pi`のインターフェー…

#AI #CLI #Git

★ 15 ⑂ 1 MIT 2026-06-16

マルチモーダル

GitHub

paddleocr-pdf-api

このツールは、PDFをOCR処理し、結果をMarkdown形式で返す自己ホスト型APIです。PaddleOCRとPaddleOCR-VLモデルを搭…

#Docker #GPU必須 #Markdown出力

★ 15 ⑂ 4 2026-06-10

LLM

GitHub

permafrost

Permafrostは、Claude CodeとDeepSeekの間に入り、Claude Codeのプロンプト接頭辞を固定することで、DeepSeekの自動…

#Claude Code #CLI #DeepSeek

★ 15 ⑂ 2 MIT 2026-06-23

3D / NeRF

GitHub

SLARM

SLARMは、動的なシーンの再構築、セマンティックな理解、リアルタイムストリーミング推論を統合するフィードフォワー…

#CLI #GPU必須 #Python

★ 15 MIT 2026-06-09

ASR / 音声認識

GitHub

OpenFlow

Openflowは、Windowsデスクトップ向けに設計されたディクテーションアプリです。ユーザーが`Ctrl + Win`を押している…

#AIテキスト処理 #Electron #Windows

★ 15 ⑂ 2 MIT 2026-05-28

マルチモーダル

GitHub

WikiSeeker

WikiSeekerは、知識ベースの視覚的質問応答（KB-VQA）のために開発された革新的なマルチモーダルRAGフレームワークで…

#CLI #LLM #Python

★ 15 Apache-2.0 2026-04-18

LLM

GitHub

ECG-Language-Models

このリポジトリは、ECG（心電図）言語モデル（ELM）のファインチューニングと評価のための研究フレームワークです。…

#CLI #GPU必須 #HuggingFace

★ 15 ⑂ 2 MIT 2026-06-24

3D / NeRF

GitHub

VLM-Instruct-FastGS

VLM-Instruct-FastGSは、3D Gaussian Splatting技術を拡張し、Vision-Language Models (VLM) からのセマンティックガ…

#3D Gaussian Splatting #GPU必須 #Python

★ 15 NOASSERTION 2026-03-05

3D / NeRF

GitHub

UnrealEngine5-Skills

UnrealEngine5-Skillsは、Unreal Engine 5.6/5.7向けの再利用可能なワークフローを提供するスキルパックです。ブルー…

#Blueprint #C++ #PCG

★ 15 ⑂ 2 MIT 2026-06-29

マルチモーダル

GitHub

GalamseyWatch

このツールは、Sentinel-2衛星画像から違法な小規模金採掘（ガラッセイ）を検出するエージェント型地球観測システム…

#AI/ML #Hugging Face #Python

★ 15 ⑂ 6 MIT 2026-05-05

マルチモーダル

GitHub

Qwen3-VL-Video-Grounding

Qwen3-VL-Video-Groundingは、Qwen3-VL多モーダル画像言語モデルを活用したGradioベースのWebアプリケーションです。…

#AIモデル使用 #GPU利用 #Gradio

★ 15 ⑂ 3 Apache-2.0 2026-02-28

LLM

GitHub

exprompt

eXpromptは、LLM (大規模言語モデル) 向けのオープンソースCLIプロンプト圧縮ツールです。AIプロンプトからフィラー…

#CLI #Go #LLM対応

★ 15 MIT 2026-05-17

音声生成 / TTS

GitHub

OmniVoice-FastAPI

OmniVoice FastAPIは、多言語対応のゼロショットTTS（Text-to-Speech）エンジン「OmniVoice」の機能を、Dockerで手軽…

#Docker #FastAPI #GPU/CPU対応

★ 15 ⑂ 2 Apache-2.0 2026-04-14

ComfyUI

GitHub

atlascloud_comfyui

atlascloud_comfyuiは、ComfyUIユーザー向けに、Atlas Cloudの300種類以上のAIモデルを直接ComfyUI内で利用可能にす…

#API利用 #ComfyUI対応 #GPU不要

★ 15 ⑂ 1 MIT 2026-06-26

音声生成 / TTS

GitHub

ringback

ringbackは、AIエージェントが電話を介してユーザーと直接対話できるModel Context Protocol (MCP) サーバーです。無…

#AIエージェント連携 #CLI #Python

★ 15 ⑂ 2 Apache-2.0 2026-06-23

マルチモーダル

GitHub

eyeroll

eyerollは、AIがビデオ映像を「見て、理解し、行動する」ためのツールです。画面録画、Loom動画、YouTubeリンク、ス…

#AI/LLM #Claude Code対応 #CLI

★ 15 ⑂ 1 MIT 2026-05-14

3D / NeRF

GitHub

BrainDance

BrainDanceは、3D Gaussian Splatting（高斯泼溅）技術を利用して、現実空間をインタラクティブで回顧可能なホログラ…

#3DGS対応 #Python #RAG

★ 15 ⑂ 1 NOASSERTION 2026-06-24

画像生成

GitHub

JoyBoy

JoyBoyは、チャット、コーディング、画像生成、画像編集、動画実験、モデル管理といった多様なAIワークフローを統合…

#GPU必須 #Ollama対応 #Python

★ 15 ⑂ 7 Apache-2.0 2026-06-26

音楽生成

GitHub

ai-audio-tools

このリポジトリは、AIを活用したオーディオおよび音楽関連ツールの包括的なコミュニティリストです。楽曲のゼロから…

#AI #Webサービス #オーディオ処理

★ 15 ⑂ 3 NOASSERTION 2026-02-28

ComfyUI

GitHub

SilkStack-Image-Browser

SilkStack Image Browserは、AI生成画像をオフラインで管理・閲覧するためのローカル画像ブラウザ兼マネージャーです…

#Automatic1111対応 #ComfyUI対応 #Stable Diffusion対応

★ 14 ⑂ 4 MPL-2.0 2026-06-23