3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

マルチモーダル

GitHub

CaptionEvalKit-for-VLMs

CaptionEvalKit-for-VLMsは、VLM（Visual Language Model）向け画像キャプション評価を再現性高く、オールインワンで…

#CLI #Docker #GPU必須

★ 7 BSD-3-Clause-Clear 2026-06-22

画像生成

GitHub

comfyui-lora-FindingLora

「Finding LoRA — for ComfyUI」は、ComfyUIのLoRAローダーの使い勝手を大幅に改善するカスタムノードです。ブックマ…

#ComfyUI対応 #GPU必須 #Python

★ 7 ⑂ 2 2026-06-07

音声生成 / TTS

GitHub

book-v2-audio

このツールは、FB2形式の電子書籍をAIによる文学的な解説付きのオーディオブックに変換するデスクトップアプリケーシ…

#AI活用 #CLI #Python

★ 7 ⑂ 4 MIT 2026-05-24

動画生成

GitHub

Awesome-Gemini-Omni-API-Prompts

このリポジトリは、Googleのマルチモーダル動画モデル「Gemini Omni」向けの高品質なプロンプトとパターンを厳選して…

#API連携 #Gemini Omni #Python

★ 7 ⑂ 1 CC0-1.0 2026-07-01

LLM

GitHub

reyn

Reynは、MarkdownとYAMLで定義したスキルをもとに、LLMエージェントの処理フローを制約付きで実行・検証・再現できる…

#A2A対応 #CLI #Markdown DSL

★ 7 MIT 2026-06-28

ASR / 音声認識

GitHub

MavKa

MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…

#AIボット #CLI #Linux

★ 7 ⑂ 1 MIT 2026-05-10

ASR / 音声認識

GitHub

SayIt

SayItは、音声入力とAIによるテキスト修正（潤色）を組み合わせたオープンソースツールであり、Typelessの代替となる…

#Windows対応 #中国語対応

★ 7 ⑂ 2 AGPL-3.0 2026-06-02

ASR / 音声認識

GitHub

tastebench

Tastebenchは、ウェブサイト、音楽、ビデオなどのコンテンツの「好み」を定量的に分析し、改善点を提示する自己評価…

#CLI #GPU不要 #Python

★ 7 ⑂ 1 MIT 2026-05-19

画像生成

GitHub

sd-ai

SD Studioは、Stable DiffusionとLLMを統合したAI搭載デスクトップアプリケーションです。自然言語で指示を出すだけ…

#AI #LLM連携 #Stable Diffusion

★ 7 AGPL-3.0 2026-06-29

ASR / 音声認識

GitHub

Scripta

Scriptaは、macOS向けのプライバシーを重視した会議用文字起こし＆AI要約ツールです。マイクとシステムオーディオの…

#AI #macOS #Ollama

★ 7 ⑂ 1 MIT 2026-05-21

音声生成 / TTS

GitHub

Jarvis-MT67

JARVIS-MT67は、映画「アイアンマン」のJ.A.R.V.I.S.にインスパイアされた、常に稼働し続ける自律型AIパーソナルアシ…

#Gemini対応 #Python #カメラビジョン

★ 7 ⑂ 4 MIT 2026-04-29

画像生成

GitHub

sd-faceswap

このツールは、Stable Diffusion WebUI用の高速な顔交換拡張機能「sd-faceswap」です。InsightFaceによる効率的な顔…

#CLI #GPU必須 #Python

★ 7 MIT 2026-05-19

画像生成

GitHub

claude-skill-codex-imagegen

「claude-skill-codex-imagegen」は、AIアシスタント「Claude Code」にOpenAIの高性能画像生成モデル「gpt-image-2」…

#Claude Code対応 #CLI #OpenAI Codex CLI

★ 7 MIT 2026-05-16

音声生成 / TTS

GitHub

oai-tts-router

このツールは、OpenAI TTS互換のAPIインターフェースを提供する無料のTTSルーターです。Google Translate、Edge TTS…

#CLI #Docker #Node.js

★ 7 AGPL-3.0 2026-05-19

ComfyUI

GitHub

ideogram4_prompter-ComfyUI

このComfyUIカスタムノードは、Ideogram 4のMagic Prompt APIを活用し、ユーザーが入力した簡単なプロンプトを、Ideo…

#API利用 #ComfyUI対応 #Python

★ 7 ⑂ 1 MIT 2026-06-04

音声生成 / TTS

GitHub

gb-speech

「paladin-t/gb-speech」は、ゲームボーイ向けのリアルタイム音声シンセサイザーです。リアルな人の声ではなく、「ト…

#CLI #C言語 #Game Boy

★ 7 MIT 2026-05-03

ASR / 音声認識

GitHub

VibeRave

VibeRaveは、人気のあるライブコーディング環境Strudelを基盤とし、音声、テキスト、ワンクリックプリセットといった…

#LLM連携 #Node.js #Strudel対応

★ 7 AGPL-3.0 2026-05-20

AIエージェント

GitHub

Operon

Operonは、高度な自律型AIターミナルコックピットです。OpenClawとHermes Agentの機能を統合し、ファイル管理、ウェ…

#AIエージェント #CLI #Linux

★ 7 ⑂ 1 MIT 2026-06-01

動画生成

GitHub

awesome-text-to-image-ai-prompts

このGitHubリポジトリは、テキストから画像を生成するAIプロンプト、AI画像ジェネレーターのワークフロー、クリエイ…

#AIプロンプト集 #Webサービス連携 #ワークフロー

★ 6 2026-04-28

マルチモーダル

GitHub

35gateway

「35Gateway」は、35m.aiが開発・運営するソース利用可能なAIゲートウェイです。テキスト、画像、動画、音声、音楽と…

#AI Gateway #OpenAI互換 #Web UI

★ 6 ⑂ 1 NOASSERTION 2026-04-15

ASR / 音声認識

GitHub

hush

HushはmacOS向けのローカルプッシュトゥトーク音声入力ツールです。指定されたショートカットキー（デフォルトはfnキ…

#GUI #macOS #Whisper

★ 6 ⑂ 1 MIT 2026-06-10

音声生成 / TTS

GitHub

claude-code-audio-recap

このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…

#Claude Code Plugin #CLI #macOS

★ 6 Apache-2.0 2026-06-18

3D / NeRF

GitHub

4dgs-human-avatar-comfyui-nodes-dataset

このリポジトリは、ComfyUI向けの究極の4DGS（4D Gaussian Splatting）モジュール「Shramko-Volumetric-Bridge」と、…

#ComfyUI対応 #GPU必須 #Python

★ 6 Apache-2.0 2026-06-19

画像生成

GitHub

CAM

このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…

#CLI #GPU必須 #Python

★ 6 2026-06-01