3,634 repos GH 3,519 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS

GitHub

shotfun-creator

shotfun-creatorは、画像、動画、音声、デジタルヒューマンといった多様なAIコンテンツ制作を網羅するスキル集です。…

#Agent Skill #CLI #Node.js

★ 7 ⑂ 1 NOASSERTION 2026-05-29

マルチモーダル

GitHub

CaptionEvalKit-for-VLMs

CaptionEvalKit-for-VLMsは、VLM（Visual Language Model）向け画像キャプション評価を再現性高く、オールインワンで…

#CLI #Docker #GPU必須

★ 7 BSD-3-Clause-Clear 2026-06-22

LLM

GitHub

mneme-ai

Mneme (μνήμη)は、AIの記憶力不足を補うために設計された「ボルトオンブレイン」です。AIがコードベースの「WHY」「W…

#AI向け記憶層 #TypeScript #オフライン対応

★ 7 ⑂ 2 MIT 2026-06-29

ASR / 音声認識

GitHub

SayIt

SayItは、音声入力とAIによるテキスト修正（潤色）を組み合わせたオープンソースツールであり、Typelessの代替となる…

#Windows対応 #中国語対応

★ 7 ⑂ 2 AGPL-3.0 2026-06-02

ComfyUI

GitHub

ComfyUI-Block-Space

ComfyUI-Block-Spaceは、人気の画像生成UIであるComfyUIのキャンバスにおいて、Figmaのような高度なレイアウトとスナ…

#ComfyUIプラグイン #ComfyUI対応 #UI強化

★ 7 ⑂ 2 MIT 2026-06-07

音声生成 / TTS

GitHub

okay-hermes-voice

「Okay Hermes Voice」は、既存の「Hermes Agent」に「Okay Hermes」というウェイクフレーズを追加し、常に音声で操…

#CLI #Linux対応 #Python

★ 7 NOASSERTION 2026-06-29

ComfyUI

GitHub

ideogram4_prompter-ComfyUI

このComfyUIカスタムノードは、Ideogram 4のMagic Prompt APIを活用し、ユーザーが入力した簡単なプロンプトを、Ideo…

#API利用 #ComfyUI対応 #Python

★ 7 ⑂ 1 MIT 2026-06-04

LLM

GitHub

a-agent

a-agentは、ターミナルベースのワークフロー向けに最適化された、単一ファイルのAIコーディングエージェントです。特…

#AI #CLI #iOS

★ 7 MIT 2026-05-19

AIエージェント

GitHub

Operon

Operonは、高度な自律型AIターミナルコックピットです。OpenClawとHermes Agentの機能を統合し、ファイル管理、ウェ…

#AIエージェント #CLI #Linux

★ 7 ⑂ 1 MIT 2026-06-01

動画生成

GitHub

firered-director

firered-directorは、自然言語の指示に基づいてビデオ編集とディレクションを行うAIエージェントです。ユーザーは「…

#AI #CLI #LLM

★ 7 MIT 2026-05-20

画像生成

GitHub

sd-ai

SD Studioは、Stable DiffusionとLLMを統合したAI搭載デスクトップアプリケーションです。自然言語で指示を出すだけ…

#AI #LLM連携 #Stable Diffusion

★ 7 AGPL-3.0 2026-06-29

画像生成

GitHub

comfyui-lora-FindingLora

「Finding LoRA — for ComfyUI」は、ComfyUIのLoRAローダーの使い勝手を大幅に改善するカスタムノードです。ブックマ…

#ComfyUI対応 #GPU必須 #Python

★ 7 ⑂ 2 2026-06-07

音声生成 / TTS

GitHub

book-v2-audio

このツールは、FB2形式の電子書籍をAIによる文学的な解説付きのオーディオブックに変換するデスクトップアプリケーシ…

#AI活用 #CLI #Python

★ 7 ⑂ 4 MIT 2026-05-24

動画生成

GitHub

Awesome-Gemini-Omni-API-Prompts

このリポジトリは、Googleのマルチモーダル動画モデル「Gemini Omni」向けの高品質なプロンプトとパターンを厳選して…

#API連携 #Gemini Omni #Python

★ 7 ⑂ 1 CC0-1.0 2026-07-01

3D / NeRF

GitHub

interactive-website-navigator

このツールは、ウェブサイト訪問者をリアルタイムの音声と画面認識でガイドし、アクションを実行できるインタラクテ…

#Docker #Gemini API #GPU不要

★ 7 MIT 2026-05-17

3D / NeRF

GitHub

stechdrive-3dgs-utils

このツールは、360度カメラで撮影した動画を、3D Gaussian Splatting（3DGS）のトレーニングに利用できる画像、マス…

#360°動画 #3DGS #GUI

★ 7 MIT 2026-05-31

ASR / 音声認識

GitHub

MavKa

MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…

#AIボット #CLI #Linux

★ 7 ⑂ 1 MIT 2026-05-10

音声生成 / TTS

GitHub

oai-tts-router

このツールは、OpenAI TTS互換のAPIインターフェースを提供する無料のTTSルーターです。Google Translate、Edge TTS…

#CLI #Docker #Node.js

★ 7 AGPL-3.0 2026-05-19

ASR / 音声認識

GitHub

tastebench

Tastebenchは、ウェブサイト、音楽、ビデオなどのコンテンツの「好み」を定量的に分析し、改善点を提示する自己評価…

#CLI #GPU不要 #Python

★ 7 ⑂ 1 MIT 2026-05-19

LLM

GitHub

cy-ai

Cypress AI (cy-ai)は、大規模言語モデル（LLM）を活用してCypressのE2E（End-to-End）テストを自動生成するコマンド…

#Cypress #E2Eテスト #JavaScript

★ 7 MIT 2026-06-25

ASR / 音声認識

GitHub

Scripta

Scriptaは、macOS向けのプライバシーを重視した会議用文字起こし＆AI要約ツールです。マイクとシステムオーディオの…

#AI #macOS #Ollama

★ 7 ⑂ 1 MIT 2026-05-21

音声生成 / TTS

GitHub

Jarvis-MT67

JARVIS-MT67は、映画「アイアンマン」のJ.A.R.V.I.S.にインスパイアされた、常に稼働し続ける自律型AIパーソナルアシ…

#Gemini対応 #Python #カメラビジョン

★ 7 ⑂ 4 MIT 2026-04-29

画像生成

GitHub

Ollama-UI

Local AIは、Ollamaを搭載した完全にオフラインでポータブルなAIワークスペースです。ユーザーは直感的なインターフ…

#GPU対応 #Ollama #Python

★ 7 ⑂ 2 MIT 2026-05-27

画像生成

GitHub

sd-faceswap

このツールは、Stable Diffusion WebUI用の高速な顔交換拡張機能「sd-faceswap」です。InsightFaceによる効率的な顔…

#CLI #GPU必須 #Python

★ 7 MIT 2026-05-19