3,634 repos GH 3,519 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub shotfun-creator
shotfun-creatorは、画像、動画、音声、デジタルヒューマンといった多様なAIコンテンツ制作を網羅するスキル集です。…
★ 7 ⑂ 1 NOASSERTION 2026-05-29
マルチモーダル GitHub CaptionEvalKit-for-VLMs
CaptionEvalKit-for-VLMsは、VLM(Visual Language Model)向け画像キャプション評価を再現性高く、オールインワンで…
★ 7 BSD-3-Clause-Clear 2026-06-22
LLM GitHub mneme-ai
Mneme (μνήμη)は、AIの記憶力不足を補うために設計された「ボルトオンブレイン」です。AIがコードベースの「WHY」「W…
★ 7 ⑂ 2 MIT 2026-06-29
ASR / 音声認識 GitHub SayIt
SayItは、音声入力とAIによるテキスト修正(潤色)を組み合わせたオープンソースツールであり、Typelessの代替となる…
★ 7 ⑂ 2 AGPL-3.0 2026-06-02
ComfyUI GitHub ComfyUI-Block-Space
ComfyUI-Block-Spaceは、人気の画像生成UIであるComfyUIのキャンバスにおいて、Figmaのような高度なレイアウトとスナ…
★ 7 ⑂ 2 MIT 2026-06-07
音声生成 / TTS GitHub okay-hermes-voice
「Okay Hermes Voice」は、既存の「Hermes Agent」に「Okay Hermes」というウェイクフレーズを追加し、常に音声で操…
★ 7 NOASSERTION 2026-06-29
ComfyUI GitHub ideogram4_prompter-ComfyUI
このComfyUIカスタムノードは、Ideogram 4のMagic Prompt APIを活用し、ユーザーが入力した簡単なプロンプトを、Ideo…
★ 7 ⑂ 1 MIT 2026-06-04
LLM GitHub a-agent
a-agentは、ターミナルベースのワークフロー向けに最適化された、単一ファイルのAIコーディングエージェントです。特…
★ 7 MIT 2026-05-19
AIエージェント GitHub Operon
Operonは、高度な自律型AIターミナルコックピットです。OpenClawとHermes Agentの機能を統合し、ファイル管理、ウェ…
★ 7 ⑂ 1 MIT 2026-06-01
動画生成 GitHub firered-director
firered-directorは、自然言語の指示に基づいてビデオ編集とディレクションを行うAIエージェントです。ユーザーは「…
★ 7 MIT 2026-05-20
画像生成 GitHub sd-ai
SD Studioは、Stable DiffusionとLLMを統合したAI搭載デスクトップアプリケーションです。自然言語で指示を出すだけ…
★ 7 AGPL-3.0 2026-06-29
画像生成 GitHub comfyui-lora-FindingLora
「Finding LoRA — for ComfyUI」は、ComfyUIのLoRAローダーの使い勝手を大幅に改善するカスタムノードです。ブックマ…
★ 7 ⑂ 2 2026-06-07
音声生成 / TTS GitHub book-v2-audio
このツールは、FB2形式の電子書籍をAIによる文学的な解説付きのオーディオブックに変換するデスクトップアプリケーシ…
★ 7 ⑂ 4 MIT 2026-05-24
動画生成 GitHub Awesome-Gemini-Omni-API-Prompts
このリポジトリは、Googleのマルチモーダル動画モデル「Gemini Omni」向けの高品質なプロンプトとパターンを厳選して…
★ 7 ⑂ 1 CC0-1.0 2026-07-01
3D / NeRF GitHub interactive-website-navigator
このツールは、ウェブサイト訪問者をリアルタイムの音声と画面認識でガイドし、アクションを実行できるインタラクテ…
★ 7 MIT 2026-05-17
3D / NeRF GitHub stechdrive-3dgs-utils
このツールは、360度カメラで撮影した動画を、3D Gaussian Splatting(3DGS)のトレーニングに利用できる画像、マス…
★ 7 MIT 2026-05-31
ASR / 音声認識 GitHub MavKa
MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…
★ 7 ⑂ 1 MIT 2026-05-10
音声生成 / TTS GitHub oai-tts-router
このツールは、OpenAI TTS互換のAPIインターフェースを提供する無料のTTSルーターです。Google Translate、Edge TTS…
★ 7 AGPL-3.0 2026-05-19
ASR / 音声認識 GitHub tastebench
Tastebenchは、ウェブサイト、音楽、ビデオなどのコンテンツの「好み」を定量的に分析し、改善点を提示する自己評価…
★ 7 ⑂ 1 MIT 2026-05-19
LLM GitHub cy-ai
Cypress AI (cy-ai)は、大規模言語モデル(LLM)を活用してCypressのE2E(End-to-End)テストを自動生成するコマンド…
★ 7 MIT 2026-06-25
ASR / 音声認識 GitHub Scripta
Scriptaは、macOS向けのプライバシーを重視した会議用文字起こし&AI要約ツールです。マイクとシステムオーディオの…
★ 7 ⑂ 1 MIT 2026-05-21
音声生成 / TTS GitHub Jarvis-MT67
JARVIS-MT67は、映画「アイアンマン」のJ.A.R.V.I.S.にインスパイアされた、常に稼働し続ける自律型AIパーソナルアシ…
★ 7 ⑂ 4 MIT 2026-04-29
画像生成 GitHub Ollama-UI
Local AIは、Ollamaを搭載した完全にオフラインでポータブルなAIワークスペースです。ユーザーは直感的なインターフ…
★ 7 ⑂ 2 MIT 2026-05-27
画像生成 GitHub sd-faceswap
このツールは、Stable Diffusion WebUI用の高速な顔交換拡張機能「sd-faceswap」です。InsightFaceによる効率的な顔…
★ 7 MIT 2026-05-19