3,625 repos GH 3,510 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
Fast-Sub
Fast Subは、動画および音声ファイル用のローカルファーストの字幕ツールです。字幕の生成と翻訳を、ユーザーのデバ…
★ 7 MIT 2026-06-30
ASR / 音声認識
GitHub
meet-transcription
このツールは、Google Meetの録画を自動的に文字起こしするためのパイプラインです。Google Driveの指定フォルダを監…
★ 7 MIT 2026-06-22
音楽生成
GitHub
ACE-Step-Installer
このツールは、ACE-Step 1.5 AI音楽生成モデルをWindowsおよびLinuxにワンクリックでインストールする自動化されたオ…
★ 7 ⑂ 1 GPL-3.0 2026-05-01
LLM
GitHub
AttributeCiteQuote
このリポジトリは、大規模言語モデル(LLMs)を用いた証拠に基づくテキスト生成に関する調査研究「Attribution, Cita…
★ 7 BSD-3-Clause 2026-04-17
LLM
GitHub
reyn
Reynは、MarkdownとYAMLで定義したスキルをもとに、LLMエージェントの処理フローを制約付きで実行・検証・再現できる…
★ 7 MIT 2026-06-28
ASR / 音声認識
GitHub
voice-input
本ツールは、Linux/X11を主な対象としたプッシュツートーク方式のグローバル音声入力アプリケーションです。ショート…
★ 7 MIT 2026-06-15
ASR / 音声認識
GitHub
hobnob
Hobnobは、クラウドやインターネット接続を必要としない、プライバシーを重視したデスクトップ会議メモアプリです。…
★ 7 NOASSERTION 2026-06-12
音声生成 / TTS
GitHub
Local-TTS-studio
Open TTSは、サーバーやAPIキーなしでデバイス上で完結する、ローカルファーストのテキスト読み上げ(TTS)スタジオ…
★ 7 Apache-2.0 2026-06-23
音声生成 / TTS
GitHub
shotfun-creator
shotfun-creatorは、画像、動画、音声、デジタルヒューマンといった多様なAIコンテンツ制作を網羅するスキル集です。…
★ 7 ⑂ 1 NOASSERTION 2026-05-29
マルチモーダル
GitHub
CaptionEvalKit-for-VLMs
CaptionEvalKit-for-VLMsは、VLM(Visual Language Model)向け画像キャプション評価を再現性高く、オールインワンで…
★ 7 BSD-3-Clause-Clear 2026-06-22
画像生成
GitHub
awesome-nano-banana-pro-prompts
このリポジトリは、Nano Banana ProとGemini 3 Pro Imageのプロンプト、AI画像生成ワークフロー、およびビジュアルデ…
★ 7 2026-04-28
ASR / 音声認識
GitHub
SayIt
SayItは、音声入力とAIによるテキスト修正(潤色)を組み合わせたオープンソースツールであり、Typelessの代替となる…
★ 7 ⑂ 2 AGPL-3.0 2026-06-02
LLM
GitHub
VORTEXRAG
VORTEXRAGは、Retrieval-Augmented Generation (RAG) システムにおけるセマンティックドリフトとコンテキスト汚染と…
★ 7 ⑂ 2 MIT 2026-06-24
ComfyUI
GitHub
ideogram4_prompter-ComfyUI
このComfyUIカスタムノードは、Ideogram 4のMagic Prompt APIを活用し、ユーザーが入力した簡単なプロンプトを、Ideo…
★ 7 ⑂ 1 MIT 2026-06-04
LLM
GitHub
kimari-local-ai
Kimariは、NVIDIA製消費者向けGPU(特にGTX 1060/1080などの古いモデル)で強力な大規模言語モデル(LLM)をローカル…
★ 7 ⑂ 1 MIT 2026-05-26
ComfyUI
GitHub
ComfyUI-Block-Space
ComfyUI-Block-Spaceは、人気の画像生成UIであるComfyUIのキャンバスにおいて、Figmaのような高度なレイアウトとスナ…
★ 7 ⑂ 2 MIT 2026-06-07
3D / NeRF
GitHub
interactive-website-navigator
このツールは、ウェブサイト訪問者をリアルタイムの音声と画面認識でガイドし、アクションを実行できるインタラクテ…
★ 7 MIT 2026-05-17
AIエージェント
GitHub
Operon
Operonは、高度な自律型AIターミナルコックピットです。OpenClawとHermes Agentの機能を統合し、ファイル管理、ウェ…
★ 7 ⑂ 1 MIT 2026-06-01
LLM
GitHub
mneme-ai
Mneme (μνήμη)は、AIの記憶力不足を補うために設計された「ボルトオンブレイン」です。AIがコードベースの「WHY」「W…
★ 7 ⑂ 2 MIT 2026-06-29
音声生成 / TTS
GitHub
okay-hermes-voice
「Okay Hermes Voice」は、既存の「Hermes Agent」に「Okay Hermes」というウェイクフレーズを追加し、常に音声で操…
★ 7 NOASSERTION 2026-06-29
動画生成
GitHub
wan2gp-operator
Wan2GP Operatorは、WanGP/Wan2GPによるテキストからビデオ生成を効率化・自動化するオープンソースのCLIツールです…
★ 7 MIT 2026-05-11
LLM
GitHub
a-agent
a-agentは、ターミナルベースのワークフロー向けに最適化された、単一ファイルのAIコーディングエージェントです。特…
★ 7 MIT 2026-05-19