3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識

GitHub

meet-transcription

このツールは、Google Meetの録画を自動的に文字起こしするためのパイプラインです。Google Driveの指定フォルダを監…

#Deepgram #Docker #Google Meet対応

★ 7 MIT 2026-06-22

ASR / 音声認識

GitHub

MavKa

MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…

#AIボット #CLI #Linux

★ 7 ⑂ 1 MIT 2026-05-10

動画生成

GitHub

firered-director

firered-directorは、自然言語の指示に基づいてビデオ編集とディレクションを行うAIエージェントです。ユーザーは「…

#AI #CLI #LLM

★ 7 MIT 2026-05-20

ASR / 音声認識

GitHub

voice-input

本ツールは、Linux/X11を主な対象としたプッシュツートーク方式のグローバル音声入力アプリケーションです。ショート…

#GPU対応 #Linux対応 #macOS対応

★ 7 MIT 2026-06-15

マルチモーダル

GitHub

AlignedNorm

AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…

#ICML論文 #Python #Vision-Language Models

★ 7 MIT 2026-06-27

ASR / 音声認識

GitHub

tastebench

Tastebenchは、ウェブサイト、音楽、ビデオなどのコンテンツの「好み」を定量的に分析し、改善点を提示する自己評価…

#CLI #GPU不要 #Python

★ 7 ⑂ 1 MIT 2026-05-19

音声生成 / TTS

GitHub

shotfun-creator

shotfun-creatorは、画像、動画、音声、デジタルヒューマンといった多様なAIコンテンツ制作を網羅するスキル集です。…

#Agent Skill #CLI #Node.js

★ 7 ⑂ 1 NOASSERTION 2026-05-29

音声生成 / TTS

GitHub

Jarvis-MT67

JARVIS-MT67は、映画「アイアンマン」のJ.A.R.V.I.S.にインスパイアされた、常に稼働し続ける自律型AIパーソナルアシ…

#Gemini対応 #Python #カメラビジョン

★ 7 ⑂ 4 MIT 2026-04-29

画像生成

GitHub

lora-block-weight-neo

このツールは、Stable Diffusion WebUI Forge - Neo向けの拡張機能であり、LoRAのブロックレベルでの重み付けを詳細…

#GPU必須 #Python #SD 1.5対応

★ 7 MIT 2026-05-22

画像生成

GitHub

Suifeng-Canvas

随風画布（Suifeng Canvas）は、AIコンテンツクリエイター向けのデスクトップアプリケーションです。ビジュアルノー…

#AI画像生成 #Rust #TypeScript

★ 7 ⑂ 2 2026-05-31

画像生成

GitHub

codex-gpt-image-2-subscription

このツールは、ChatGPT/Codexのサブスクリプションを利用し、APIキーや従量課金なしでgpt-image-2モデルによる画像生…

#ChatGPT Subscription #Claude Code Skill #CLI

★ 7 ⑂ 2 MIT 2026-06-07

画像生成

GitHub

sd-ai

SD Studioは、Stable DiffusionとLLMを統合したAI搭載デスクトップアプリケーションです。自然言語で指示を出すだけ…

#AI #LLM連携 #Stable Diffusion

★ 7 AGPL-3.0 2026-06-29

音楽生成

GitHub

ACE-Step-Installer

このツールは、ACE-Step 1.5 AI音楽生成モデルをWindowsおよびLinuxにワンクリックでインストールする自動化されたオ…

#AI Music Generation #CLI #Linux

★ 7 ⑂ 1 GPL-3.0 2026-05-01

音声生成 / TTS

GitHub

ScriptSmith-Engine

ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…

#AI活用 #CLI #FFmpeg

★ 7 ⑂ 1 MIT 2026-06-29

ASR / 音声認識

GitHub

VibeRave

VibeRaveは、人気のあるライブコーディング環境Strudelを基盤とし、音声、テキスト、ワンクリックプリセットといった…

#LLM連携 #Node.js #Strudel対応

★ 7 AGPL-3.0 2026-05-20

音声生成 / TTS

GitHub

BridgeSpeak

BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…

#AIエージェント対応 #CLI #Python

★ 7 ⑂ 3 MIT 2026-05-10

音声生成 / TTS

GitHub

gb-speech

「paladin-t/gb-speech」は、ゲームボーイ向けのリアルタイム音声シンセサイザーです。リアルな人の声ではなく、「ト…

#CLI #C言語 #Game Boy

★ 7 MIT 2026-05-03

音声生成 / TTS

GitHub

Leva-TTS

Leva-TTSは、リアルタイム会話エージェント向けに最適化された、プロダクション志向のレバント・アラビア語と英語の…

#CLI #GPU必須 #Python

★ 7 ⑂ 1 Apache-2.0 2026-06-02

音声生成 / TTS

GitHub

VividDub

VividDubは、AIを活用した動画翻訳、吹き替え、字幕生成、ハードサブ（埋め込み字幕）除去を一体化した製品です。音…

#AI #Webサービス #クラウド連携

★ 7 2026-06-03

ComfyUI

GitHub

ComfyUI-ModelScope

ComfyUI向けのカスタムノードで、ModelScope公式APIを使い、FLUX.1-Kontext-DevとFLUX.2-Devによる画像から画像への…

#API連携 #ComfyUI対応 #Image-to-Image

★ 7 ⑂ 3 MIT 2025-11-28

AIエージェント

GitHub

harn

HarnはAIエージェントをオーケストレーションするためのプログラミング言語とランタイムです。製品コードとプロバイ…

#AIエージェントオーケストレーション #CI #CLI

★ 7 Apache-2.0 2026-07-01

ASR / 音声認識

GitHub

video-podcast-clipper

「Video Podcast Clipper」は、長尺動画からTikTokやYouTube Shorts向けのバイラルな縦型ショートクリップを自動生成…

#AIエージェント連携 #CLI #GPU推奨

★ 7 ⑂ 1 MIT 2026-05-28

LLM

GitHub

3GPP-Everything

「3GPP-Everything」は、Rel-18/19を含む全ての3GPP 5G仕様書（1270篇、約39万段落）を網羅する生産級RAG（検索拡張…

#3GPP専門 #LLM活用 #Python

★ 7 AGPL-3.0 2026-06-05

3D / NeRF

GitHub

interactive-website-navigator

このツールは、ウェブサイト訪問者をリアルタイムの音声と画面認識でガイドし、アクションを実行できるインタラクテ…

#Docker #Gemini API #GPU不要

★ 7 MIT 2026-05-17