3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
meet-transcription
このツールは、Google Meetの録画を自動的に文字起こしするためのパイプラインです。Google Driveの指定フォルダを監…
★ 7 MIT 2026-06-22
ASR / 音声認識
GitHub
MavKa
MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…
★ 7 ⑂ 1 MIT 2026-05-10
動画生成
GitHub
firered-director
firered-directorは、自然言語の指示に基づいてビデオ編集とディレクションを行うAIエージェントです。ユーザーは「…
★ 7 MIT 2026-05-20
ASR / 音声認識
GitHub
voice-input
本ツールは、Linux/X11を主な対象としたプッシュツートーク方式のグローバル音声入力アプリケーションです。ショート…
★ 7 MIT 2026-06-15
マルチモーダル
GitHub
AlignedNorm
AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…
★ 7 MIT 2026-06-27
ASR / 音声認識
GitHub
tastebench
Tastebenchは、ウェブサイト、音楽、ビデオなどのコンテンツの「好み」を定量的に分析し、改善点を提示する自己評価…
★ 7 ⑂ 1 MIT 2026-05-19
音声生成 / TTS
GitHub
shotfun-creator
shotfun-creatorは、画像、動画、音声、デジタルヒューマンといった多様なAIコンテンツ制作を網羅するスキル集です。…
★ 7 ⑂ 1 NOASSERTION 2026-05-29
音声生成 / TTS
GitHub
Jarvis-MT67
JARVIS-MT67は、映画「アイアンマン」のJ.A.R.V.I.S.にインスパイアされた、常に稼働し続ける自律型AIパーソナルアシ…
★ 7 ⑂ 4 MIT 2026-04-29
画像生成
GitHub
lora-block-weight-neo
このツールは、Stable Diffusion WebUI Forge - Neo向けの拡張機能であり、LoRAのブロックレベルでの重み付けを詳細…
★ 7 MIT 2026-05-22
画像生成
GitHub
Suifeng-Canvas
随風画布(Suifeng Canvas)は、AIコンテンツクリエイター向けのデスクトップアプリケーションです。ビジュアルノー…
★ 7 ⑂ 2 2026-05-31
画像生成
GitHub
codex-gpt-image-2-subscription
このツールは、ChatGPT/Codexのサブスクリプションを利用し、APIキーや従量課金なしでgpt-image-2モデルによる画像生…
★ 7 ⑂ 2 MIT 2026-06-07
画像生成
GitHub
sd-ai
SD Studioは、Stable DiffusionとLLMを統合したAI搭載デスクトップアプリケーションです。自然言語で指示を出すだけ…
★ 7 AGPL-3.0 2026-06-29
音楽生成
GitHub
ACE-Step-Installer
このツールは、ACE-Step 1.5 AI音楽生成モデルをWindowsおよびLinuxにワンクリックでインストールする自動化されたオ…
★ 7 ⑂ 1 GPL-3.0 2026-05-01
音声生成 / TTS
GitHub
ScriptSmith-Engine
ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…
★ 7 ⑂ 1 MIT 2026-06-29
ASR / 音声認識
GitHub
VibeRave
VibeRaveは、人気のあるライブコーディング環境Strudelを基盤とし、音声、テキスト、ワンクリックプリセットといった…
★ 7 AGPL-3.0 2026-05-20
音声生成 / TTS
GitHub
BridgeSpeak
BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…
★ 7 ⑂ 3 MIT 2026-05-10
音声生成 / TTS
GitHub
gb-speech
「paladin-t/gb-speech」は、ゲームボーイ向けのリアルタイム音声シンセサイザーです。リアルな人の声ではなく、「ト…
★ 7 MIT 2026-05-03
音声生成 / TTS
GitHub
Leva-TTS
Leva-TTSは、リアルタイム会話エージェント向けに最適化された、プロダクション志向のレバント・アラビア語と英語の…
★ 7 ⑂ 1 Apache-2.0 2026-06-02
音声生成 / TTS
GitHub
VividDub
VividDubは、AIを活用した動画翻訳、吹き替え、字幕生成、ハードサブ(埋め込み字幕)除去を一体化した製品です。音…
★ 7 2026-06-03
ComfyUI
GitHub
ComfyUI-ModelScope
ComfyUI向けのカスタムノードで、ModelScope公式APIを使い、FLUX.1-Kontext-DevとFLUX.2-Devによる画像から画像への…
★ 7 ⑂ 3 MIT 2025-11-28
ASR / 音声認識
GitHub
video-podcast-clipper
「Video Podcast Clipper」は、長尺動画からTikTokやYouTube Shorts向けのバイラルな縦型ショートクリップを自動生成…
★ 7 ⑂ 1 MIT 2026-05-28
LLM
GitHub
3GPP-Everything
「3GPP-Everything」は、Rel-18/19を含む全ての3GPP 5G仕様書(1270篇、約39万段落)を網羅する生産級RAG(検索拡張…
★ 7 AGPL-3.0 2026-06-05
3D / NeRF
GitHub
interactive-website-navigator
このツールは、ウェブサイト訪問者をリアルタイムの音声と画面認識でガイドし、アクションを実行できるインタラクテ…
★ 7 MIT 2026-05-17