3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
AIエージェント GitHub otto
ottoは、AIエージェントの行動を改善・永続化するための「行動層」を提供するツールです。エージェントが過去の修正…
★ 6 ⑂ 1 MIT 2026-06-22
ComfyUI GitHub WavTTS-ComfyUI
WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。参照音声とテキス…
★ 6 ⑂ 1 MIT 2026-06-04
LLM GitHub pioneer
Pioneerは、手元PCや自分で管理するサーバー上で動かせるローカルファーストの個人向けAIアシスタント基盤です。永続…
★ 6 MIT 2026-06-28
マルチモーダル GitHub 35gateway
「35Gateway」は、35m.aiが開発・運営するソース利用可能なAIゲートウェイです。テキスト、画像、動画、音声、音楽と…
★ 6 ⑂ 1 NOASSERTION 2026-04-15
画像生成 GitHub M2GenCO
M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…
★ 6 2026-05-26
LLM GitHub agent-engineering-roadmap
このリポジトリは、プロンプトやRAGの段階を超え、本番環境で利用可能なAIエージェントの構築を目指す開発者向けの、…
★ 6 ⑂ 1 MIT 2026-06-26
音声生成 / TTS GitHub claude-code-audio-recap
このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…
★ 6 Apache-2.0 2026-06-18
AIエージェント GitHub Hive
Hiveは、自律的に協調し、コードを記述し、ツールを使用する永続的なAIエージェントを生成するためのローカルファー…
★ 6 MIT 2026-06-11
音声生成 / TTS GitHub chorus
Chorusは、YouTubeの長い動画コンテンツを効率的に消費するための画期的なツールです。YouTubeのURLまたは思想家の名…
★ 6 2026-04-25
音声生成 / TTS GitHub NeuTTS-Studio
NeuTTS Studioは、オンデバイスでのテキスト読み上げ(TTS)、音声クローニング、リアルタイムストリーミング機能を…
★ 6 NOASSERTION 2026-03-31
画像生成 GitHub ScribeNEO
ScribeNEOは、Stable Diffusion Forge Neo専用に開発されたプロンプトエンジニアリング拡張機能です。AIを活用し、ユ…
★ 6 MIT 2026-05-29
音楽生成 GitHub mlx-swift-audio
mlx-swift-audioは、テキストから音声への変換(TTS)と音声からテキストへの変換(STT)機能をアプリケーションに提…
★ 6 ⑂ 2 MIT 2026-06-25
ComfyUI GitHub MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 6 ⑂ 3 MIT 2026-06-04
画像生成 GitHub nanoDLM
「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル(MDM)の実装です。約110…
★ 6 ⑂ 1 2026-05-16
ASR / 音声認識 GitHub hush
HushはmacOS向けのローカルプッシュトゥトーク音声入力ツールです。指定されたショートカットキー(デフォルトはfnキ…
★ 6 ⑂ 1 MIT 2026-06-10
音声生成 / TTS GitHub Awesome-Audio-Generation
この「Awesome-Audio-Generation」リポジトリは、音声生成に関する最新の研究論文、コード、およびプロジェクトを厳…
★ 6 ⑂ 1 2025-10-11
マルチモーダル GitHub AlignedNorm
AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…
★ 6 MIT 2026-06-12
ComfyUI GitHub ComfyUI-Wildcard-Pipeline
ComfyUIのためのモジュール式プロシージャルプロンプト生成ツールです。ワイルドカード、固定値、結合、派生、制約を…
★ 6 ⑂ 2 GPL-3.0 2026-06-22
ASR / 音声認識 GitHub voxrt-asr-models
このリポジトリは、VoxRTオンデバイスランタイム向けに最適化されたASR(自動音声認識)モデルのウェイトを提供しま…
★ 6 NOASSERTION 2026-05-28
ASR / 音声認識 GitHub ai_interview
このツールは、リアルタイム音声対話、多段階面接、ライブ採点、詳細レポート生成機能を備えたAI駆動型模擬面接プラ…
★ 6 2026-06-15
ComfyUI GitHub ComfyUI-MCP-Server-Python
ComfyUI-MCP-Serverは、ComfyUIのワークフローをAIエージェントが利用可能なパラメータ設定可能なツールに変換するMC…
★ 6 MIT 2026-03-13
ASR / 音声認識 GitHub soyle
SöyleはmacOS向けのプッシュツートーク型音声認識ツールです。キーを押しながら話すと、話した内容がデバイス上で100…
★ 6 MIT 2026-06-21
画像生成 GitHub codex-gpt-image-2-subscription
このツールは、ChatGPT/Codexのサブスクリプションを利用し、APIキーや従量課金なしでgpt-image-2モデルによる画像生…
★ 6 ⑂ 2 MIT 2026-06-07
音声生成 / TTS GitHub ScriptSmith-Engine
ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…
★ 6 ⑂ 1 MIT 2026-06-23