3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
Awesome-Audio-Generation
この「Awesome-Audio-Generation」リポジトリは、音声生成に関する最新の研究論文、コード、およびプロジェクトを厳…
★ 6 ⑂ 1 2025-10-11
ComfyUI
GitHub
MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 6 ⑂ 3 MIT 2026-06-04
マルチモーダル
GitHub
AlignedNorm
AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…
★ 6 MIT 2026-06-12
画像生成
GitHub
dbmsolver
DBMSolverは、高品質な画像間変換(Image-to-Image Translation)を実現するための、トレーニング不要な拡散ブリッジ…
★ 6 2026-06-05
画像生成
GitHub
comfyui-lighthouse
ComfyUI用のLighthouseは、ノード間の接続関係を視覚的に明確にする非破壊的なオーバーレイツールです。クリックした…
★ 6 ⑂ 2 2026-06-07
ASR / 音声認識
GitHub
voxrt-asr-models
このリポジトリは、VoxRTオンデバイスランタイム向けに最適化されたASR(自動音声認識)モデルのウェイトを提供しま…
★ 6 NOASSERTION 2026-07-02
ASR / 音声認識
GitHub
ai_interview
このツールは、リアルタイム音声対話、多段階面接、ライブ採点、詳細レポート生成機能を備えたAI駆動型模擬面接プラ…
★ 6 2026-06-15
ComfyUI
GitHub
ComfyUI-MCP-Server-Python
ComfyUI-MCP-Serverは、ComfyUIのワークフローをAIエージェントが利用可能なパラメータ設定可能なツールに変換するMC…
★ 6 MIT 2026-03-13
ASR / 音声認識
GitHub
soyle
SöyleはmacOS向けのプッシュツートーク型音声認識ツールです。キーを押しながら話すと、話した内容がデバイス上で100…
★ 6 MIT 2026-06-21
画像生成
GitHub
codex-gpt-image-2-subscription
このツールは、ChatGPT/Codexのサブスクリプションを利用し、APIキーや従量課金なしでgpt-image-2モデルによる画像生…
★ 6 ⑂ 2 MIT 2026-06-07
音声生成 / TTS
GitHub
vocalis
Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…
★ 6 MIT 2026-05-21
画像生成
GitHub
best-ai-image-generator-resources
AI画像生成に関する最適なリソース、モデル比較フレームワーク、プロンプトガイド、編集ワークフロー、およびClipris…
★ 6 2026-04-28
音声生成 / TTS
GitHub
ScriptSmith-Engine
ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…
★ 6 ⑂ 1 MIT 2026-06-23
音楽生成
GitHub
Ace-Step-Web
「ACE-Step-Web」は、ACE-Step AI音楽生成のためのモダンなウェブインターフェースです。ダークテーマでレスポンシブ…
★ 6 2026-03-01
画像生成
GitHub
PiD-Image-Upscaler
PiD-Image-Upscalerは、NVIDIAのPiD(Pixel Diffusion Decoder)フレームワークを基盤とした、実験的な高機能超解像…
★ 6 ⑂ 2 Apache-2.0 2026-06-14
音声生成 / TTS
GitHub
mlx-indextts
MLX-IndexTTSは、Apple Silicon向けに最適化された高品質なテキスト読み上げ(TTS)ツールで、IndexTTS 1.5および2.0…
★ 6 ⑂ 1 MIT 2026-04-15
マルチモーダル
GitHub
xhs-notes-skill
xhs-notes-skillは、中国のソーシャルメディア「小紅書(XHS/RedNote)」向けの画像とテキストコンテンツ作成を支援…
★ 5 MIT 2026-06-22
画像生成
GitHub
reward-guidance
このツールは「Are we really tilting?」論文の実験コードで、フロー・拡散モデルにおける報酬ガイダンスのメカニズ…
★ 5 ⑂ 1 MIT 2026-05-07
AIエージェント
GitHub
AgentRearrange-Paper
AgentRearrangeは、Swarmsフレームワーク向けの汎用マルチエージェントオーケストレーションプリミティブです。本ツ…
★ 5 ⑂ 1 Apache-2.0 2026-06-04
LLM
GitHub
xr
XRは、BYOK(APIキー持ち込み)またはローカルモデルを利用する、セキュアで自己ホスト型のAIエージェントです。費用…
★ 5 ⑂ 1 MIT 2026-06-21
AIエージェント
GitHub
nocturne
Nocturneは、GitHubの課題を自律的に解決するコーディングオーケストレーターです。設定されたリポジトリの課題に「a…
★ 5 MIT 2026-06-22
画像生成
GitHub
nitograph
Nitographは、MNISTの数字をネオン風のストリングアートに変換し、釘から釘への連続的な糸の経路を生成するクラス条…
★ 5 2026-06-12
音声生成 / TTS
GitHub
XiaomiMiMo-TUI
XiaomiMiMo-TUIは、Xiaomi MiMo専用のターミナルTUI/CLIクライアントです。Xiaomi MiMoのToken Planに特化したOpenAI…
★ 5 NOASSERTION 2026-05-15
マルチモーダル
GitHub
glm-ocr-rs
saravananravi08/glm-ocrは、GLM-OCRビジョン言語モデルを搭載した純粋なRust製OCR推論エンジンです。PythonやPyTorc…
★ 5 2026-03-04