3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub Clippos
Clipposは、長い動画からキャプション付きのバイラル向けソーシャルクリップを生成するAIエージェントスキルです。He…
★ 6 ⑂ 1 MIT 2026-04-26
音声生成 / TTS GitHub ghost-narrator
Ghost Narratorは、ブログや静的サイト向けに自己ホスト型のAI音声ナレーションを提供するツールです。ElevenLabsの…
★ 6 ⑂ 1 MIT 2026-06-15
画像生成 GitHub CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01
音声生成 / TTS GitHub ScriptSmith-Engine
ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…
★ 6 ⑂ 1 MIT 2026-06-23
画像生成 GitHub nanoDLM
「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル(MDM)の実装です。約110…
★ 6 ⑂ 1 2026-05-16
マルチモーダル GitHub wgram-lm
W-GRAM-LMは、世界誘導型再帰的アトラクタ言語モデルの研究用コードベースです。潜在世界予測、多軌道推論、解答アト…
★ 6 AGPL-3.0 2026-06-21
音楽生成 GitHub mlx-swift-audio
mlx-swift-audioは、テキストから音声への変換(TTS)と音声からテキストへの変換(STT)機能をアプリケーションに提…
★ 6 ⑂ 2 MIT 2026-06-25
画像生成 GitHub rocmroll
ComfyUI ROCmRollは、Windowsプラットフォーム向けのComfyUIインスタンス管理ツールです。AMD GPUとROCmパッケージに…
★ 6 MIT 2026-06-25
マルチモーダル GitHub Operator-on-Android
Operatorは、PCに接続することなく、視覚言語モデル(VLM)を使用してAndroidスマートフォンを直接操作できるオンデ…
★ 6 ⑂ 1 MIT 2026-06-17
画像生成 GitHub dbmsolver
DBMSolverは、高品質な画像間変換(Image-to-Image Translation)を実現するための、トレーニング不要な拡散ブリッジ…
★ 6 2026-06-05
動画生成 GitHub seedance-superprompt
Seedance 2.0 Superpromptは、ByteDance Seedance 2.0の動画生成プロンプト作成を支援するポータブルなプロンプトス…
★ 6 ⑂ 2 MIT 2026-05-23
音声生成 / TTS GitHub claude-code-audio-recap
このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…
★ 6 Apache-2.0 2026-06-18
ASR / 音声認識 GitHub voxrt-asr-models
このリポジトリは、VoxRTオンデバイスランタイム向けに最適化されたASR(自動音声認識)モデルのウェイトを提供しま…
★ 6 NOASSERTION 2026-05-28
LLM GitHub Claude-Agentic-Skills2.0-version
vignesh2027/Claude-Agentic-Skills2.0-versionは、Anthropic社のClaude AI向けの「AgentOS 2.0」として、135以上の…
★ 6 MIT 2026-05-20
マルチモーダル GitHub Multimodal-Edge-Node
Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…
★ 6 Apache-2.0 2026-05-01
ASR / 音声認識 GitHub ai_interview
このツールは、リアルタイム音声対話、多段階面接、ライブ採点、詳細レポート生成機能を備えたAI駆動型模擬面接プラ…
★ 6 2026-06-15
画像生成 GitHub kimodo-houdini-bridge
このツールは、NVIDIA Kimodo(テキスト駆動の3D人体モーション生成AIモデル)をSideFX Houdiniに連携させるブリッジ…
★ 6 ⑂ 1 2026-06-10
画像生成 GitHub awesome-gpt-image-2-playground
「awesome-gpt-image-2-playground」は、ブラウザで無料で利用できる唯一のGPT Image 2プロンプトライブラリです。ユ…
★ 6 NOASSERTION 2026-05-06
LLM GitHub crawl-rag
crawl-ragは、RAG(Retrieval Augmented Generation)の知識ベースファイルを生成するためのWebクローラーライブラリ…
★ 6 NOASSERTION 2026-05-01
マルチモーダル GitHub AlignedNorm
AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…
★ 6 MIT 2026-06-12
動画生成 GitHub awesome-text-to-image-ai-prompts
このGitHubリポジトリは、テキストから画像を生成するAIプロンプト、AI画像ジェネレーターのワークフロー、クリエイ…
★ 6 2026-04-28
音楽生成 GitHub PiAPI-Skills
このツールは、AIコーディングエージェントがPiAPIを介してMidjourney、Suno、Kling、Lumaなどの多様なAIモデル群を…
★ 5 MIT 2026-06-24
音声生成 / TTS GitHub arietta-voice
Arietta Voiceは、Apple Silicon Mac向けに設計された、ローカルファーストのカスタマイズ可能なAI音声アシスタント…
★ 5 Apache-2.0 2026-04-28
動画生成 GitHub ai-mandrama-skills
このツールは、AI漫劇や短劇の制作プロセス全体を支援するClaude Code Skillsパッケージです。Dreamina CLI、edge-tt…
★ 5 ⑂ 2 MIT 2026-05-17