3,626 repos GH 3,511 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
md-tts
md-ttsは、技術的なMarkdownファイルを音声で読み上げ、コードブロック、テーブル、フラッシュカードで再生をインタ…
★ 1 MIT 2026-06-04
動画生成
GitHub
NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
動画生成
GitHub
veo-3.1-api
本リポジトリは、Google DeepMindの高度なビデオ生成モデル「Veo 3.1 API」をAPIDot経由で利用するための豊富なサン…
★ 1 MIT 2026-06-14
3D / NeRF
GitHub
comfyui-splat-loader
Splat Loaderは、人気のある画像生成UIであるComfyUI用のカスタムノードです。このツールは、Gaussian Splatting形式…
★ 1 ⑂ 1 MIT 2026-06-11
マルチモーダル
GitHub
tinyvlm-implementation
このリポジトリは、週末プロジェクトとしてゼロから構築されたVision-Language Model (VLM) の実装と、そのマルチGPU…
★ 1 2026-05-10
音声生成 / TTS
GitHub
echotwin
EchoTwinは、Discordで利用できるAI音声ボットで、ユーザーの発言にクローンされた声でリアルタイムに返答します。Fi…
★ 1 MIT 2026-06-12
マルチモーダル
GitHub
japan-ocr-mini-benchmark-public
このツールは、ノイズの多い合成レシート画像、グラウンドトゥルースJSON、ローカルのLM Studioベースライン結果を含…
★ 1 NOASSERTION 2026-06-21
画像生成
GitHub
ideogram4-mps
Apple Silicon搭載Mac上で人気の画像生成モデルIdeogram 4を実行可能にするツールです。CUDAやNVIDIA GPUが不要で、M…
★ 1 MIT 2026-06-26
LLM
GitHub
pull-request-review
このツールは、GitHubのプルリクエストをAI(LLM)が自動的にレビューするGitHub Actionです。`codellama`などの指定…
★ 1 MIT 2026-06-18
画像生成
GitHub
photorealistic-ai-couple-photo-prompts
このリポジトリは、フォトリアルなAIカップル写真、ウェディング、ロマンチックなポートレートを生成するためのAIプ…
★ 1 NOASSERTION 2026-05-17
3D / NeRF
GitHub
gaussian-splatting-pytorch
このプロジェクトは、リアルタイムな新規視点合成を実現する最先端の「3D Gaussian Splatting」技術を、PyTorchのみ…
★ 1 MIT 2025-12-29
ASR / 音声認識
GitHub
AdversialQA
本ツールは、AIを活用した模擬試験シミュレーターであり、論文のPDFや履歴書をアップロードすることで、AIが厳しい質…
★ 1 2026-05-19
動画生成
GitHub
ComfyUI-AceStep_SFT
ComfyUI-AceStep_SFTは、ComfyUI内でAceStep 1.5 SFTの音楽生成を可能にする単一ノードです。テキストプロンプトから…
★ 1 MIT 2026-07-01
音声生成 / TTS
GitHub
lux-tts
LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…
★ 1 NOASSERTION 2026-05-10
ComfyUI
GitHub
MKRShift_Theme_Lab
Theme Labは、ComfyUI専用の全画面テーマワークスペースを提供する拡張機能です。このツールを使用すると、ComfyUIの…
★ 1 ⑂ 1 Apache-2.0 2026-04-05
画像生成
GitHub
claude-imagegen-skill
このClaude Codeスキルは、DALL-EによるAI画像生成、デザインシステムのインテリジェンス、およびPencil MCPとの統合…
★ 1 MIT 2026-05-30
画像生成
GitHub
comfyui-amd-plug-and-play
miradorventus/comfyui-amd-plug-and-play は、AMD GPU(Ubuntu/Mint)上でComfyUIのセットアップと実行を大幅に簡素…
★ 1 2026-05-31
音声生成 / TTS
GitHub
Voice-Command
Voice-Commandは、AI(Claude Desktop、Cowork、Claude Code、Codex CLI、Gemini CLI、LM Studioなど)を音声で完全…
★ 1 ⑂ 1 Apache-2.0 2026-06-23
音声生成 / TTS
GitHub
rvc-free-colab
rvc-free-colabは、古いGoogle Colab向けRVC学習ノートブックを、Python 3.12、numpy 2.x、torch 2.xといった最新のG…
★ 1 MIT 2026-06-02
ComfyUI
GitHub
ComfyUI-ZMongo
ComfyUI-ZMongoは、ComfyUIのワークフローデータをZMongo形式で保存、読み込み、閲覧、マスク、再利用するためのカス…
★ 1 ⑂ 1 Apache-2.0 2026-06-20
画像生成
GitHub
hermes-lemonade-llm-image-support
このプラグインは、Hermesエージェント向けにLemonade Serverを介した高速なローカル画像生成とLLM利用を可能にしま…
★ 1 MIT 2026-06-03
動画生成
GitHub
explainer-video
本ツールは、Claude Codeのスキルおよびプラグインとして機能し、製品のスクリーンショットや画面録画から、ナレーシ…
★ 1 MIT 2026-06-10
マルチモーダル
GitHub
tokensieve
tokensieveは、VLM(Vision-Language Model)を用いたVQA(Visual Question Answering)タスクにおいて、推論時の「p…
★ 1 2026-06-10