3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
動画生成 GitHub sora-api
Mountsea AIが提供するSora 2 APIは、OpenAIの最新AIビデオ生成モデル「Sora 2 (Sora Pro, Sora2)」への安価で簡単な…
★ 2 MIT 2026-05-27
3D / NeRF GitHub 3D-Scene-Generator
このツールは、テキスト記述から完全な3Dシーンや環境を生成する画期的なAIです。ニューラルラディエンスフィールド…
★ 2 2025-11-02
画像生成 GitHub SwiftDiffusion
SwiftDiffusionは、Stable Diffusion 1.5に特化した、モダンで高速なPyQt6製GUIアプリケーションです。コマンドライ…
★ 2 ⑂ 1 MIT 2026-06-11
3D / NeRF GitHub maya-gaussian-splatting-viewport-plugin
本ツールは、Autodesk Maya Viewport 2.0内でリアルタイム3D Gaussian Splatting(.plyファイル)レンダリングを可能…
★ 2 MIT 2026-05-28
画像生成 GitHub sdx
SDXは、テキストから画像を生成するモジュール式のオープンソース拡散フレームワークです。DiTトレーニング、精密な…
★ 2 NOASSERTION 2026-07-03
音声生成 / TTS GitHub NeuralForge
NeuralForgeは、ローカルPCのハードウェアを利用して大規模言語モデル(LLM)をファインチューニングするためのツー…
★ 2 MIT 2026-07-03
音声生成 / TTS GitHub obsidian-mac-tts
「Local Mac TTS for Obsidian」は、ObsidianのノートをmacOSに内蔵された高品質なテキスト読み上げエンジンで読み上…
★ 2 2026-05-08
画像生成 GitHub Flux.2-Klein-Small-Decoder-Only
Flux.2-Klein-Small-Decoder-Onlyは、FLUX.2-klein-4BモデルとFLUX.2-small-decoder VAEを専用に利用する、実験的な…
★ 2 ⑂ 1 Apache-2.0 2026-06-18
ASR / 音声認識 GitHub IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 2 MIT 2026-06-22
3D / NeRF GitHub diff-nexel-rasterization
このリポジトリは、リアルタイムでの新規視点合成を可能にするニューラルテクスチャ付きサーフェル「Nexels」のため…
★ 2 NOASSERTION 2025-12-18
3D / NeRF GitHub tju-cv-course-project
このリポジトリは、医用画像の分類、セグメンテーション、および3D再構築に特化したコンピュータビジョンの学術プロ…
★ 2 MIT 2026-03-21
画像生成 GitHub AI-powered-Text-to-Image-Generator
「AI Image Generator」は、Stable Diffusionを搭載した高度なテキスト画像生成ツールです。自然言語のプロンプトか…
★ 2 MIT 2026-06-24
画像生成 GitHub sdxl_container
SDXL Containerは、SDXL (Stable Diffusion XL) のLoRAアダプターの訓練と推論を実行するためのDockerコンテナです。…
★ 2 Apache-2.0 2026-05-27
LLM GitHub local-doc-rag
LocalDoc RAGは、PDF/TXT/DOCX/CSVファイルに対応したブラウザのみで動作するローカルドキュメントRAGアプリケーショ…
★ 2 MIT 2026-06-29
音楽生成 GitHub melody-engine
Melody Engineは、プロンプトに基づいてインストゥルメンタル音楽を生成するツールです。GoogleのMagentaRTを薄くラ…
★ 2 Apache-2.0 2026-07-01
ASR / 音声認識 GitHub parley
Parleyは、音声指示型Vision-Language-Action(VLA)パイプライン向けのベンチマークツールキットです。このツールは…
★ 2 MIT 2026-06-23
LLM GitHub schoolwork-rag
schoolwork-ragは、PDFや講義ノートなどのローカルな学習資料を、検索可能な知識ベースに変えるプライバシー重視のRA…
★ 2 MIT 2026-05-25
LLM GitHub modelfaucet
ModelFaucetは、オープンソースのLLM配信ゲートウェイと組み込み可能なSDKです。あらゆるウェブサイト、アプリケーシ…
★ 2 NOASSERTION 2026-06-29
画像生成 GitHub prompt-to-skill
prompt-to-skillは、AIプロンプトを再利用可能なAIスキルに変換し、標準化、検証を支援するツールです。異なるAIモデ…
★ 2 2026-07-01
ASR / 音声認識 GitHub AiSRT
AISRTは、Windowsデスクトップおよびコマンドラインで動作するAI字幕生成ツールです。動画や音声ファイルからタイム…
★ 2 MIT 2026-06-19
ComfyUI GitHub DemonAlone-nodes-ComfyUI
このリポジトリは、ComfyUI用の軽量ユーティリティノード群を提供します。これらは元々XYZプロットパイプラインをサ…
★ 2 ⑂ 1 MIT 2026-07-02
3D / NeRF GitHub diff-4d-gaussian-rasterization
このリポジトリは、IROS 2025で発表されたD4DGS-SLAMで利用される、微分可能な4Dガウススプラッティングラスタライザ…
★ 2 NOASSERTION 2026-05-13
音声生成 / TTS GitHub BookVoice-AI
BookVoice-AIは、テキスト、eBook、さらには写真から高品質なAIオーディオブックを生成できるオープンソースのスタジ…
★ 2 2026-06-14
ASR / 音声認識 GitHub universal_caption
Universal Captionsは、Groq Whisper APIを活用し、任意のChromeブラウザタブでリアルタイムの音声テキスト変換キャ…
★ 2 2026-06-10