3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

動画生成
GitHub
seedance-2-api
Seedance 2 APIは、APIDotを通じて利用できる、ByteDance Seedが開発した高度なマルチモーダル動画生成モデルです。…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
mm-docqa
Jmiao11/mm-docqaは、図とテキストが混在するPDF(特に論文の図表を含む)の内容に対して質問し、引用元付きの回答を…
★ 1 MIT 2026-06-23
マルチモーダル
GitHub
loop-antigravity
loop-antigravityは、Google Antigravity (agy CLI) とGeminiの1Mトークンコンテキストおよびマルチモーダル推論能力…
★ 1 Apache-2.0 2026-06-14
ASR / 音声認識
GitHub
Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-26
ASR / 音声認識
GitHub
VoiceOfIU
VoiceOfIUは、macOS上で動作するプライベートなローカル音声アシスタントです。ウェイクワード検出、Whisper STTによ…
★ 1 Apache-2.0 2026-06-18
音声生成 / TTS
GitHub
echome
ECHOMEは、ユーザーの思考、音声、行動を高精度にクローンし自動化するオープンソースの個人AIミラーエンジンです。…
★ 1 MIT 2026-05-07
LLM
GitHub
Multi-Agent-Data-Analytics
本プロジェクトは、マルチエージェントアーキテクチャとRAG(検索拡張生成)システム、GoogleのGeminiモデルを組み合…
★ 1 Apache-2.0 2026-05-15
動画生成
GitHub
awesome-ai-youtube-shorts-prompts
このリポジトリは、AIを活用したYouTube Shortsの動画制作に特化した実践的なリソース集です。YouTuber、Shortsクリ…
★ 1 2026-04-28
LLM
GitHub
caloogy_code
Caloogy Codeは、caloogy.comのチャート作成およびAIコードエディター機能をローカルで利用できる仮想通貨定量分析ツ…
★ 1 MIT 2026-05-22
音声生成 / TTS
GitHub
SpeakPro
SpeakProは、Macのターミナル(iTerm2やその他のターミナルアプリ)で選択したテキストを、ホットキー一つで自然なニ…
★ 1 MIT 2026-05-18
ASR / 音声認識
GitHub
tiktok-extractor
このツールは、TikTokのURLから動画のメタデータ、完全な文字起こし、シーンのキーフレーム、画面上のOCRテキストを…
★ 1 MIT 2026-05-24
画像生成
GitHub
EdgeDiffusion
EdgeDiffusionは、SDXL-Lightningモデルをエッジデバイス向けに最適化し、限られたリソースでの推論を可能にする再現…
★ 1 2026-06-07
音声生成 / TTS
GitHub
tts-video-generator
この「TTS Video Generator」は、Python、ElevenLabsの音声合成、FFmpegを組み合わせて、AI音声と同期字幕付きの短い…
★ 1 ⑂ 1 MIT 2026-06-23
動画生成
GitHub
PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
マルチモーダル
GitHub
lfm2.5-vl-ane
LFM2.5-VL on the Apple Neural Engineは、LiquidAIのLFM2.5-VL-450MモデルをApple Neural Engine上で完全に動作させ…
★ 1 NOASSERTION 2026-06-16
音声生成 / TTS
GitHub
Porta
Portaは、iPhoneから任意のWebブラウザへファイルを直接ストリーミングできる、一時的でグローバルなデバイス間ファ…
★ 1 Apache-2.0 2026-06-25
音声生成 / TTS
GitHub
logica-voice
Logica Voiceは、オープンソースで音声ネイティブな会話型AIエンジンです。フルデュプレックス、マルチエージェント…
★ 1 ⑂ 1 MIT 2026-06-04
動画生成
GitHub
p-video-avatar-generator
「P-Video Avatar generator」は、PrunaAIのP-Video Avatarモデルを搭載した、無料のAIトークアバター動画生成デスク…
★ 1 ⑂ 1 MIT 2026-06-10
画像生成
GitHub
GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
ComfyUI
GitHub
ComfyUI-Selective-Sigma-Detailer
ComfyUI-Selective-Sigma-Detailerは、画像生成AI「ComfyUI」用のカスタムサンプラーです。サンプリングの途中で、画…
★ 1 ⑂ 3 MIT 2026-05-10
ASR / 音声認識
GitHub
Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-18
ASR / 音声認識
GitHub
voxline
voxlineは、macOS向けのネイティブ音声入力アプリです。ホットキーを押しながら話すだけで、あなたの声を洗練された…
★ 1 Apache-2.0 2026-06-23
3D / NeRF
GitHub
mobile-gs-scan
Pebbleは、高価な3Dスキャンサービスに代わる、NVIDIA製GPUユーザー向けのセルフホスト型3Dスキャンスタジオです。We…
★ 1 2026-05-15
ASR / 音声認識
GitHub
Story-pot
Story Potは、家族やチームの伝統や思い出を音声や動画で記録し、文字起こしして永続的に保存するモバイルファースト…
★ 1 2026-05-16