3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
AKIRA-AI-Voice-Assistant
AKIRAはPython製のパーソナルAI音声アシスタントで、音声コマンドにより日常のPC作業を自動化します。ウェイクワード…
★ 1 2026-06-08
ComfyUI
GitHub
ComfyUI-Selective-Sigma-Detailer
ComfyUI-Selective-Sigma-Detailerは、画像生成AI「ComfyUI」用のカスタムサンプラーです。サンプリングの途中で、画…
★ 1 ⑂ 3 MIT 2026-05-10
音声生成 / TTS
GitHub
ha-car-spoken-alerts
このツールは、Home Assistant、Piper TTS、およびVLCを連携させ、Android Autoを介して車のスピーカーからプライバ…
★ 1 MIT 2026-06-13
ASR / 音声認識
GitHub
diting-ai-bilibili-video-to-text-notes
本ツールは、Bilibiliの人気動画やプレイリストのURLから、AIを活用して自動的にMarkdown形式のスマートノートを生成…
★ 1 ⑂ 1 MIT 2026-06-26
音声生成 / TTS
GitHub
nemoflix-studio
Nemoflix Studioは、AIによる画像、動画、音声生成のためのオープンソースのクリエイティブエンジンです。ComfyUIワ…
★ 1 Apache-2.0 2026-06-16
画像生成
GitHub
DSCA-ReID-Framework
本リポジトリは、人再識別における「拡散ベースのセマンティックカモフラージュ攻撃(DSCA)」に特化した軽量なPyTor…
★ 1 MIT 2026-05-28
動画生成
GitHub
mcp-litmedia
このツールは、MCP(Model Context Protocol)サーバーであり、litmedia.aiのテキストから画像生成、画像から動画生…
★ 1 ⑂ 2 MIT 2026-05-11
ASR / 音声認識
GitHub
mixpeek-extractors
Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め…
★ 1 MIT 2026-06-16
画像生成
GitHub
lobe-image-gen
Lobe Image Genは、Lobeプラットフォーム向けの画像生成スキルです。Lobeの組み込みコマンド`lh gen image`で画像を…
★ 1 2026-05-15
動画生成
GitHub
awesome-ai-restaurant-video-prompts
このGitHubリポジトリは、AIを活用したレストランおよび食品マーケティングのビデオプロンプト、反復可能なワークフ…
★ 1 2026-04-28
3D / NeRF
GitHub
gaussian-splat-based-anomaly-detection
本ツールは、UAVで撮影した高層構造物(携帯電話基地局、風力タービン、電柱など)の画像を3D Gaussian Splatting (3…
★ 1 2026-05-17
LLM
GitHub
knowshelf
「Knowshelf」は、Go言語で書かれた個人用Markdown書籍知識ベース管理ツールです。Markdown形式の書籍をローカルのSQ…
★ 1 Apache-2.0 2026-05-18
LLM
GitHub
visually-guided-subtitle-translation
このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…
★ 1 Apache-2.0 2026-05-20
画像生成
GitHub
sonauto-ai-music-gen-saas
Sonautoは、言葉で表現したサウンドから、AIが作詞、オリジナルメロディの作曲、ユニークなカバーアート生成までを一…
★ 1 Apache-2.0 2026-05-14
音声生成 / TTS
GitHub
tts-video-generator
この「TTS Video Generator」は、Python、ElevenLabsの音声合成、FFmpegを組み合わせて、AI音声と同期字幕付きの短い…
★ 1 ⑂ 1 MIT 2026-07-02
LLM
GitHub
RePrompT
RePrompTは、電子健康記録(EHR)データを大規模言語モデル(LLM)と統合するための、時間認識型LLMフレームワークの…
★ 1 Apache-2.0 2026-04-17
画像生成
GitHub
gpt-image-2
「GPT Image 2」は、OpenAIの最新画像生成モデルを基盤とした無料のAI画像生成ツールです。テキストプロンプトから写…
★ 1 MIT 2026-06-01
画像生成
GitHub
deepbooru-tagwalker
Deepbooru TagWalkerは、Stable DiffusionのDeepbooruタグデータセットの品質を向上させるためのツールです。本ツー…
★ 1 ⑂ 1 MIT 2026-05-03
LLM
GitHub
logal-rag
「logal-rag」は、ローカルのプライベートファイルを対象に、RAG(Retrieval Augmented Generation)技術を用いてユ…
★ 1 MIT 2026-07-03
画像生成
GitHub
runpod-sdxl
dwin-gharibi/runpod-sdxlは、Runpod向けのサーバーレスGPU Stable Diffusion XLワーカーで、diffusersを基盤として…
★ 1 2026-05-24
マルチモーダル
GitHub
vlm-from-scratch
このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…
★ 1 MIT 2026-05-14
画像生成
GitHub
seedream-4.5-api
APIDot経由のSeedream 4.5 APIは、ByteDance Seedの高度な画像生成・編集モデルSeedream 4.5を利用するためのプロダ…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
whatfirst-small
whatfirst · smallは、タスクの優先順位付けを支援する、ローカルで動作する小型のビジョン言語モデル(Qwen2.5-VL-3…
★ 1 Apache-2.0 2026-06-19
画像生成
GitHub
freebieai
「FreebieAI」は、APIキー、サインアップ、課金が一切不要な無料のAI画像生成ツールです。単一の`index.html`ファイ…
★ 1 2026-06-14