3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

動画生成
GitHub
gemini-bridge-mcp
gemini-bridge-mcpは、APIキーなしでGoogle Geminiの機能をMCP(Multi-modal Chat Protocol)サーバーとして提供する…
★ 1 MIT 2026-06-05
画像生成
GitHub
DSCA-ReID-Framework
本リポジトリは、人再識別における「拡散ベースのセマンティックカモフラージュ攻撃(DSCA)」に特化した軽量なPyTor…
★ 1 MIT 2026-05-28
動画生成
GitHub
mcp-litmedia
このツールは、MCP(Model Context Protocol)サーバーであり、litmedia.aiのテキストから画像生成、画像から動画生…
★ 1 ⑂ 2 MIT 2026-05-11
AIエージェント
GitHub
coder-crew
coder-crewは、テスト駆動型のエージェントAIコーディングツールです。マネージャーモデルがコーディングタスクをサ…
★ 1 MIT 2026-06-18
画像生成
GitHub
lobe-image-gen
Lobe Image Genは、Lobeプラットフォーム向けの画像生成スキルです。Lobeの組み込みコマンド`lh gen image`で画像を…
★ 1 2026-05-15
ASR / 音声認識
GitHub
Jarvis
Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…
★ 1 2026-06-17
動画生成
GitHub
awesome-ai-restaurant-video-prompts
このGitHubリポジトリは、AIを活用したレストランおよび食品マーケティングのビデオプロンプト、反復可能なワークフ…
★ 1 2026-04-28
3D / NeRF
GitHub
gaussian-splat-based-anomaly-detection
本ツールは、UAVで撮影した高層構造物(携帯電話基地局、風力タービン、電柱など)の画像を3D Gaussian Splatting (3…
★ 1 2026-05-17
LLM
GitHub
knowshelf
「Knowshelf」は、Go言語で書かれた個人用Markdown書籍知識ベース管理ツールです。Markdown形式の書籍をローカルのSQ…
★ 1 Apache-2.0 2026-05-18
LLM
GitHub
visually-guided-subtitle-translation
このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…
★ 1 Apache-2.0 2026-05-20
画像生成
GitHub
sonauto-ai-music-gen-saas
Sonautoは、言葉で表現したサウンドから、AIが作詞、オリジナルメロディの作曲、ユニークなカバーアート生成までを一…
★ 1 Apache-2.0 2026-05-14
LLM
GitHub
rag-agent
このツールは、本番環境に対応したRAG(検索拡張生成)とAIエージェントプラットフォームです。高密度、BM25、RRFを…
★ 1 2026-05-26
音楽生成
GitHub
reelsmith
AIを活用し、写真や動画のフォルダーから高解像度のハイライトリールを自動生成するコマンドラインツール「reelsmith…
★ 1 Apache-2.0 2026-06-16
ASR / 音声認識
GitHub
VoiceAgentAI
このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識(STT)と音声合成(TTS)をシー…
★ 1 MIT 2026-05-25
ASR / 音声認識
GitHub
language-violence-intervention-system
本プロジェクトは、プライバシーを重視したエッジAIによる言語暴力検出および能動的介入システムです。Raspberry Pi …
★ 1 ⑂ 1 Apache-2.0 2026-06-25
ASR / 音声認識
GitHub
Multimodal-Emotion-Recognition-System
このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…
★ 1 2026-06-08
音声生成 / TTS
GitHub
ha-car-spoken-alerts
このツールは、Home Assistant、Piper TTS、およびVLCを連携させ、Android Autoを介して車のスピーカーからプライバ…
★ 1 MIT 2026-06-13
マルチモーダル
GitHub
vlm-from-scratch
このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…
★ 1 MIT 2026-05-14
ASR / 音声認識
GitHub
diting-ai-bilibili-video-to-text-notes
本ツールは、Bilibiliの人気動画やプレイリストのURLから、AIを活用して自動的にMarkdown形式のスマートノートを生成…
★ 1 ⑂ 1 MIT 2026-06-26
AIエージェント
GitHub
deepscene
DeepSceneは、オープンソースのビデオ-ストーリーボードCLIエージェントであり、低コストで動画の深い理解を実現しま…
★ 1 MIT 2026-05-14
音声生成 / TTS
GitHub
nemoflix-studio
Nemoflix Studioは、AIによる画像、動画、音声生成のためのオープンソースのクリエイティブエンジンです。ComfyUIワ…
★ 1 Apache-2.0 2026-06-16
ASR / 音声認識
GitHub
mixpeek-extractors
Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め…
★ 1 MIT 2026-06-16
LLM
GitHub
RAG_pipelines
このツールは、RAG (Retrieval-Augmented Generation) システムの設計と構築を目的とした実験的なリポジトリです。デ…
★ 1 MIT 2026-05-26
音声生成 / TTS
GitHub
Omnicut
OmniCutは、動画編集、音声ミキシング、写真編集、カラーグレーディング、AIを活用したコンテンツ作成機能を統合した…
★ 1 MIT 2026-05-21