3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

動画生成

GitHub

gemini-bridge-mcp

gemini-bridge-mcpは、APIキーなしでGoogle Geminiの機能をMCP（Multi-modal Chat Protocol）サーバーとして提供する…

#APIキー不要 #Chromium #CLI

★ 1 MIT 2026-06-05

画像生成

GitHub

DSCA-ReID-Framework

本リポジトリは、人再識別における「拡散ベースのセマンティックカモフラージュ攻撃（DSCA）」に特化した軽量なPyTor…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-28

動画生成

GitHub

mcp-litmedia

このツールは、MCP（Model Context Protocol）サーバーであり、litmedia.aiのテキストから画像生成、画像から動画生…

#AI Agent対応 #Bun #CLI

★ 1 ⑂ 2 MIT 2026-05-11

AIエージェント

GitHub

coder-crew

coder-crewは、テスト駆動型のエージェントAIコーディングツールです。マネージャーモデルがコーディングタスクをサ…

#CLI #Ollama #Python

★ 1 MIT 2026-06-18

画像生成

GitHub

lobe-image-gen

Lobe Image Genは、Lobeプラットフォーム向けの画像生成スキルです。Lobeの組み込みコマンド`lh gen image`で画像を…

#AI Agent #API #CLI

★ 1 2026-05-15

ASR / 音声認識

GitHub

Jarvis

Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…

#AI / 機械学習 #CLI #OpenCV

★ 1 2026-06-17

動画生成

GitHub

awesome-ai-restaurant-video-prompts

このGitHubリポジトリは、AIを活用したレストランおよび食品マーケティングのビデオプロンプト、反復可能なワークフ…

#AI/ML #GitHubリポジトリ #プロンプト集

★ 1 2026-04-28

3D / NeRF

GitHub

gaussian-splat-based-anomaly-detection

本ツールは、UAVで撮影した高層構造物（携帯電話基地局、風力タービン、電柱など）の画像を3D Gaussian Splatting (3…

#CLI #GPU必須 #Python

★ 1 2026-05-17

LLM

GitHub

knowshelf

「Knowshelf」は、Go言語で書かれた個人用Markdown書籍知識ベース管理ツールです。Markdown形式の書籍をローカルのSQ…

#CLI #Go #Markdown

★ 1 Apache-2.0 2026-05-18

LLM

GitHub

visually-guided-subtitle-translation

このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-05-20

画像生成

GitHub

sonauto-ai-music-gen-saas

Sonautoは、言葉で表現したサウンドから、AIが作詞、オリジナルメロディの作曲、ユニークなカバーアート生成までを一…

#AI生成 #GPU必須 #Next.js

★ 1 Apache-2.0 2026-05-14

LLM

GitHub

rag-agent

このツールは、本番環境に対応したRAG（検索拡張生成）とAIエージェントプラットフォームです。高密度、BM25、RRFを…

#CLI #Docker #FastAPI

★ 1 2026-05-26

音楽生成

GitHub

reelsmith

AIを活用し、写真や動画のフォルダーから高解像度のハイライトリールを自動生成するコマンドラインツール「reelsmith…

#AI #CLI #FFmpeg

★ 1 Apache-2.0 2026-06-16

ASR / 音声認識

GitHub

VoiceAgentAI

このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識（STT）と音声合成（TTS）をシー…

#CLI #OpenAI API連携 #Python

★ 1 MIT 2026-05-25

ASR / 音声認識

GitHub

language-violence-intervention-system

本プロジェクトは、プライバシーを重視したエッジAIによる言語暴力検出および能動的介入システムです。Raspberry Pi …

#Python #Raspberry Pi対応 #Web UI

★ 1 ⑂ 1 Apache-2.0 2026-06-25

ASR / 音声認識

GitHub

Multimodal-Emotion-Recognition-System

このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…

#CLI #Machine Learning #Python

★ 1 2026-06-08

音声生成 / TTS

GitHub

ha-car-spoken-alerts

このツールは、Home Assistant、Piper TTS、およびVLCを連携させ、Android Autoを介して車のスピーカーからプライバ…

#Android Auto #CLI #Home Assistant

★ 1 MIT 2026-06-13

マルチモーダル

GitHub

vlm-from-scratch

このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…

#GPU必須 #Hugging Face #Python

★ 1 MIT 2026-05-14

ASR / 音声認識

GitHub

diting-ai-bilibili-video-to-text-notes

本ツールは、Bilibiliの人気動画やプレイリストのURLから、AIを活用して自動的にMarkdown形式のスマートノートを生成…

#AI利用 #API利用 #Bilibili対応

★ 1 ⑂ 1 MIT 2026-06-26

AIエージェント

GitHub

deepscene

DeepSceneは、オープンソースのビデオ-ストーリーボードCLIエージェントであり、低コストで動画の深い理解を実現しま…

#CLI #Gemini Flash対応 #Linux対応

★ 1 MIT 2026-05-14

音声生成 / TTS

GitHub

nemoflix-studio

Nemoflix Studioは、AIによる画像、動画、音声生成のためのオープンソースのクリエイティブエンジンです。ComfyUIワ…

#API-first #ComfyUI対応 #GPU必須

★ 1 Apache-2.0 2026-06-16

ASR / 音声認識

GitHub

mixpeek-extractors

Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め…

#API #CLI #Multimodal

★ 1 MIT 2026-06-16

LLM

GitHub

RAG_pipelines

このツールは、RAG (Retrieval-Augmented Generation) システムの設計と構築を目的とした実験的なリポジトリです。デ…

#CLI #PDF extraction #Python

★ 1 MIT 2026-05-26

音声生成 / TTS

GitHub

Omnicut

OmniCutは、動画編集、音声ミキシング、写真編集、カラーグレーディング、AIを活用したコンテンツ作成機能を統合した…

#AI対応 #JavaScript #Web対応

★ 1 MIT 2026-05-21