3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

マルチモーダル

GitHub

clip-from-scratch

このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-12

動画生成

GitHub

mcp-litmedia

このツールは、MCP（Model Context Protocol）サーバーであり、litmedia.aiのテキストから画像生成、画像から動画生…

#AI Agent対応 #Bun #CLI

★ 1 ⑂ 2 MIT 2026-05-11

3D / NeRF

GitHub

hybrid-3d-human-reconstruction

RGB-Dカメラとグラフニューラルネットワーク、LSTM、確率的モーション推定を組み合わせた、リアルタイム動的3D人体再…

#GPU必須 #Python #PyTorch

★ 1 MIT 2026-04-20

ASR / 音声認識

GitHub

Sara-the-ai-assistant

S.A.R.A（Smart Autonomous Response Assistant）は、Pythonで構築された、JARVISにインスパイアされた完全音声制御…

#LLM #Python #Windows

★ 1 MIT 2026-06-29

LLM

GitHub

Scalable-RAG-Application

このツールは、スケーラブルで低遅延、高信頼性のAI駆動型情報検索を実現する、プロダクショングレードのマルチエー…

#AI-powered Retrieval #Low-latency #ONNX Optimized

★ 1 2026-06-01

音声生成 / TTS

GitHub

MOSSlanding

MOSSlandingは、5秒程度の音声サンプルからあらゆる声をクローンできる世界最高峰の音声クローニングTTSツールです。…

#GPU対応 #Python #オフライン動作

★ 1 2026-06-05

音声生成 / TTS

GitHub

Open-Vox

OpenVoxは、選択したテキストをグローバルショートカットで読み上げる、オープンソースかつマルチOS対応のデスクトッ…

#GPU対応 #Python #Tkinter

★ 1 NOASSERTION 2026-06-02

音声生成 / TTS

GitHub

voice-input-dist

voice-input-distは、Windows PC向けのリアルタイム音声テキスト変換アプリです。ホットキー一つで音声入力を開始・…

#Windows #テキスト入力支援 #デスクトップアプリ

★ 1 2026-06-25

LLM

GitHub

Artificial_Intelligence_Driven_Electronic_Design_Automation

AIDEA（Artificial Intelligence Driven Electronic Design Automation）は、AIを活用して半導体設計プロセスを統合…

#AI支援 #EDAツール #Python

★ 1 ⑂ 1 2026-06-25

音声生成 / TTS

GitHub

afterwords

Afterwordsは、ローカルで動作するボイスクローニングTTS（テキスト読み上げ）サーバーです。15秒のYouTubeクリップ…

#AIエージェント連携 #Apple Silicon #CLI

★ 1 MIT 2026-06-20

画像生成

GitHub

f1-physics-engine

F1物理エンジンは、F1レースにおける車の動きを言語指示に基づいてビデオ生成するAIツールです。開始フレームと「急…

#CLI #GPU必須 #HuggingFace対応

★ 1 ⑂ 1 MIT 2026-06-06

マルチモーダル

GitHub

ai-chef-multimodal-assistant

AI Chefは、自宅にある食材からレシピを生成するAI搭載のマルチモーダル料理アシスタントです。テキスト入力または食…

#CLI #OpenAI API #Python

★ 1 2026-06-09

3D / NeRF

GitHub

daily-webapp-2026-06-10-gaussiansplatlab

GaussianSplatLabは、リアルタイム放射輝度場レンダリングの画期的な技術である3D Gaussian Splatting (3DGS) の理論…

#3Dレンダリング #Web UI #インタラクティブ

★ 1 MIT 2026-06-10

ComfyUI

GitHub

runpod-comfyui-controller

RunPod上でComfyUIをインタラクティブに実行するための、費用管理機能を重視したローカルファーストなセッションコン…

#CLI #ComfyUI対応 #GPU必須

★ 1 MIT 2026-06-12

動画生成

GitHub

automate_me

「automate_me」は、YouTube動画制作を完全に自動化するフルスタックのウェブアプリケーションです。単一のダッシュ…

#AI活用 #Node.js #Python

★ 1 MIT 2026-06-12

画像生成

GitHub

Pic-generator-

FLUX GENは、FLUX.1とNVIDIA NIMによるGLM-5.1プロンプトエンハンサーを搭載した、エンタープライズグレードのAI画像…

#AI画像生成 #GPU必須 #LLM（プロンプト最適化）

★ 1 2026-06-15

動画生成

GitHub

gemini-bridge-mcp

gemini-bridge-mcpは、APIキーなしでGoogle Geminiの機能をMCP（Multi-modal Chat Protocol）サーバーとして提供する…

#APIキー不要 #Chromium #CLI

★ 1 MIT 2026-06-05

ASR / 音声認識

GitHub

dreamjournal-bot

「Dream Journal Bot」は、Telegramプラットフォームで動作する革新的な夢日記ボットです。本ボットの最大の特徴は、…

#AI活用 #Python #Telegram対応

★ 1 2026-06-18

マルチモーダル

GitHub

tinyvlm-implementation

このリポジトリは、週末プロジェクトとしてゼロから構築されたVision-Language Model (VLM) の実装と、そのマルチGPU…

#CLI #FSDP #GPU必須

★ 1 2026-05-10

LLM

GitHub

ollama-secure-gateway

このツールは、Ollamaサーバーとモバイル/ウェブアプリケーションを安全に接続するためのNode.js Expressミドルウェ…

#API #CLI #Express.js

★ 1 2026-06-18

動画生成

GitHub

seedance-2.0-api

Seedance 2.0 APIは、fal.aiを通じて提供されるByteDanceの最先端AI動画生成モデルです。テキスト、画像、または参照…

#AI #API #fal.ai

★ 1 ⑂ 2 MIT 2026-04-16

マルチモーダル

GitHub

PROSOPO

「Face AI」は、バイアス軽減に重点を置いた最先端の公平な顔認識システムです。顔検出、アライメント、埋め込み抽出…

#CLI #Docker #GPU対応

★ 1 2026-05-22

動画生成

GitHub

WaveSpeedAI-Skills

WaveSpeedAI Skillsは、700以上のメディアモデルと290以上のOpenAI互換LLMを統合したWaveSpeedAI推論プラットフォー…

#AIエージェント連携 #CLI #LLM対応

★ 1 MIT 2026-06-24

音楽生成

GitHub

Web-Arpeggiator

Web Arpeggiatorは、ブラウザ上で動作する高機能な音楽アルペジエーターです。提供されたノートシーケンスから多様な…

#JavaScript #Web PWA #Web UI

★ 1 2026-06-21