3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
マルチモーダル GitHub clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
動画生成 GitHub mcp-litmedia
このツールは、MCP(Model Context Protocol)サーバーであり、litmedia.aiのテキストから画像生成、画像から動画生…
★ 1 ⑂ 2 MIT 2026-05-11
3D / NeRF GitHub hybrid-3d-human-reconstruction
RGB-Dカメラとグラフニューラルネットワーク、LSTM、確率的モーション推定を組み合わせた、リアルタイム動的3D人体再…
★ 1 MIT 2026-04-20
ASR / 音声認識 GitHub Sara-the-ai-assistant
S.A.R.A(Smart Autonomous Response Assistant)は、Pythonで構築された、JARVISにインスパイアされた完全音声制御…
★ 1 MIT 2026-06-29
LLM GitHub Scalable-RAG-Application
このツールは、スケーラブルで低遅延、高信頼性のAI駆動型情報検索を実現する、プロダクショングレードのマルチエー…
★ 1 2026-06-01
音声生成 / TTS GitHub MOSSlanding
MOSSlandingは、5秒程度の音声サンプルからあらゆる声をクローンできる世界最高峰の音声クローニングTTSツールです。…
★ 1 2026-06-05
音声生成 / TTS GitHub Open-Vox
OpenVoxは、選択したテキストをグローバルショートカットで読み上げる、オープンソースかつマルチOS対応のデスクトッ…
★ 1 NOASSERTION 2026-06-02
音声生成 / TTS GitHub voice-input-dist
voice-input-distは、Windows PC向けのリアルタイム音声テキスト変換アプリです。ホットキー一つで音声入力を開始・…
★ 1 2026-06-25
LLM GitHub Artificial_Intelligence_Driven_Electronic_Design_Automation
AIDEA(Artificial Intelligence Driven Electronic Design Automation)は、AIを活用して半導体設計プロセスを統合…
★ 1 ⑂ 1 2026-06-25
音声生成 / TTS GitHub afterwords
Afterwordsは、ローカルで動作するボイスクローニングTTS(テキスト読み上げ)サーバーです。15秒のYouTubeクリップ…
★ 1 MIT 2026-06-20
画像生成 GitHub f1-physics-engine
F1物理エンジンは、F1レースにおける車の動きを言語指示に基づいてビデオ生成するAIツールです。開始フレームと「急…
★ 1 ⑂ 1 MIT 2026-06-06
マルチモーダル GitHub ai-chef-multimodal-assistant
AI Chefは、自宅にある食材からレシピを生成するAI搭載のマルチモーダル料理アシスタントです。テキスト入力または食…
★ 1 2026-06-09
3D / NeRF GitHub daily-webapp-2026-06-10-gaussiansplatlab
GaussianSplatLabは、リアルタイム放射輝度場レンダリングの画期的な技術である3D Gaussian Splatting (3DGS) の理論…
★ 1 MIT 2026-06-10
ComfyUI GitHub runpod-comfyui-controller
RunPod上でComfyUIをインタラクティブに実行するための、費用管理機能を重視したローカルファーストなセッションコン…
★ 1 MIT 2026-06-12
動画生成 GitHub automate_me
「automate_me」は、YouTube動画制作を完全に自動化するフルスタックのウェブアプリケーションです。単一のダッシュ…
★ 1 MIT 2026-06-12
画像生成 GitHub Pic-generator-
FLUX GENは、FLUX.1とNVIDIA NIMによるGLM-5.1プロンプトエンハンサーを搭載した、エンタープライズグレードのAI画像…
★ 1 2026-06-15
動画生成 GitHub gemini-bridge-mcp
gemini-bridge-mcpは、APIキーなしでGoogle Geminiの機能をMCP(Multi-modal Chat Protocol)サーバーとして提供する…
★ 1 MIT 2026-06-05
ASR / 音声認識 GitHub dreamjournal-bot
「Dream Journal Bot」は、Telegramプラットフォームで動作する革新的な夢日記ボットです。本ボットの最大の特徴は、…
★ 1 2026-06-18
マルチモーダル GitHub tinyvlm-implementation
このリポジトリは、週末プロジェクトとしてゼロから構築されたVision-Language Model (VLM) の実装と、そのマルチGPU…
★ 1 2026-05-10
LLM GitHub ollama-secure-gateway
このツールは、Ollamaサーバーとモバイル/ウェブアプリケーションを安全に接続するためのNode.js Expressミドルウェ…
★ 1 2026-06-18
動画生成 GitHub seedance-2.0-api
Seedance 2.0 APIは、fal.aiを通じて提供されるByteDanceの最先端AI動画生成モデルです。テキスト、画像、または参照…
★ 1 ⑂ 2 MIT 2026-04-16
マルチモーダル GitHub PROSOPO
「Face AI」は、バイアス軽減に重点を置いた最先端の公平な顔認識システムです。顔検出、アライメント、埋め込み抽出…
★ 1 2026-05-22
動画生成 GitHub WaveSpeedAI-Skills
WaveSpeedAI Skillsは、700以上のメディアモデルと290以上のOpenAI互換LLMを統合したWaveSpeedAI推論プラットフォー…
★ 1 MIT 2026-06-24
音楽生成 GitHub Web-Arpeggiator
Web Arpeggiatorは、ブラウザ上で動作する高機能な音楽アルペジエーターです。提供されたノートシーケンスから多様な…
★ 1 2026-06-21