3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Docker (234 repos)
「Docker」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub shorts-saver-bot
「YouTube Shorts Bot」は、YouTubeショート動画のURLを処理し、AI(LLMとオプションのVision機能)を活用して動画か…
★ 22 ⑂ 10 MIT 2026-05-14
動画生成 GitHub ai-short-drama
AIDrama Studioは、小説、脚本、物語のアイデアといったテキストから、AIを活用して短編ドラマ動画を自動生成する画…
★ 20 ⑂ 9 NOASSERTION 2026-04-24
マルチモーダル GitHub cognitive-companion
「Cognitive Companion」は、多世代同居家庭の高齢者介護を支援する、プライバシーを最優先したオンプレミスAIシステ…
★ 20 ⑂ 11 AGPL-3.0 2026-06-22
LLM GitHub riskkernel
RiskKernelは、AIエージェントの運用を確実にするためのリスクエンジンです。AIエージェントの暴走を防ぐために、コ…
★ 20 ⑂ 5 Apache-2.0 2026-06-20
音声生成 / TTS GitHub xiaomiTTS2OpenAITTSAPI
yshtcn/xiaomiTTS2OpenAITTSAPIは、小米MiMo TTS APIをOpenAI互換のTTS APIプロキシサービスに変換するツールです。…
★ 19 ⑂ 1 2026-04-05
LLM GitHub Video_Dariy
Video Diaryは、家庭用監視カメラの録画映像をAIで自動分析し、効率的な管理を可能にするシステムです。NASやディレ…
★ 19 ⑂ 1 Apache-2.0 2026-06-14
音声生成 / TTS GitHub SelenaCore
SelenaCoreは、インターネット接続や月額料金が一切不要な、オフラインファーストのスマートホームハブです。Raspber…
★ 19 ⑂ 1 MIT 2026-04-19
LLM GitHub ChipMATE
ChipMATEは、RTLコード生成のためのマルチエージェント推論フレームワークです。Verilog生成エージェントとPython参…
★ 19 ⑂ 2 NOASSERTION 2026-05-29
ASR / 音声認識 GitHub breeze-asr-taigi
本ツールは、MediaTekのBreeze-ASR-26モデルを基盤とした台湾語(台語)に特化した音声文字起こしツールです。NVIDIA…
★ 18 NOASSERTION 2026-06-22
音声生成 / TTS GitHub docker-kokoro
このツールは、テキスト読み上げ(TTS)サーバー「Kokoro」をDockerコンテナとして手軽にデプロイできるイメージです…
★ 18 ⑂ 3 NOASSERTION 2026-06-21
ASR / 音声認識 GitHub docker-whisper-live
hwdsl2/docker-whisper-liveは、faster-whisperを基盤とした自己ホスト型リアルタイム音声テキスト変換サーバーをDoc…
★ 17 ⑂ 1 NOASSERTION 2026-06-27
LLM GitHub rag-systems-production
このリポジトリは、エンタープライズグレードのプロダクション対応RAG (Retrieval-Augmented Generation) システムを…
★ 16 Apache-2.0 2026-03-24
マルチモーダル GitHub paddleocr-pdf-api
このツールは、PDFをOCR処理し、結果をMarkdown形式で返す自己ホスト型APIです。PaddleOCRとPaddleOCR-VLモデルを搭…
★ 15 ⑂ 4 2026-06-10
3D / NeRF GitHub Arbi-3DGSR
本ツールは、既存の3D Gaussian Splatting (3DGS) の超解像手法が抱える固定スケールレンダリングの制約を克服するた…
★ 15 ⑂ 2 MIT 2026-04-19
画像生成 GitHub dlmserve
dlmserveは、拡散型言語モデル(Diffusion LLMs)向けにOpenAI互換のHTTPサービスを提供するツールです。拡散型LLM特…
★ 15 ⑂ 1 MIT 2026-05-26
音声生成 / TTS GitHub OmniVoice-FastAPI
OmniVoice FastAPIは、多言語対応のゼロショットTTS(Text-to-Speech)エンジン「OmniVoice」の機能を、Dockerで手軽…
★ 13 ⑂ 2 Apache-2.0 2026-04-14
ASR / 音声認識 GitHub multi-modal-agent-ts
このツールは、TypeScriptで書かれたマルチモーダルAIエージェントで、画像、音声、テキストを組み合わせて処理でき…
★ 12 ⑂ 1 2026-04-17
マルチモーダル GitHub Lumen
Lumenは、チャット、ビジョンQA、テキストから画像生成、画像から画像生成、長文会話圧縮、画像共有、Telegramボット…
★ 12 NOASSERTION 2026-06-28
音声生成 / TTS GitHub sirene
Sireneは、自己ホスト型で複数のバックエンドをサポートするテキスト読み上げ(TTS)プラットフォームです。現代的な…
★ 12 ⑂ 1 MIT 2026-05-15
ASR / 音声認識 GitHub minutes
Manor OSの「Minutes」は、ソロ創業者向けに設計されたAI議事録ツールです。会議の録音、リアルタイム文字起こし、AI…
★ 11 MIT 2026-06-09
ASR / 音声認識 GitHub qwen3-asr-mt
このツールは、Qwen3-ASR向けのマルチテナントストリーミングASR(自動音声認識)サーバーです。オリジナルのFlaskデ…
★ 11 ⑂ 1 Apache-2.0 2026-06-08
マルチモーダル GitHub DGX_Spark_Unsloth_Lossless_Speedup
本プロジェクトは、NVIDIA DGX Spark上でQwen3.5 (0.8B~27B) モデルのLoRAおよびFull Fine-Tuningを劇的に高速化す…
★ 10 ⑂ 2 MIT 2026-05-19
音声生成 / TTS GitHub mimo-tts
MiMo TTSは、小米MiMo APIを活用したAIオーディオブック制作ツールです。小説のテキストファイルをアップロードする…
★ 10 ⑂ 1 MIT 2026-05-24
音声生成 / TTS GitHub omnivoice-thai-api
nanofatdog/omnivoice-thai-apiは、追加学習不要のタイ語テキスト読み上げ(TTS)APIおよびWeb UIです。Voice Clonin…
★ 9 ⑂ 5 2026-05-22