3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Docker (234 repos)

「Docker」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

breeze-asr-taigi

本ツールは、MediaTekのBreeze-ASR-26モデルを基盤とした台湾語（台語）に特化した音声文字起こしツールです。NVIDIA…

#CLI #Docker #GPU必須

★ 18 NOASSERTION 2026-06-22

音声生成 / TTS

GitHub

docker-kokoro

このツールは、テキスト読み上げ（TTS）サーバー「Kokoro」をDockerコンテナとして手軽にデプロイできるイメージです…

#Docker #GPU対応 #OpenAI API互換

★ 18 ⑂ 3 NOASSERTION 2026-06-21

ASR / 音声認識

GitHub

docker-whisper-live

hwdsl2/docker-whisper-liveは、faster-whisperを基盤とした自己ホスト型リアルタイム音声テキスト変換サーバーをDoc…

#Docker #GPU対応 #REST API

★ 17 ⑂ 1 NOASSERTION 2026-06-27

マルチモーダル

GitHub

paddleocr-pdf-api

このツールは、PDFをOCR処理し、結果をMarkdown形式で返す自己ホスト型APIです。PaddleOCRとPaddleOCR-VLモデルを搭…

#Docker #GPU必須 #Markdown出力

★ 15 ⑂ 4 2026-06-10

3D / NeRF

GitHub

Arbi-3DGSR

本ツールは、既存の3D Gaussian Splatting (3DGS) の超解像手法が抱える固定スケールレンダリングの制約を克服するた…

#3D #Docker #GPU必須

★ 15 ⑂ 2 MIT 2026-04-19

画像生成

GitHub

dlmserve

dlmserveは、拡散型言語モデル（Diffusion LLMs）向けにOpenAI互換のHTTPサービスを提供するツールです。拡散型LLM特…

#Docker #GPU必須 #HTTP API

★ 15 ⑂ 1 MIT 2026-05-26

音声生成 / TTS

GitHub

OmniVoice-FastAPI

OmniVoice FastAPIは、多言語対応のゼロショットTTS（Text-to-Speech）エンジン「OmniVoice」の機能を、Dockerで手軽…

#Docker #FastAPI #GPU/CPU対応

★ 13 ⑂ 2 Apache-2.0 2026-04-14

ASR / 音声認識

GitHub

multi-modal-agent-ts

このツールは、TypeScriptで書かれたマルチモーダルAIエージェントで、画像、音声、テキストを組み合わせて処理でき…

#Docker #Node.js #REST API

★ 12 ⑂ 1 2026-04-17

マルチモーダル

GitHub

Lumen

Lumenは、チャット、ビジョンQA、テキストから画像生成、画像から画像生成、長文会話圧縮、画像共有、Telegramボット…

#Docker #Python #Web UI

★ 12 NOASSERTION 2026-06-28

音声生成 / TTS

GitHub

sirene

Sireneは、自己ホスト型で複数のバックエンドをサポートするテキスト読み上げ（TTS）プラットフォームです。現代的な…

#Docker #Python #Self-hosted

★ 12 ⑂ 1 MIT 2026-05-15

ASR / 音声認識

GitHub

minutes

Manor OSの「Minutes」は、ソロ創業者向けに設計されたAI議事録ツールです。会議の録音、リアルタイム文字起こし、AI…

#AI #CLI #Docker

★ 11 MIT 2026-06-09

ASR / 音声認識

GitHub

qwen3-asr-mt

このツールは、Qwen3-ASR向けのマルチテナントストリーミングASR（自動音声認識）サーバーです。オリジナルのFlaskデ…

#ASR #Docker #GPU必須

★ 11 ⑂ 1 Apache-2.0 2026-06-08

音声生成 / TTS

GitHub

mimo-tts

MiMo TTSは、小米MiMo APIを活用したAIオーディオブック制作ツールです。小説のテキストファイルをアップロードする…

#AI #Docker #LLM活用

★ 10 ⑂ 1 MIT 2026-05-24

マルチモーダル

GitHub

DGX_Spark_Unsloth_Lossless_Speedup

本プロジェクトは、NVIDIA DGX Spark上でQwen3.5 (0.8B～27B) モデルのLoRAおよびFull Fine-Tuningを劇的に高速化す…

#CLI #Docker #Full Fine-Tuning

★ 10 ⑂ 2 MIT 2026-05-19

LLM

GitHub

printing-press

`printing-press`は、OpenAPI契約書から人間とAIエージェントの両方に適した、美しく高速でポータブルなAPIドキュメ…

#AI/エージェント対応 #CLI #Docker

★ 9 Apache-2.0 2026-06-18

音声生成 / TTS

GitHub

omnivoice-thai-api

nanofatdog/omnivoice-thai-apiは、追加学習不要のタイ語テキスト読み上げ（TTS）APIおよびWeb UIです。Voice Clonin…

#Docker #GPU必須 #Python

★ 9 ⑂ 5 2026-05-22

音声生成 / TTS

GitHub

omnivoice-app

OmniVoiceを搭載したセルフホスト型の音声クローンおよびテキスト読み上げ（TTS）ウェブアプリケーションです。テキ…

#Docker #GPU対応 #Python

★ 8 NOASSERTION 2026-06-12

LLM

GitHub

Plasmod

Plasmodは、マルチエージェントシステム向けに設計されたエージェントネイティブデータベースです。粘菌ネットワーク…

#API提供 #C++ #Docker

★ 8 MIT 2026-06-13

動画生成

GitHub

adobe2api

「adobe2api」は、Adobe Fireflyの画像・動画生成能力をOpenAI互換のAPIとして提供するゲートウェイです。Adobe Fire…

#Docker #OpenAI互換API #Python

★ 8 ⑂ 1 2026-05-16

AIエージェント

GitHub

AutoPilot-DevAgent

AutoPilot Devは、GitHubのプルリクエストURLを入力として受け取り、AIがコードレビュー、バグ修正の提案、テスト検…

#CrewAI #Docker #FastAPI

★ 8 2026-06-09

ASR / 音声認識

GitHub

meet-transcription

このツールは、Google Meetの録画を自動的に文字起こしするためのパイプラインです。Google Driveの指定フォルダを監…

#Deepgram #Docker #Google Meet対応

★ 7 MIT 2026-06-22

音声生成 / TTS

GitHub

Kokoro-82M-ONNX-German-Martin

本リポジトリは、ドイツ語のKokoro音声モデル「Martin」を用いたテキスト読み上げ（TTS）システムのDockerおよびHome…

#Docker #FastAPI #Home Assistant

★ 7 ⑂ 1 2026-05-22

3D / NeRF

GitHub

interactive-website-navigator

このツールは、ウェブサイト訪問者をリアルタイムの音声と画面認識でガイドし、アクションを実行できるインタラクテ…

#Docker #Gemini API #GPU不要

★ 7 MIT 2026-05-17

音声生成 / TTS

GitHub

oai-tts-router

このツールは、OpenAI TTS互換のAPIインターフェースを提供する無料のTTSルーターです。Google Translate、Edge TTS…

#CLI #Docker #Node.js

★ 7 AGPL-3.0 2026-05-19