3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Docker (234 repos)
「Docker」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub breeze-asr-taigi
本ツールは、MediaTekのBreeze-ASR-26モデルを基盤とした台湾語(台語)に特化した音声文字起こしツールです。NVIDIA…
★ 18 NOASSERTION 2026-06-22
音声生成 / TTS GitHub docker-kokoro
このツールは、テキスト読み上げ(TTS)サーバー「Kokoro」をDockerコンテナとして手軽にデプロイできるイメージです…
★ 18 ⑂ 3 NOASSERTION 2026-06-21
ASR / 音声認識 GitHub docker-whisper-live
hwdsl2/docker-whisper-liveは、faster-whisperを基盤とした自己ホスト型リアルタイム音声テキスト変換サーバーをDoc…
★ 17 ⑂ 1 NOASSERTION 2026-06-27
マルチモーダル GitHub paddleocr-pdf-api
このツールは、PDFをOCR処理し、結果をMarkdown形式で返す自己ホスト型APIです。PaddleOCRとPaddleOCR-VLモデルを搭…
★ 15 ⑂ 4 2026-06-10
3D / NeRF GitHub Arbi-3DGSR
本ツールは、既存の3D Gaussian Splatting (3DGS) の超解像手法が抱える固定スケールレンダリングの制約を克服するた…
★ 15 ⑂ 2 MIT 2026-04-19
画像生成 GitHub dlmserve
dlmserveは、拡散型言語モデル(Diffusion LLMs)向けにOpenAI互換のHTTPサービスを提供するツールです。拡散型LLM特…
★ 15 ⑂ 1 MIT 2026-05-26
音声生成 / TTS GitHub OmniVoice-FastAPI
OmniVoice FastAPIは、多言語対応のゼロショットTTS(Text-to-Speech)エンジン「OmniVoice」の機能を、Dockerで手軽…
★ 13 ⑂ 2 Apache-2.0 2026-04-14
ASR / 音声認識 GitHub multi-modal-agent-ts
このツールは、TypeScriptで書かれたマルチモーダルAIエージェントで、画像、音声、テキストを組み合わせて処理でき…
★ 12 ⑂ 1 2026-04-17
マルチモーダル GitHub Lumen
Lumenは、チャット、ビジョンQA、テキストから画像生成、画像から画像生成、長文会話圧縮、画像共有、Telegramボット…
★ 12 NOASSERTION 2026-06-28
音声生成 / TTS GitHub sirene
Sireneは、自己ホスト型で複数のバックエンドをサポートするテキスト読み上げ(TTS)プラットフォームです。現代的な…
★ 12 ⑂ 1 MIT 2026-05-15
ASR / 音声認識 GitHub minutes
Manor OSの「Minutes」は、ソロ創業者向けに設計されたAI議事録ツールです。会議の録音、リアルタイム文字起こし、AI…
★ 11 MIT 2026-06-09
ASR / 音声認識 GitHub qwen3-asr-mt
このツールは、Qwen3-ASR向けのマルチテナントストリーミングASR(自動音声認識)サーバーです。オリジナルのFlaskデ…
★ 11 ⑂ 1 Apache-2.0 2026-06-08
音声生成 / TTS GitHub mimo-tts
MiMo TTSは、小米MiMo APIを活用したAIオーディオブック制作ツールです。小説のテキストファイルをアップロードする…
★ 10 ⑂ 1 MIT 2026-05-24
マルチモーダル GitHub DGX_Spark_Unsloth_Lossless_Speedup
本プロジェクトは、NVIDIA DGX Spark上でQwen3.5 (0.8B~27B) モデルのLoRAおよびFull Fine-Tuningを劇的に高速化す…
★ 10 ⑂ 2 MIT 2026-05-19
LLM GitHub printing-press
`printing-press`は、OpenAPI契約書から人間とAIエージェントの両方に適した、美しく高速でポータブルなAPIドキュメ…
★ 9 Apache-2.0 2026-06-18
音声生成 / TTS GitHub omnivoice-thai-api
nanofatdog/omnivoice-thai-apiは、追加学習不要のタイ語テキスト読み上げ(TTS)APIおよびWeb UIです。Voice Clonin…
★ 9 ⑂ 5 2026-05-22
音声生成 / TTS GitHub omnivoice-app
OmniVoiceを搭載したセルフホスト型の音声クローンおよびテキスト読み上げ(TTS)ウェブアプリケーションです。テキ…
★ 8 NOASSERTION 2026-06-12
LLM GitHub Plasmod
Plasmodは、マルチエージェントシステム向けに設計されたエージェントネイティブデータベースです。粘菌ネットワーク…
★ 8 MIT 2026-06-13
動画生成 GitHub adobe2api
「adobe2api」は、Adobe Fireflyの画像・動画生成能力をOpenAI互換のAPIとして提供するゲートウェイです。Adobe Fire…
★ 8 ⑂ 1 2026-05-16
AIエージェント GitHub AutoPilot-DevAgent
AutoPilot Devは、GitHubのプルリクエストURLを入力として受け取り、AIがコードレビュー、バグ修正の提案、テスト検…
★ 8 2026-06-09
ASR / 音声認識 GitHub meet-transcription
このツールは、Google Meetの録画を自動的に文字起こしするためのパイプラインです。Google Driveの指定フォルダを監…
★ 7 MIT 2026-06-22
音声生成 / TTS GitHub Kokoro-82M-ONNX-German-Martin
本リポジトリは、ドイツ語のKokoro音声モデル「Martin」を用いたテキスト読み上げ(TTS)システムのDockerおよびHome…
★ 7 ⑂ 1 2026-05-22
3D / NeRF GitHub interactive-website-navigator
このツールは、ウェブサイト訪問者をリアルタイムの音声と画面認識でガイドし、アクションを実行できるインタラクテ…
★ 7 MIT 2026-05-17
音声生成 / TTS GitHub oai-tts-router
このツールは、OpenAI TTS互換のAPIインターフェースを提供する無料のTTSルーターです。Google Translate、Edge TTS…
★ 7 AGPL-3.0 2026-05-19