3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#多言語対応 (146 repos)
「多言語対応」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub VoxSherpa-TTS
VoxSherpa TTSは、Android向けのオフラインニューラルテキスト読み上げエンジンです。高音質の「Kokoro-82M」と高速…
★ 134 ⑂ 22 GPL-3.0 2026-06-16
ASR / 音声認識 GitHub wispr
Wisprは、macOSユーザー向けのプライバシーを重視した音声書き起こしアプリケーションです。OpenAI WhisperとNVIDIA …
★ 124 ⑂ 18 Apache-2.0 2026-05-29
音声生成 / TTS GitHub Qwen3-TTS-EasyFinetuning
「Qwen3-TTS Easy Finetuning」は、Qwen3-TTSモデルのファインチューニングを簡素化し、高速かつ高品質な音声クロー…
★ 100 ⑂ 19 Apache-2.0 2026-05-29
ASR / 音声認識 GitHub subforge
SubForgeは、動画字幕制作を再現性のあるAIパイプラインに変えるために設計されたRust製のコマンドラインインターフ…
★ 90 ⑂ 10 MIT 2026-06-01
ASR / 音声認識 GitHub HearoPilot-App
HearoPilotは、Androidデバイス上で動作するオンデバイスAI会議アシスタントです。リアルタイムの音声文字起こしとLL…
★ 86 ⑂ 31 Apache-2.0 2026-06-10
LLM GitHub pmb
PMB (Personal Memory Brain)は、AIコーディングエージェント(Claude Code、Cursor、Codexなど)にローカルファース…
★ 79 ⑂ 7 Apache-2.0 2026-06-17
音声生成 / TTS GitHub BlueTTS
Blueは、ONNX Runtimeを活用した高速なオープンソースのテキスト読み上げ(TTS)推論ツールです。Python 3.12以降を…
★ 71 ⑂ 10 MIT 2026-04-30
動画生成 GitHub Seedance2.0-ShotDesign-Skills
Seedance2.0 Shot Designは、Jimeng Seedance 2.0プラットフォーム向けに、曖昧なビデオの構想を映画品質のビデオプ…
★ 71 ⑂ 2 MIT-0 2026-04-20
ASR / 音声認識 GitHub kesha-voice-kit
「Kesha Voice Kit」は、ローカル環境で動作する高速な音声処理CLIツールです。LLMエージェントや既存のツールに音声…
★ 51 ⑂ 7 MIT 2026-06-14
ASR / 音声認識 GitHub ora
Oraは、macOS向けのリアルタイムローカル音声翻訳アプリケーションです。Apple Silicon Mac上で動作し、全ての処理を…
★ 47 ⑂ 4 MIT 2026-06-04
ASR / 音声認識 GitHub arkiv
arkivは、AIセマンティック検索機能を備えたオープンソースのローカルファーストメディアアセットマネージャーです。…
★ 34 ⑂ 4 MIT 2026-06-19
音声生成 / TTS GitHub HiggsAudio-Studio
Higgs Audio Studioは、Higgs Audio v3 TTSを基盤としたポータブルなローカルテキスト読み上げ(TTS)ツールです。10…
★ 33 ⑂ 5 2026-06-17
ASR / 音声認識 GitHub openquack
OpenQuackはmacOS向けの音声文字変換メニューバーアプリです。ホットキーを押して話すだけで、話した内容がカーソル…
★ 32 ⑂ 5 MIT 2026-06-18
ComfyUI GitHub ComfyUI-TranslateGemma
このツールは、Googleのオープンソース翻訳モデル「TranslateGemma」をComfyUIに統合するノードです。Gemma 3をベー…
★ 29 ⑂ 3 MIT 2026-06-13
ASR / 音声認識 GitHub chough
choughは、Parakeet TDT 0.6b V3とsherpa-onnxを基盤とする、高速かつメモリ効率に優れたCLIベースの音声認識(ASR)…
★ 27 ⑂ 2 MIT 2026-03-08
ASR / 音声認識 GitHub TypelessMLX
このTypelessMLXは、macOS向けの音声文字変換(ディクテーション)アプリケーションです。Apple Silicon向けに最適化…
★ 27 ⑂ 3 2026-04-26
LLM GitHub vaathi
Vaathiは、ユーザー自身のLLM APIキー(Groqなど)を持ち込むことで、無料でサイバーセキュリティを学べるAIパワード…
★ 20 ⑂ 6 2026-05-21
ASR / 音声認識 GitHub anti-vocale
Anti-Vocaleは、Androidデバイス上で動作する音声メッセージ文字起こしアプリです。WhatsAppやTelegramなどから共有…
★ 18 MIT 2026-06-10
マルチモーダル GitHub paddleocr-pdf-api
このツールは、PDFをOCR処理し、結果をMarkdown形式で返す自己ホスト型APIです。PaddleOCRとPaddleOCR-VLモデルを搭…
★ 15 ⑂ 4 2026-06-10
LLM GitHub AgentSimulator
AI Agent Simulatorは、実際のAIエージェントがチャットメッセージを処理する内部プロセスをリアルタイムで可視化す…
★ 13 ⑂ 1 MIT 2026-06-11
画像生成 GitHub awesome-gpt-image-2-free-prompts
「Awesome GPT Image 2 Prompts」は、OpenAIのGPT-Image-2モデル向けに厳選された、最も包括的な無料プロンプトライ…
★ 12 MIT 2026-06-17
音声生成 / TTS GitHub vocoloco_tts
VocoLocoは、Webブラウザ内で完結するテキスト読み上げツールです。サーバーやAPIキーを必要とせず、すべての処理が…
★ 12 ⑂ 3 Apache-2.0 2026-04-12
音声生成 / TTS GitHub sirene
Sireneは、自己ホスト型で複数のバックエンドをサポートするテキスト読み上げ(TTS)プラットフォームです。現代的な…
★ 12 ⑂ 1 MIT 2026-05-15
ASR / 音声認識 GitHub Benetto
Benetto — VoiceNotes Localは、Androidデバイス上で動作する音声ノート録音・文字起こしツールです。OpenAIのWhispe…
★ 12 MIT 2026-05-26