3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#多言語対応 (146 repos)

「多言語対応」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
echomimic_v2
EchoMimicV2は、Ant Groupが開発した、印象的で簡素化された半身の人間アニメーションを生成するための研究プロジェ…
★ 4.6k ⑂ 540 Apache-2.0 2026-02-23
音声生成 / TTS
GitHub
MOSS-TTS-Nano
MOSS-TTS-Nanoは、MOSI.AIとOpenMOSSチームが開発したオープンソースの多言語対応小型音声生成モデルです。わずか0.1…
★ 3.5k ⑂ 450 Apache-2.0 2026-06-02
音声生成 / TTS
GitHub
MOSS-TTS
MOSS-TTS Familyは、MOSI.AIとOpenMOSSチームが開発したオープンソースの音声およびサウンド生成モデル群です。高忠…
★ 3.4k ⑂ 290 Apache-2.0 2026-06-11
LLM
GitHub
awesome-agentic-ai-zh
このリポジトリは、AI Agentを体系的に学習するための多言語対応(繁体字中国語、簡体字中国語、英語)ロードマップ…
★ 3.0k ⑂ 412 MIT 2026-06-16
画像生成
GitHub
Kandinsky-2
Kandinsky 2.2は、多言語対応のテキストから画像を生成する強力な潜在拡散モデルです。前バージョンのKandinsky 2.1…
★ 2.8k ⑂ 317 Apache-2.0 2024-05-01
LLM
GitHub
claude-reviews-claude
このプロジェクトは、Claude Code v2.1.88の内部アーキテクチャを、Claude自身が分析した17章からなる詳細なドキュメ…
★ 1.5k ⑂ 695 MIT 2026-04-01
音声生成 / TTS
GitHub
open-speech-corpora
「Open Speech Corpora」は、音声技術の研究開発に特化した、アクセス可能でオープンな音声コーパスのリストです。自…
★ 1.4k ⑂ 150 MIT 2024-06-06
動画生成
GitHub
video-podcast-maker
このツールは、コーディングエージェント向けに、トピックからプロフェッショナルな4Kビデオポッドキャストを自動で…
★ 1.3k ⑂ 142 MIT 2026-05-23
AIエージェント
GitHub
nopua
この「NoPUA」スキルは、「愛」と「信頼」を基盤にAIの真の潜在能力を解放することを目指します。従来の「恐れ」や「…
★ 1.3k ⑂ 44 MIT 2026-06-14
音声生成 / TTS
GitHub
Chatterbox-TTS-Server
Chatterbox TTS Serverは、オープンソースのChatterbox TTSモデル(オリジナル、多言語、高速なTurbo版)をセルフホ…
★ 1.3k ⑂ 313 MIT 2026-05-26
音声生成 / TTS
GitHub
Twocast
Twocastは、AIを活用して2人対話形式のポッドキャストエピソードを生成するツールです。バイリンガルエピソードや多…
★ 1.3k ⑂ 125 2025-07-01
LLM
GitHub
WorldX
WorldXは、一文の指示からAIが駆動する仮想世界を生成する画期的なツールです。AIキャラクターたちは自律的に行動し…
★ 1.1k ⑂ 179 MIT 2026-05-06
音声生成 / TTS
GitHub
TTS-Audio-Suite
ComfyUI用のカスタムノードとして、ローカル環境で複数の音声合成エンジンと多言語対応のテキスト読み上げ(TTS)、…
★ 1.0k ⑂ 120 NOASSERTION 2026-06-17
ASR / 音声認識
GitHub
voxt
Voxtは、macOS向けの音声入力&翻訳メニューバーアプリです。ユーザーが話した内容をリアルタイムで高精度にテキスト…
★ 665 ⑂ 49 NOASSERTION 2026-06-21
ComfyUI
GitHub
comfyui_fk_server
このリポジトリは、ComfyUIユーザー向けの多機能プラグイン「comfyui_fk_server」を提供します。ComfyUIのテキスト入…
★ 576 ⑂ 28 2026-01-27
ComfyUI
GitHub
ComfyUI-OmniVoice-TTS
ComfyUI-OmniVoice-TTSは、画像生成AIのComfyUI向けに開発された、ゼロショット多言語テキスト読み上げ(TTS)ノード…
★ 430 ⑂ 55 Apache-2.0 2026-06-11
AIエージェント
GitHub
deep-research
このスキルは、与えられたテーマに基づき、わずか1コマンドで深層調査レポートを自動生成します。約10分という短時間…
★ 361 ⑂ 34 MIT 2026-06-18
ASR / 音声認識
GitHub
CrispASR
CrispASRは、whisper.cppを基盤とし、主要なASR(自動音声認識)およびTTS(テキスト読み上げ)モデルのためのC++ gg…
★ 330 ⑂ 48 MIT 2026-06-21
LLM
GitHub
fojin
FoJin(佛津)は、世界中の仏教デジタル文献を網羅する百科事典的なプラットフォームです。503のソースから10,500以…
★ 312 ⑂ 53 Apache-2.0 2026-06-15
ASR / 音声認識
GitHub
opentypeless
OpenTypelessは、オープンソースのデスクトップAI音声入力ツールです。自然な発話で音声をテキストに変換し、AIが自…
★ 283 ⑂ 50 MIT 2026-06-20
ASR / 音声認識
GitHub
input0
Input0は、macOSユーザー向けの音声入力ツールです。ホットキーを押して話すだけで録音を開始し、キーを離すとローカ…
★ 279 ⑂ 14 NOASSERTION 2026-05-28
ComfyUI
GitHub
ComfyUI-VoxCPM2
このツールは、ComfyUI用のVoxCPM2テキスト読み上げノードを提供します。200万時間以上の多言語音声データで訓練され…
★ 162 ⑂ 13 Apache-2.0 2026-04-12
音声生成 / TTS
GitHub
kokoclone
KokoCloneは、Kokoro-ONNXを基盤とする高速な多言語音声クローンシステムです。短い音声サンプルからリアルタイムで…
★ 148 ⑂ 24 Apache-2.0 2026-04-19