3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#多言語対応 (146 repos)

「多言語対応」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

FunClip

FunClipは、オープンソースで高精度かつ使いやすい動画クリッピングツールです。Alibaba TONGYIのFunASR Paraformer…

#CLI #LLMベース #Python

★ 5.8k ⑂ 703 MIT 2026-06-18

画像生成

Z-Image-Turbo

Z-Imageは、60億パラメータを持つ高効率な画像生成モデルファミリーです。特にZ-Image-Turboは、わずか8NFEsでサブ秒…

#GPU必須 #Image-to-Image #Python

❤ 4.8k ↓ 935.5k apache-2.0 2026-01-30

動画生成

GitHub

echomimic_v2

EchoMimicV2は、Ant Groupが開発した、印象的で簡素化された半身の人間アニメーションを生成するための研究プロジェ…

#ComfyUI対応 #GPU必須 #Python

★ 4.6k ⑂ 540 Apache-2.0 2026-02-23

音声生成 / TTS

GitHub

MOSS-TTS-Nano

MOSS-TTS-Nanoは、MOSI.AIとOpenMOSSチームが開発したオープンソースの多言語対応小型音声生成モデルです。わずか0.1…

#CLI #CPU動作 #Python

★ 3.5k ⑂ 450 Apache-2.0 2026-06-02

音声生成 / TTS

GitHub

MOSS-TTS

MOSS-TTS Familyは、MOSI.AIとOpenMOSSチームが開発したオープンソースの音声およびサウンド生成モデル群です。高忠…

#API #Python #Web UI

★ 3.4k ⑂ 290 Apache-2.0 2026-06-11

LLM

GitHub

awesome-agentic-ai-zh

このリポジトリは、AI Agentを体系的に学習するための多言語対応（繁体字中国語、簡体字中国語、英語）ロードマップ…

#AI Agent #CLI #Ollama

★ 3.0k ⑂ 412 MIT 2026-06-16

画像生成

GitHub

Kandinsky-2

Kandinsky 2.2は、多言語対応のテキストから画像を生成する強力な潜在拡散モデルです。前バージョンのKandinsky 2.1…

#Colab対応 #ControlNet対応 #GPU必須

★ 2.8k ⑂ 317 Apache-2.0 2024-05-01

LLM

GitHub

claude-reviews-claude

このプロジェクトは、Claude Code v2.1.88の内部アーキテクチャを、Claude自身が分析した17章からなる詳細なドキュメ…

#AI/LLM #TypeScript #Webドキュメント

★ 1.5k ⑂ 695 MIT 2026-04-01

音声生成 / TTS

GitHub

open-speech-corpora

「Open Speech Corpora」は、音声技術の研究開発に特化した、アクセス可能でオープンな音声コーパスのリストです。自…

#オープンデータ #多言語対応 #研究開発向け

★ 1.4k ⑂ 150 MIT 2024-06-06

LLM

Qwen3-0.6B

Qwen3は、推論、指示追従、エージェント機能、多言語サポートに優れた次世代の大規模言語モデルです。複雑な論理的推…

#CLI #Hugging Face Transformers #LLM

❤ 1.3k ↓ 27.4M apache-2.0 2025-07-26

動画生成

GitHub

video-podcast-maker

このツールは、コーディングエージェント向けに、トピックからプロフェッショナルな4Kビデオポッドキャストを自動で…

#CLI #Node.js #Python

★ 1.3k ⑂ 142 MIT 2026-05-23

AIエージェント

GitHub

nopua

この「NoPUA」スキルは、「愛」と「信頼」を基盤にAIの真の潜在能力を解放することを目指します。従来の「恐れ」や「…

#AIスキル #Claude対応 #CLI

★ 1.3k ⑂ 44 MIT 2026-06-14

音声生成 / TTS

GitHub

Chatterbox-TTS-Server

Chatterbox TTS Serverは、オープンソースのChatterbox TTSモデル（オリジナル、多言語、高速なTurbo版）をセルフホ…

#GPU対応 #OpenAI互換API #Python

★ 1.3k ⑂ 313 MIT 2026-05-26

音声生成 / TTS

GitHub

Twocast

Twocastは、AIを活用して2人対話形式のポッドキャストエピソードを生成するツールです。バイリンガルエピソードや多…

#AI #Docker #Node.js

★ 1.3k ⑂ 125 2025-07-01

マルチモーダル

gemma-4-26B-A4B-it

Gemma 4 26B A4B itは、Google DeepMindのオープンウェイトなマルチモーダル指示調整モデルです。テキストと画像を入…

#GPU推奨 #Python #Transformers対応

❤ 1.2k ↓ 12.6M apache-2.0 2026-06-03

LLM

GitHub

WorldX

WorldXは、一文の指示からAIが駆動する仮想世界を生成する画期的なツールです。AIキャラクターたちは自律的に行動し…

#AI Agents #CLI #LLM

★ 1.1k ⑂ 179 MIT 2026-05-06

音声生成 / TTS

OmniVoice

OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成（TTS）モデルです。独自の拡散言語モデル…

#GPU必須 #Python #ゼロショットTTS

❤ 1.1k ↓ 1.8M apache-2.0 2026-05-07

音声生成 / TTS

GitHub

TTS-Audio-Suite

ComfyUI用のカスタムノードとして、ローカル環境で複数の音声合成エンジンと多言語対応のテキスト読み上げ（TTS）、…

#ComfyUI対応 #SRT対応 #多言語対応

★ 1.0k ⑂ 120 NOASSERTION 2026-06-17

LLM

Qwen2.5-1.5B-Instruct

Qwen2.5-1.5B-Instructは、Qwen大規模言語モデルシリーズの最新版であるQwen2.5の、1.5Bパラメータを持つ命令チュー…

#Hugging Face Transformers #LLM #Python

❤ 746 ↓ 10.5M apache-2.0 2024-09-25

ASR / 音声認識

GitHub

voxt

Voxtは、macOS向けの音声入力＆翻訳メニューバーアプリです。ユーザーが話した内容をリアルタイムで高精度にテキスト…

#AI #macOS #ローカルモデル対応

★ 665 ⑂ 49 NOASSERTION 2026-06-21

ComfyUI

GitHub

comfyui_fk_server

このリポジトリは、ComfyUIユーザー向けの多機能プラグイン「comfyui_fk_server」を提供します。ComfyUIのテキスト入…

#AI/LLM #ComfyUI対応 #Photoshop連携

★ 576 ⑂ 28 2026-01-27

ComfyUI

GitHub

ComfyUI-OmniVoice-TTS

ComfyUI-OmniVoice-TTSは、画像生成AIのComfyUI向けに開発された、ゼロショット多言語テキスト読み上げ（TTS）ノード…

#ComfyUI対応 #GPU必須 #Python

★ 430 ⑂ 55 Apache-2.0 2026-06-11

AIエージェント

GitHub

deep-research

このスキルは、与えられたテーマに基づき、わずか1コマンドで深層調査レポートを自動生成します。約10分という短時間…

#CLI #LLM活用 #Web UI

★ 361 ⑂ 34 MIT 2026-06-18

ASR / 音声認識

GitHub

CrispASR

CrispASRは、whisper.cppを基盤とし、主要なASR（自動音声認識）およびTTS（テキスト読み上げ）モデルのためのC++ gg…

#ASR #C++ #CLI

★ 330 ⑂ 48 MIT 2026-06-21