LLM GitHub vllm
vLLMは、大規模言語モデル (LLM) の高速かつ効率的な推論とサービングを可能にするPythonライブラリです。最先端のス…
★ 84.8k ⑂ 18.6k Apache-2.0 2026-06-29
LLM GitHub LlamaFactory
LlamaFactoryは、100以上の大規模言語モデル(LLM)と視覚言語モデル(VLM)を効率的にファインチューニングするため…
★ 72.5k ⑂ 8.9k Apache-2.0 2026-06-24
音声生成 / TTS GitHub unsloth
Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…
★ 67.5k ⑂ 6.1k Apache-2.0 2026-06-28
音声生成 / TTS GitHub GPT-SoVITS
GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-s…
★ 59.1k ⑂ 6.4k MIT 2026-06-20
LLM GitHub minimind
この「MiniMind」プロジェクトは、わずか数元の費用と短時間の訓練で、GPT-3の約1/2700という超小型言語モデルをゼロ…
★ 52.3k ⑂ 6.7k Apache-2.0 2026-06-28
音声生成 / TTS GitHub ChatTTS
ChatTTSは、LLMアシスタントなどの対話シナリオに特化したテキスト音声合成モデルです。自然で表現豊かな音声合成を…
★ 39.5k ⑂ 4.2k AGPL-3.0 2026-04-10
画像生成 GitHub diffusers
🤗 Diffusersは、画像、音声、分子の3D構造生成のための最先端の拡散モデルを提供するPythonライブラリです。シンプ…
★ 33.9k ⑂ 7.1k Apache-2.0 2026-06-27
音声生成 / TTS GitHub VoxCPM
VoxCPM2は、OpenBMBが開発した、テキストを直接音声に変換するトークナイザーフリーの画期的なTTSシステムです。エン…
★ 32.1k ⑂ 3.6k Apache-2.0 2026-06-29
LLM GitHub happy-llm
このプロジェクトは、Datawhaleが提供する大規模言語モデル(LLM)の体系的な学習チュートリアルです。NLPの基礎、Tr…
★ 31.6k ⑂ 3.0k NOASSERTION 2026-05-06
LLM GitHub llmfit
llmfitは、ユーザーのRAM、CPU、GPUといったハードウェアリソースに合わせて最適な大規模言語モデル(LLM)を効率的…
★ 28.7k ⑂ 1.8k MIT 2026-06-24
ComfyUI GitHub Pixelle-Video
Pixelle-Videoは、入力されたテーマに基づいて、AIが短尺動画を全自動で生成するエンジンです。動画のスクリプト作成…
★ 23.7k ⑂ 3.4k Apache-2.0 2026-06-14
ASR / 音声認識 GitHub whisperX
WhisperXは、OpenAIのWhisperモデルを基盤とした、単語レベルの正確なタイムスタンプと話者分離(Diarization)機能…
★ 22.7k ⑂ 2.3k BSD-2-Clause 2026-06-26
動画生成 GitHub Open-Generative-AI
Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…
★ 21.6k ⑂ 3.7k MIT 2026-06-28
ASR / 音声認識 GitHub FunASR
FunASRは、エンドツーエンドの音声認識に特化した、研究者と開発者向けのツールキットです。音声認識(ASR)、音声活…
★ 18.7k ⑂ 1.9k MIT 2026-06-28
動画生成 GitHub LivePortrait
LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…
★ 18.6k ⑂ 1.9k NOASSERTION 2026-06-01
ASR / 音声認識 GitHub pyvideotrans
pyVideoTransは、動画を多言語に翻訳し、吹き替えと字幕を埋め込むための強力なオープンソースツールです。音声認識…
★ 18.1k ⑂ 2.2k GPL-3.0 2026-06-23
音声生成 / TTS GitHub VideoLingo
VideoLingoは、YouTube動画のダウンロードから翻訳、ローカライズ、吹き替えまでをオールインワンで行うツールです。…
★ 17.6k ⑂ 1.9k Apache-2.0 2026-06-13
音声生成 / TTS GitHub NeMo
NVIDIA NeMo Speechは、大規模言語モデル、マルチモーダル、音声AI(自動音声認識、Text-to-Speech)向けにNVIDIAが…
★ 17.5k ⑂ 3.5k Apache-2.0 2026-06-24
画像生成 GitHub HunyuanVideo
HunyuanVideoは、Tencentが開発した大規模動画生成モデルのための体系的なフレームワークです。テキストからの動画生…
★ 12.3k ⑂ 1.3k NOASSERTION 2026-06-29
画像生成 GitHub krita-ai-diffusion
Krita用AI画像生成プラグイン「Generative AI for Krita」は、画像ペイント・編集ワークフローにAIを統合します。本…
★ 10.2k ⑂ 597 GPL-3.0 2026-06-17
ASR / 音声認識 GitHub espnet
ESPnetは、音声認識、音声合成、音声翻訳など、様々なエンドツーエンドの音声処理タスクに対応する包括的なツールキ…
★ 9.9k ⑂ 2.4k Apache-2.0 2026-06-24
3D / NeRF GitHub awesome-3D-gaussian-splatting
「Awesome 3D Gaussian Splatting」は、3D Gaussian Splatting(3DGS)および関連技術に特化した厳選されたリソース…
★ 8.7k ⑂ 538 MIT 2026-06-26
動画生成 GitHub Sana
SANAは、NVIDIAが開発した高解像度画像および動画生成のための効率的なコードベースです。線形拡散トランスフォーマ…
★ 8.4k ⑂ 671 Apache-2.0 2026-06-25
ASR / 音声認識 GitHub ASRT_SpeechRecognition
ASRTは、TensorFlow.kerasを基盤とした深層学習ベースの中国語音声認識システムです。深度畳み込みニューラルネット…
★ 8.4k ⑂ 1.9k GPL-3.0 2026-04-10