ASR / 音声認識 HF whisper-large-v3-turbo
Whisper large-v3-turboは、OpenAIが提案する最先端の自動音声認識(ASR)および音声翻訳モデルであるWhisper large-…
❤ 3.1k ↓ 7.4M mit 2024-10-04
LLM GitHub hands-on-modern-rl
このプロジェクトは、現代の強化学習を実践的に学ぶためのオープンソースカリキュラム「Hands-On Modern RL」です。…
★ 3.1k ⑂ 216 NOASSERTION 2026-06-27
動画生成 GitHub DynamiCrafter
DynamiCrafterは、テキストプロンプトに基づいてオープンドメインの静止画をアニメーション化するツールです。事前学…
★ 3.0k ⑂ 245 Apache-2.0 2024-09-08
ComfyUI GitHub ComfyUI-nunchaku
Nunchaku ComfyUI Pluginは、SVDQuantで量子化された4-bitニューラルネットワーク向けの効率的な推論エンジン「Nunch…
★ 2.9k ⑂ 166 Apache-2.0 2026-02-19
音声生成 / TTS GitHub AudioLDM
AudioLDMは、テキスト入力からスピーチ、効果音、音楽などを生成できる革新的なオーディオ生成ツールです。ICML 2023…
★ 2.9k ⑂ 266 NOASSERTION 2025-06-25
3D / NeRF GitHub Papers-in-100-Lines-of-Code
このリポジトリは、主要なAI/機械学習の学術論文で提唱されたアルゴリズムやモデルを、わずか100行程度の簡潔なPytho…
★ 2.8k ⑂ 254 MIT 2026-04-08
音声生成 / TTS GitHub MARS5-TTS
MARS5は、CAMB.AIが開発した英語の音声合成(TTS)モデルです。わずか5秒の音声とテキストスニペットから、スポーツ…
★ 2.8k ⑂ 245 AGPL-3.0 2024-08-01
画像生成 GitHub Kandinsky-2
Kandinsky 2.2は、多言語対応のテキストから画像を生成する強力な潜在拡散モデルです。前バージョンのKandinsky 2.1…
★ 2.8k ⑂ 317 Apache-2.0 2024-05-01
動画生成 GitHub ArcReel
ArcReelは、AI Agentを駆使して小説のようなテキストから短編動画を生成するオープンソースの動画生成ワークベンチで…
★ 2.8k ⑂ 586 AGPL-3.0 2026-06-23
3D / NeRF GitHub nerf_pl
このツールは、NeRF (Neural Radiance Fields) をPyTorch-Lightningで非公式に実装したものです。公式実装と比較して…
★ 2.8k ⑂ 460 MIT 2023-08-03
画像生成 GitHub dalle-playground
このプロジェクトは、Stable Diffusion V2を用いてテキストプロンプトから画像を生成するためのプレイグラウンドです…
★ 2.7k ⑂ 577 MIT 2024-06-03
LLM GitHub OpenKB
OpenKB(Open Knowledge Base)は、LLM(大規模言語モデル)を活用して、様々な形式の生文書(PDF, Word, Markdownな…
★ 2.7k ⑂ 299 Apache-2.0 2026-06-27
動画生成 GitHub Stable-Diffusion
Dr. Furkan Gözükara氏によるジェネレーティブAIに関する専門的なチュートリアル、研究、開発リソース集です。Stable…
★ 2.7k ⑂ 364 GPL-3.0 2026-06-18
AIエージェント GitHub danghuangshang
「当皇上」は、明朝の内閣制などをモデルにAIエージェントの協調システムを構築するチュートリアルです。OpenClawフ…
★ 2.7k ⑂ 250 MIT 2026-05-22
3D / NeRF GitHub GeneFace
GeneFaceは、音声駆動による汎用的で高忠実度な3D話者顔合成を実現するICLR 2023で発表された公式PyTorch実装です。…
★ 2.7k ⑂ 294 MIT 2024-10-18
音声生成 / TTS GitHub AudioLDM2
AudioLDM 2は、テキストプロンプトからオーディオ(音楽を含む)、スピーチ、超解像インペインティングを生成できる…
★ 2.6k ⑂ 209 NOASSERTION 2024-09-29
画像生成 HF sdxl-turbo
SDXL-Turboは、Stability AIが開発した高速な生成テキストから画像へのモデルです。リアルタイム合成に特化しており…
❤ 2.6k ↓ 632.4k other 2024-07-10
ComfyUI GitHub ComfyUI-SeedVR2_VideoUpscaler
ComfyUI-SeedVR2_VideoUpscalerは、高品質なビデオと画像のアップスケーリングを可能にするComfyUI向けの公式SeedVR2…
★ 2.6k ⑂ 199 Apache-2.0 2025-12-24
ComfyUI GitHub ComfyUI-to-Python-Extension
ComfyUIで作成したノードベースのワークフローを、そのまま実行可能なPythonスクリプトへ変換できる拡張ツールです。…
★ 2.4k ⑂ 208 MIT 2026-05-10
AIエージェント GitHub Auto-Empirical-Research-Skills
「Auto-Empirical Research Skills (AERS)」は、8つの社会科学分野にわたる23,000以上のAIエージェントスキルを厳選…
★ 2.3k ⑂ 321 NOASSERTION 2026-06-24
動画生成 GitHub Awesome-Video-Diffusion-Models
このリポジトリは、ビデオ拡散モデルに関する包括的な調査論文「A Survey on Video Diffusion Models」を提供してい…
★ 2.3k ⑂ 115 2026-06-22
AIエージェント GitHub awesome-autoresearch
「Awesome Autoresearch」は、Karpathyのオートリサーチに触発された自律的な改善ループ、研究エージェント、および…
★ 2.3k ⑂ 173 NOASSERTION 2026-06-22
LLM GitHub how-to-train-your-gpt
このリポジリは、ChatGPTなどに使われている大規模言語モデル(LLM)をゼロから構築、学習、実行する方法を学ぶため…
★ 2.3k ⑂ 303 MIT 2026-06-23
LLM GitHub hello-claw
「哈喽!龙虾(Hello Claw)」は、OpenClawという強力なコマンドラインAIアシスタントシステムをゼロから習得するた…
★ 2.1k ⑂ 220 2026-05-10