3D / NeRF GitHub HDR-GS
HDR-GSは、Gaussian Splatting技術を用いて、HDR(ハイダイナミックレンジ)の新規視点合成を1000倍の速度で効率的に…
★ 390 ⑂ 14 MIT 2025-10-10
動画生成 GitHub awesome-seedance-2-guide
Seedance 2.0は、画像、動画、音声、テキストの4つのモダリティを同時に入力として受け付け、自然言語で詳細な効果を…
★ 389 ⑂ 46 NOASSERTION 2026-06-15
ComfyUI GitHub ComfyUI_FlashVSR
ComfyUI_FlashVSRは、リアルタイム拡散ベースのストリーミングビデオ超解像技術「FlashVSR」をComfyUI上で利用可能に…
★ 373 ⑂ 23 Apache-2.0 2026-02-23
AIエージェント GitHub late-cli
Late CLIは、AI開発チームの作業を効率的にオーケストレーションするためのCLIツールです。エフェメラルなサブエージ…
★ 365 ⑂ 37 NOASSERTION 2026-06-25
LLM GitHub tessera
Tesseraは、大規模なLLM(教師モデル)を小型のLLM(生徒モデル)に蒸留し、その生徒モデルを効率的に提供することを…
★ 359 ⑂ 4 NOASSERTION 2026-06-05
ComfyUI GitHub ComfyUI-Depthflow-Nodes
「ComfyUI-Depthflow-Nodes」は、2D画像を魅力的な2.5Dパララックスアニメーションに変換するためのComfyUI用ノード…
★ 359 ⑂ 22 AGPL-3.0 2026-02-15
3D / NeRF GitHub sam-body4d
SAM-Body4Dは、動画からトレーニング不要で一時的に一貫性のある堅牢な4D人体メッシュを復元するツールです。SAM-3、…
★ 351 ⑂ 33 MIT 2026-05-11
3D / NeRF GitHub OmniVGGT-official
OmniVGGTは、空間認識のための最先端の基盤モデルです。本ツールは、深度、カメラ内部パラメータ、ポーズといった任…
★ 339 ⑂ 28 MIT 2026-05-21
LLM GitHub NexusRAG
NexusRAGは、ベクトル検索、ナレッジグラフ、クロスエンコーダー再ランキングを統合した高度なハイブリッドRAGシステ…
★ 321 ⑂ 65 2026-04-20
画像生成 GitHub RefAlign
RefAlignは、参照画像をもとに動画を生成するReference-to-Video向けのPyTorch実装です。学習時にDiTの参照分岐特徴…
★ 321 ⑂ 20 NOASSERTION 2026-06-19
ComfyUI GitHub Comfy-Photoshop-SD
Comfy-Photoshop-SDは、画像生成AIツールComfyUIとPhotoshopのAuto-Photoshop-SDプラグインを連携させる拡張機能です…
★ 318 ⑂ 20 MIT 2024-06-14
画像生成 GitHub Hallo-Live
Hallo-Liveは、テキスト入力からリアルタイムでアバターのビデオと音声を生成する先進的なフレームワークです。因果…
★ 310 ⑂ 50 MIT 2026-06-24
ComfyUI GitHub style_aligned_comfy
ComfyUI向けにStyleAligned技術を実装したツールです。このツールは、画像生成において一貫したスタイルを適用するこ…
★ 307 ⑂ 17 MIT 2025-03-24
音声生成 / TTS GitHub AudioStory
AudioStoryは、大規模言語モデル(LLM)とText-to-Audio (TTA) システムを統合し、長尺の物語音声生成を可能にする統…
★ 302 ⑂ 22 2025-09-21
LLM GitHub TurboOCR
TurboOCRは、C++、CUDA、TensorRT技術を活用した高速GPU OCRサーバーです。FUNSDデータセットで270 img/s、疎な画像…
★ 301 ⑂ 36 MIT 2026-06-11
動画生成 GitHub Kiwi-Edit
Kiwi-Editは、自然言語の指示と参照画像を活用した多機能な動画編集を可能にする、完全にオープンソースのフレームワ…
★ 295 ⑂ 24 MIT 2026-05-13
ASR / 音声認識 GitHub parakeet.cpp
parakeet.cppは、NVIDIAのParakeet音声認識モデルを超高速でC++に実装し、デバイス上での推論を可能にするライブラリ…
★ 295 ⑂ 13 MIT 2026-05-04
ComfyUI GitHub CosyVoice-ComfyUI
「CosyVoice-ComfyUI」は、最先端の音声生成モデルCosyVoiceの機能をComfyUI上で利用可能にするカスタムノードです。…
★ 293 ⑂ 39 Apache-2.0 2024-09-10
ComfyUI GitHub ComfyUI-JoyCaption
ComfyUI-JoyCaptionは、LLaVAモデルを活用したComfyUI用のカスタムノードです。画像からスタイル付きのキャプション…
★ 284 ⑂ 33 GPL-3.0 2025-12-24
ComfyUI GitHub ComfyUI-ResAdapter
ComfyUI-ResAdapterは、人気のある画像生成AI「ResAdapter」の機能をComfyUI上で利用可能にするための拡張機能です。…
★ 281 ⑂ 9 Apache-2.0 2024-05-23
3D / NeRF GitHub video_to_world
本ツール「World Reconstruction From Inconsistent Views」は、ビデオ拡散モデルから3Dの世界を再構築する革新的な…
★ 258 ⑂ 23 MIT 2026-04-27
動画生成 GitHub HyDRA
HyDRAは、動的なビデオ世界モデルにおいて、視界外に移動した被写体の追跡と動きの連続性維持を可能にするハイブリッ…
★ 258 ⑂ 14 2026-04-29
AIエージェント GitHub AutoResearch-SibylSystem
Sibyl Research Systemは、文献調査から仮説生成、GPU実験実行、そして学会発表レベルの論文執筆まで、機械学習研究…
★ 256 ⑂ 34 2026-03-25
ComfyUI GitHub ComfyUI-Whisper
ComfyUI Whisperは、OpenAIのWhisperモデルを利用して音声の文字起こしや動画への字幕追加を可能にするComfyUIの拡張…
★ 247 ⑂ 39 NOASSERTION 2026-06-07