3D / NeRF GitHub Scal3R
Scal3Rは、CVPR 2026のHighlight論文として発表された、大規模な3D再構築のためのスケーラブルなテスト時学習手法で…
★ 494 ⑂ 37 NOASSERTION 2026-05-11
AIエージェント GitHub ai-engineering-from-scratch-zh
このリポジトリは「AI Engineering from Scratch」の中国語派生版であり、AIエンジニアリングを基礎から体系的に学ぶ…
★ 487 ⑂ 78 MIT 2026-06-26
動画生成 GitHub Google-Colab_Notebooks
このリポジトリは、様々なAIプロジェクトのためのGoogle Colabノートブック集です。特に、ビジュアルプログラミング…
★ 483 ⑂ 167 2026-06-20
画像生成 GitHub PixelSmile
PixelSmileは、顔の表情を連続的に制御しながら、微調整された編集を可能にするツールです。既存の顔の同一性を強く…
★ 478 ⑂ 22 Apache-2.0 2026-04-22
LLM GitHub smfs
smfsは、エージェント向けに設計された高性能なファイルシステムです。ファイル、画像、動画などあらゆるデータを格…
★ 459 ⑂ 35 MIT 2026-06-12
音声生成 / TTS GitHub Confucius4-TTS
Confucius4-TTSは、LLMと音声エンコーダをベースにした、多言語・異言語対応のゼロショット音声合成エンジンです。「…
★ 448 ⑂ 45 NOASSERTION 2026-06-17
LLM GitHub orthrus
Orthrusは、大規模言語モデル(LLM)の推論を高速化するためのデュアルアーキテクチャフレームワークです。自己回帰…
★ 446 ⑂ 19 MIT 2026-05-18
画像生成 GitHub Bonsai-Image-Demo
Bonsai Image Demoは、Apple Silicon (macOS) またはNVIDIA GPU (Linux/Windows) を利用して、ローカルで画像を生成…
★ 444 ⑂ 58 Apache-2.0 2026-06-14
マルチモーダル GitHub GLM-skills
「zai-org/GLM-skills」は、GLMモデルファミリー向けの公式スキルセットを統合したリポジトリです。Claude Code、Ope…
★ 436 ⑂ 36 Apache-2.0 2026-04-15
ComfyUI GitHub ComfyUI-OmniVoice-TTS
ComfyUI-OmniVoice-TTSは、画像生成AIのComfyUI向けに開発された、ゼロショット多言語テキスト読み上げ(TTS)ノード…
★ 434 ⑂ 56 Apache-2.0 2026-06-11
画像生成 GitHub verl-omni
VeRL-Omniは、拡散モデルやオムニモダリティモデルといったマルチモーダル生成モデルに特化した強化学習(RL)トレー…
★ 431 ⑂ 63 Apache-2.0 2026-06-26
LLM GitHub EnterpriseRAG-Bench
EnterpriseRAG-Benchは、企業の社内文書に特化したRAGシステム評価用のデータセットおよびベンチマークを提供します…
★ 427 ⑂ 42 MIT 2026-05-08
動画生成 GitHub ai-shortVideo-pipeline
myAiVideosは、AIを活用した中国語短編動画の自動制作パイプラインです。トピック発見からクリエイティブ生成、視覚…
★ 427 ⑂ 3 MIT 2026-06-15
LLM GitHub KVarN
KVarNは、LLMのKVキャッシュ量子化をvLLM環境で実現するネイティブバックエンドです。特に、エージェントや長文コン…
★ 419 ⑂ 27 Apache-2.0 2026-06-22
マルチモーダル GitHub VEGA-3D
VEGA-3Dは、「Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding」の公式実装…
★ 418 ⑂ 23 Apache-2.0 2026-06-18
LLM GitHub paper-plot-skills
「Paper Plot Skills」は、学術論文で用いる図表を効率的に再現・生成するためのAIスキルツールボックスです。厳選さ…
★ 417 ⑂ 23 2026-04-20
動画生成 GitHub OmniShow
OmniShowは、ByteDanceが開発した人間とオブジェクトのインタラクションビデオ生成(HOIVG)のための統合モデルです…
★ 416 ⑂ 23 Apache-2.0 2026-05-19
LLM GitHub entroly
Entrolyは、AIのハルシネーションを検知し、トークン費用を70-95%削減するオープンソースのコンテキストエンジンです…
★ 415 ⑂ 66 Apache-2.0 2026-06-22
AIエージェント GitHub mobileClaw
MobileClawは、Androidデバイス上でLLMエージェントを動作させるためのオープンソースの実験的なモバイルアプリです…
★ 402 ⑂ 16 NOASSERTION 2026-06-26
LLM GitHub Nova3D
Nova3Dは、テキストまたは参照画像から編集可能で、パーツごとに分割された3Dモデルを生成するAIツールです。従来の…
★ 401 ⑂ 42 MIT 2026-06-28
マルチモーダル GitHub antfly
Antflyは、etcdのRaftライブラリを基盤とした分散型検索エンジンです。フルテキスト検索(BM25)、ベクトル類似性、…
★ 400 ⑂ 27 NOASSERTION 2026-06-29
動画生成 GitHub World-R1
World-R1は、テキストからビデオを生成する際に、3Dの幾何学的制約を強化学習で強化する新しいフレームワークです。…
★ 400 ⑂ 15 MIT 2026-06-03
画像生成 GitHub FluxRT
FluxRTは、FLUX.2-klein-4Bモデルを搭載し、消費者向けGPUに最適化されたリアルタイムストリーム編集パイプラインで…
★ 397 ⑂ 56 Unlicense 2026-06-13
AIエージェント GitHub bux
Browser Use Box (bux)は、Claude Codeエージェントと実際のChromiumブラウザを組み合わせて、Playwrightスタイルの…
★ 395 ⑂ 48 MIT 2026-06-17