3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

VAR

★ 8.7k ⑂ 568 MIT 更新: 2025-11-10 GitHubで見る →

概要

VARは、拡散モデルの枠を超え、GPTスタイルのアプローチで視覚生成の新たな地平を切り開く最先端の画像生成手法です。

Next-Scale Predictionを通じたスケーラブルな画像生成を特徴とし、NeurIPS 2024で最優秀論文賞を受賞しました。

テキストから画像、さらにはテキストから動画生成へと応用が広がっており、最先端の研究成果として注目されています。

Hugging Faceでモデルの重みが公開されており、Web上のデモプラットフォームで手軽に体験できるほか、Jupyter Notebookを通じてより技術的な詳細に触れることも可能です。

画像生成技術の研究者や開発者、また最先端のAIによるクリエイティブな表現に興味のある一般ユーザーに最適なツールです。

互換性・特徴

  • Web UI
  • Python
  • 画像生成
  • 動画生成
  • Hugging Face
  • 研究開発

基本情報

ライセンスMIT
Stars8,701
Forks568
カテゴリ画像生成
アクティビティmid

最新のissue

GitHub: https://github.com/FoundationVision/VAR