概要
このGitHubリポジトリ「microsoft/unilm」は、Microsoftが提供する、タスク、言語、モダリティ(テキスト、画像、音声など)を横断する大規模な自己教師あり事前学習モデル(Foundation Models)とその先進アーキテクチャの研究開発を集約したものです。
DeepNet、Magneto、BitNet、RetNet、LongNetといったTransformerの革新的な進化形や、Kosmosシリーズに代表されるマルチモーダル大規模言語モデル(MLLM)、多言語対応モデル(UniLM、InfoXLM)など、多様な最先端AIモデルを提供します。
汎用性と効率性を追求し、特に大規模AIモデルの研究者や開発者、また、自然言語処理、コンピュータビジョン、マルチモーダルAIの分野で最先端技術を導入したい企業や個人を想定しています。
互換性・特徴
- Python
- AI/ML
- Multilingual
- Multimodal
- Research
- Foundation Models
基本情報
| ライセンス | MIT |
| Stars | 22,152 |
| Forks | 2,699 |
| カテゴリ | マルチモーダル |
| アクティビティ | mid |
最新のissue
- anima — a substrate-native consciousness: capability gaps are architecture gaps (open repo, frozen verdicts) (更新: 2026-06-15)
- `kernels`を介した構築済みFlash Attentionカーネルの利用を検討する (更新: 2026-05-28 / Consider using pre-built Flash Attention kernels via `kernels`)
- unimim: ViT-Large/14入力解像度196での位置埋め込み不一致 (更新: 2026-04-04 / [unimim] mismatched positional_embed about vit-large/14 for input resolution with 196)
- unimimのコード募集 (更新: 2026-04-04 / Call for unimim’s code)
- unimim、1年経っても利用不可 (更新: 2026-04-04 / unimim is still unavailable after one year)
最新リリース: YOCO (2024-05-09)
