概要
このGitHubリポジトリ「microsoft/unilm」は、Microsoftが提供する、タスク、言語、モダリティ(テキスト、画像、音声など)を横断する大規模な自己教師あり事前学習モデル(Foundation Models)とその先進アーキテクチャの研究開発を集約したものです。
DeepNet、Magneto、BitNet、RetNet、LongNetといったTransformerの革新的な進化形や、Kosmosシリーズに代表されるマルチモーダル大規模言語モデル(MLLM)、多言語対応モデル(UniLM、InfoXLM)など、多様な最先端AIモデルを提供します。
汎用性と効率性を追求し、特に大規模AIモデルの研究者や開発者、また、自然言語処理、コンピュータビジョン、マルチモーダルAIの分野で最先端技術を導入したい企業や個人を想定しています。
互換性・特徴
- Python
- AI/ML
- Multilingual
- Multimodal
- Research
- Foundation Models
基本情報
| ライセンス | MIT |
| Stars | 22,129 |
| Forks | 2,698 |
| カテゴリ | マルチモーダル |
| アクティビティ | mid |
最新のissue
- unimim: ViT-Large/14入力解像度196での位置埋め込み不一致 (更新: 2026-04-04 / [unimim] mismatched positional_embed about vit-large/14 for input resolution with 196)
- unimimのコード募集 (更新: 2026-04-04 / Call for unimim’s code)
- unimim、1年経っても利用不可 (更新: 2026-04-04 / unimim is still unavailable after one year)
- WavLMのバッチサイズ (更新: 2026-04-01 / batch size of WavLM)
- TrOCRのモデルとテストデータセットをダウンロードできません (更新: 2026-03-19 / Unable to download the models and test dataset of trocr)
最新リリース: YOCO (2024-05-09)