3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

attn_res

★ 30 ⑂ 2 Apache-2.0 更新: 2026-03-16 GitHubで見る →

概要

このプロジェクトは、Kimi TeamとMoonshotAIによる「Attention Residuals」のPyTorch実装です。

Grouped Query Attention (GQA)、SwiGLUフィードフォワードネットワーク、Rotary Position Embeddings (RoPE) を統合し、クリーンな単一ファイルで提供されます。

研究目的や教育目的で、Attention Residualsの概念をPyTorchで試したり、学習したりするのに適しています。

最新のTransformerアーキテクチャ要素(Attention Residuals、GQA、SwiGLU、RoPEなど)に関心のある開発者や研究者に特に有用です。

互換性・特徴

  • PyTorch
  • Python
  • ライブラリ
  • GPU必須
  • 深層学習

基本情報

ライセンスApache-2.0
Stars30
Forks2
カテゴリLLM
アクティビティlow

最新のissue

GitHub: https://github.com/kyegomez/attn_res