422 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

how-to-train-your-gpt

★ 1.0k ⑂ 139 MIT 更新: 2026-05-10 GitHubで見る →

概要

このリポジトリは、現代の大規模言語モデル(LLM)をゼロから構築、訓練、実行する方法を学ぶための12章構成のインタラクティブな教科書です。

トークナイザー、埋め込み、アテンション、トレーニングループ、推論エンジンといった主要コンポーネントを、LLaMA 3スタイルアーキテクチャに沿ってコードを書きながら深く理解できます。

全コードは丁寧にコメントされ、「5歳児にも分かる」比喩と「エンジニア向けの構築」を両立。

Pythonの基本知識があれば、機械学習の経験がなくてもChatGPTの内部構造を深く学びたい開発者や学生に最適です。

互換性・特徴

  • Python
  • CLI
  • CPU対応
  • GPU推奨
  • Jupyter Notebook

基本情報

ライセンスMIT
Stars1,025
Forks139
カテゴリLLM
アクティビティhigh

GitHub: https://github.com/raiyanyahya/how-to-train-your-gpt