3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

tiny-llm

★ 4.3k ⑂ 333 Apache-2.0 更新: 2026-06-13 GitHubで見る →

概要

このプロジェクト「tiny-llm」は、システムエンジニア向けに大規模言語モデル(LLM)の推論サービスをMLXフレームワーク上で構築・学習するための実践的なコースです。

Apple Silicon環境に特化し、高レベルなライブラリに依存せず、Qwen3モデルを用いた推論システムの基礎(Attention, RoPEなど)から、vLLMに似た高度な最適化技術(KVキャッシュ、連続バッチ処理、Flash Attentionなど)までをPythonでゼロから実装します。

効率的なLLM推論の仕組みを深く理解したい開発者や、macOS上でLLMの学習・実装を行いたいシステムエンジニアを想定ユーザーとしています。

互換性・特徴

  • Python
  • MLX
  • Apple Silicon
  • LLM推論
  • 学習コース

基本情報

ライセンスApache-2.0
Stars4,294
Forks333
カテゴリLLM
アクティビティhigh

最新のissue

GitHub: https://github.com/skyzh/tiny-llm