3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

steerling

★ 229 ⑂ 14 Apache-2.0 更新: 2026-06-18 GitHubで見る →

概要

Steerlingは、解釈可能な因果拡散言語モデルであり、マスク型拡散言語モデリングとコンセプト分解を統合しています。

このツールは、自信度に基づく非自己回帰型テキスト生成、予測を既知のコンセプト貢献に分解する機能、コンセプトのアクティベーションを操作して生成を制御する機能、そしてさまざまな表現を抽出する機能を提供します。

80億パラメータのモデルで、生成されたテキストの各予測が「既知のコンセプト」「発見されたコンセプト」「イプシロン」の3要素に分解され、高い解釈性を持つことが最大の特徴です。

言語モデルの内部動作を深く理解し、その生成プロセスをより細かく制御したい研究者や開発者、特にAIの解釈性に関心のあるAIエンジニアを想定しています。

本ツールはPython製で、18GB以上のVRAMを持つGPUとCUDA 12.8環境を必要とします。

互換性・特徴

  • Python
  • GPU必須
  • HuggingFace
  • PyTorch
  • CLI

基本情報

ライセンスApache-2.0
Stars229
Forks14
カテゴリLLM
アクティビティmid

最新のissue

GitHub: https://github.com/guidelabs/steerling