概要
Croqtileは、C++向けの低レベル組み込みドメイン固有言語(EDSL)であり、特にDMA(Direct-Memory-Access)のようなデータ移動処理のプログラミングを簡素化します。
GPUなどのヘテロジニアスハードウェア上での機械学習コンピューティングカーネル構築に特化しており、生産性の向上、コードの安全性確保、動的形状のサポートを特徴とします。
Pythonのような直感的なデータ形状操作を可能にし、DMA構成の複雑さを隠蔽することで、開発者は高レベルな戦略に集中できます。
コンパイル時および実行時の安全チェックによりデバッグ工数を削減し、シンボリックディメンション機能でMLカーネルに必要な動的形状を効率的に扱えます。
ヘテロジニアス環境でC++による高性能なMLカーネル開発を行うエンジニアを想定しています。
互換性・特徴
- C++
- GPU対応
- ML開発
- DSL
基本情報
| ライセンス | NOASSERTION |
| Stars | 32 |
| Forks | 5 |
| カテゴリ | LLM |
| アクティビティ | low |
最新のissue
- ターゲットごとのparallel-by境界を確認する。 (更新: 2026-04-27 / check the parallel-by bound per target.)
- wgmmaにおけるMN-majorのサポート。 (更新: 2026-03-06 / support MN-major for wgmma)
- hopperでparity waitを使用するための–ptx-barrierをサポートする。 (更新: 2026-03-06 / support –ptx-barrier to use parity wait in hopper)
