概要
MidiTokは、MIDIやabcといった音楽ファイルをディープラーニングモデル(Transformerなど)が扱えるトークンシーケンスに変換するためのPythonライブラリです。
REMIやCompound Wordといった主要な音楽トークン化手法に対応し、Byte Pair Encoding (BPE)などの訓練方法やデータ拡張機能を提供します。
Hugging Face Hubとの連携も可能で、音楽生成、転写、音楽情報検索(MIR)といった多様なタスクに応用できます。
高速な処理のためにSymusicやHugging Faceのtokenizerライブラリを活用しており、AIによる音楽処理に関心のある開発者や研究者に適しています。
互換性・特徴
- Python
- Deep Learning
- Hugging Face対応
- 音楽処理
基本情報
| ライセンス | MIT |
| Stars | 877 |
| Forks | 101 |
| カテゴリ | 音楽生成 |
| アクティビティ | mid |
最新のissue
- miditokをストリーミングモードで使用するためのiterableデータセットの提案 (更新: 2026-04-07 / Proposing iterable dataset to use miditok with streaming mode)
- `only_notes_onsets=True`を指定した`get_bars_ticks()`が最終ダウンビートを除外する (更新: 2026-04-01 / `get_bars_ticks()` with `only_notes_onsets=True` excludes final downbeats)
最新リリース: v3.0.6.post1 PerTok patch (2025-07-22)
