概要
「crafter/trx」は、Whisperを活用してオーディオやビデオを書き起こすためのエージェントファーストなCLIツールです。
URLやローカルファイルからメディアをダウンロード・クリーンアップし、機械可読なテキストに変換します。
AIエージェント連携に特化しており、JSON出力、ドライラン検証、出力フィールド制御、スキーマの自己検査機能を提供。
AIエージェントを用いたメディア処理の自動化や、効率的な音声認識ツールを求める開発者やユーザーに最適です。
日本語を含む多言語の書き起こしに対応し、`yt-dlp`と`ffmpeg`を統合しています。
互換性・特徴
- CLI
- AIエージェント対応
- 日本語対応
- 音声認識
- 動画/音声処理
- Bun
基本情報
| ライセンス | MIT |
| Stars | 82 |
| Forks | 14 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |
最新リリース: v0.4.0 — OpenAI API backend + large-v3-turbo (2026-04-06)