1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

trx

★ 82 ⑂ 14 MIT 更新: 2026-04-07 GitHubで見る →

概要

「crafter/trx」は、Whisperを活用してオーディオやビデオを書き起こすためのエージェントファーストなCLIツールです。

URLやローカルファイルからメディアをダウンロード・クリーンアップし、機械可読なテキストに変換します。

AIエージェント連携に特化しており、JSON出力、ドライラン検証、出力フィールド制御、スキーマの自己検査機能を提供。

AIエージェントを用いたメディア処理の自動化や、効率的な音声認識ツールを求める開発者やユーザーに最適です。

日本語を含む多言語の書き起こしに対応し、`yt-dlp`と`ffmpeg`を統合しています。

互換性・特徴

  • CLI
  • AIエージェント対応
  • 日本語対応
  • 音声認識
  • 動画/音声処理
  • Bun

基本情報

ライセンスMIT
Stars82
Forks14
カテゴリASR / 音声認識
アクティビティlow

最新リリース: v0.4.0 — OpenAI API backend + large-v3-turbo (2026-04-06)

GitHub: https://github.com/crafter-station/trx