3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

hearsay

★ 12 ⑂ 1 MIT 更新: 2026-06-14 GitHubで見る →

概要

hearsayは、YouTube動画、ポッドキャスト、ローカル録音などの多様な音声・動画コンテンツを、クリーンでタイムスタンプ付きのLLM対応マークダウン形式に変換するコマンドラインツールです。

従来の`yt-dlp`やWhisperといった複数のツールを手動で組み合わせる手間を省き、ワンコマンドでコンテンツの文字起こしから構造化までを一元的に処理します。

人間が読みやすく、AIモデル(特にRAGパイプラインやAIエージェント)が効率的に利用できる段落、実際のタイムスタンプ、チャプター見出しを含むマークダウンを生成し、オプションで安定したスキーマを持つJSONサイドカーも提供します。

Apple Silicon環境ではParakeetエンジンを利用してより高速な文字起こしが可能です。

RAGパイプラインやAIエージェントに動画・音声コンテンツを組み込みたい開発者や、文字起こし作業を効率化したいユーザーに最適です。

互換性・特徴

  • CLI
  • Python
  • LLM向け
  • RAGパイプライン
  • 日本語対応

基本情報

ライセンスMIT
Stars12
Forks1
カテゴリASR / 音声認識
アクティビティlow

最新リリース: v0.3.0 — dataset export mode + clean clip boundaries (2026-06-14)

GitHub: https://github.com/mudassar531/hearsay