1,791 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

diarize

★ 71 ⑂ 6 Apache-2.0 更新: 2026-05-06 GitHubで見る →

概要

diarizeは、音声ファイルから「誰がいつ話したか」を自動的に識別するPython製のスピーカーダイアリゼーションツールです。

GPUやAPIキー、アカウント登録が不要で、CPUのみで動作するのが最大の特徴です。

Apache 2.0ライセンスで提供され、VoxConverseデータセットにおいて約4.8%の低いDiarization Error Rate(DER)を達成し、リアルタイムの約8倍という高速処理能力を誇ります。

話者数の自動検出機能も備えており、開発者や研究者が手軽に、かつ高性能な音声分析を行いたい場合に最適です。

Python 3.9以降に対応し、WAV、MP3、FLAC、OGGなど多様な音声フォーマットをサポートしています。

互換性・特徴

  • Python
  • CLI
  • CPUのみ
  • 音声処理
  • オープンソース

基本情報

ライセンスApache-2.0
Stars71
Forks6
カテゴリASR / 音声認識
アクティビティlow

最新リリース: v0.1.2 (2026-05-06)

GitHub: https://github.com/FoxNoseTech/diarize