概要
PARSEは、記述言語学のフィールドワークと、それに続く比較分析を支援するブラウザベースのワークステーションです。
録音された音声の転写、正確なタイムスタンプ管理、話者間の語彙形式比較、借用証拠の追跡、そしてクリーンなデータセットのエクスポートといった一連の作業を、統合されたワークスペースで効率的に行えます。
主要な特徴としては、階層的なIPA/正書法注釈機能、話者間の同系語(cognate)判定や借用検出機能、LingPyおよびNEXUS形式でのデータエクスポート、そしてAI支援による音声テキスト変換(STT)が挙げられます。
想定ユーザーは、長時間の録音、単語リスト、複数の話者や方言を扱うフィールドワークの言語学者、比較言語学者、歴史言語学者、および言語ドキュメンテーションチームです。
互換性・特徴
- Web UI
- Python
- React
- AI支援
- 言語学ツール
- データエクスポート
基本情報
| ライセンス | MIT |
| Stars | 4 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |
最新のissue
- インポーターがAuditionキューのプレフィックスをconcept_enにリークする(#529の関連) (更新: 2026-05-19 / Importer leaks Audition cue prefix into concept_en (sibling of #529))
- issue #529(concepts.csv汚染)が解決されたら–legacy-anchorワークアラウンドを廃止する (更新: 2026-05-19 / Retire –legacy-anchor workaround once issue #529 (concepts.csv pollution) is resolved)
- export_review_dataをMCP/チャットツールとして公開する (更新: 2026-05-19 / Expose export_review_data as an MCP / chat tool)
- コンセプトID汚染:話者ごとのバリアントサフィックスがグローバルなconcept_enに保存される (更新: 2026-05-19 / Concept identity pollution: per-speaker variant suffixes stored in global concept_en)
- [MC-410-E] 重複する_shift_annotation_intervalsを共有モジュールに統合する (更新: 2026-05-17 / [MC-410-E] Consolidate duplicated _shift_annotation_intervals into one shared module)
