252 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識 (7 repos)

カテゴリ「ASR / 音声認識」のリポジトリ一覧

ASR / 音声認識

whisper-large-v3

Whisper large-v3は、OpenAIが開発した最先端の自動音声認識（ASR）および音声翻訳モデルです。500万時間以上の学習…

❤ 5.7k apache-2.0 2024-08-12

ASR / 音声認識

whisper-large-v3-turbo

Whisper large-v3-turboは、OpenAIが提案する最先端の自動音声認識（ASR）および音声翻訳モデルであるWhisper large-…

❤ 3.0k mit 2024-10-04

ASR / 音声認識

Voxtral-Small-24B-2507

Voxtral Small 1.0（24B）は、Mistral Small 3系をベースに音声入力機能を強化した大規模音声理解モデルです。音声の…

❤ 493 ↓ 47.6k apache-2.0 2025-12-20

ASR / 音声認識

GitHub

ComfyUI-Whisper

ComfyUI Whisperは、OpenAIのWhisperモデルを利用して音声の文字起こしや動画への字幕追加を可能にするComfyUIの拡張…

★ 233 ⑂ 38 NOASSERTION 2026-01-02

ASR / 音声認識

whisperkit-coreml

WhisperKitは、Apple Siliconデバイス向けに設計されたオンデバイス音声AI SDK「Argmax OSS」の一部として提供される…

❤ 173 2026-04-24

ASR / 音声認識

VibeVoice-ASR-HF

VibeVoice-ASR-HFは、Microsoftの長時間音声向け音声認識モデルをTransformers互換で使えるようにしたツールです。最…

❤ 125 ↓ 312.3k mit 2026-03-09

ASR / 音声認識

wav2vec2-large-xlsr-53-russian

このリポジトリは、Jonatas Grosman氏が開発したロシア語音声認識用のWav2Vec2-large-xlsr-53モデルを提供します。Hu…

❤ 74 apache-2.0 2022-12-14