3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識

argmax-oss-swift

★ 6.2k ⑂ 572 MIT 更新: 2026-06-10 GitHubで見る →

#Apple Silicon #CLI #iOS #macOS #Swift #音声合成 #音声認識

概要

Argmax Open-Source SDK Swiftは、Apple Siliconデバイス上で動作する高性能なオープンソースAI推論フレームワーク群です。

OpenAI Whisperによる高精度な音声認識（WhisperKit）、Pyannoteを活用した話者分離（SpeakerKit）、そしてQwen-TTSをベースにしたリアルタイム音声合成（TTSKit）を提供します。

これにより、開発者はオフラインかつプライベートな環境で動作する、高度な音声AI機能をmacOSやiOSアプリケーションに容易に統合できます。

主にSwiftを用いたAppleプラットフォーム向けアプリケーション開発者、特にオンデバイスAI機能を追求する方を対象としています。

互換性・特徴

Apple Silicon
Swift
iOS
macOS
音声認識
音声合成
CLI

基本情報

ライセンス	MIT
Stars	6,213
Forks	572
カテゴリ	ASR / 音声認識
アクティビティ	high

最新のissue

部分的なモデルDLが修復されず、resolveRepoのローカルキャッシュチェックが不完全フォルダを許容する (更新: 2026-06-13 / Partial model download is never repaired, resolveRepo’s local-cache check accepts incomplete folders)
プロンプト事前入力で空の文字起こし。リポジトリは一貫しているが奇妙 (更新: 2026-06-10 / Empty transcription with prompt prefill. Consistent repo, but odd)
SpeakerKit: iOS 27.0 betaでのdiarization劣化（単一cluster/VAD劣化）。iOS 26.4/macOS 26.5では動作 (更新: 2026-06-10 / SpeakerKit: degenerate diarization on iOS 27.0 beta (single cluster + degraded VAD) — identical on all computeUnits; works on iOS 26.4 / macOS 26.5)

最新リリース: v1.0.0 (2026-05-01)

GitHub: https://github.com/argmaxinc/argmax-oss-swift

← 全リポジトリ一覧へ