概要
Argmax Open-Source SDK Swiftは、Apple Siliconデバイス上で動作する高性能なオープンソースAI推論フレームワーク群です。
OpenAI Whisperによる高精度な音声認識(WhisperKit)、Pyannoteを活用した話者分離(SpeakerKit)、そしてQwen-TTSをベースにしたリアルタイム音声合成(TTSKit)を提供します。
これにより、開発者はオフラインかつプライベートな環境で動作する、高度な音声AI機能をmacOSやiOSアプリケーションに容易に統合できます。
主にSwiftを用いたAppleプラットフォーム向けアプリケーション開発者、特にオンデバイスAI機能を追求する方を対象としています。
互換性・特徴
- Apple Silicon
- Swift
- iOS
- macOS
- 音声認識
- 音声合成
- CLI
基本情報
| ライセンス | MIT |
| Stars | 6,213 |
| Forks | 572 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | high |
最新のissue
- 部分的なモデルDLが修復されず、resolveRepoのローカルキャッシュチェックが不完全フォルダを許容する (更新: 2026-06-13 / Partial model download is never repaired, resolveRepo’s local-cache check accepts incomplete folders)
- プロンプト事前入力で空の文字起こし。リポジトリは一貫しているが奇妙 (更新: 2026-06-10 / Empty transcription with prompt prefill. Consistent repo, but odd)
- SpeakerKit: iOS 27.0 betaでのdiarization劣化(単一cluster/VAD劣化)。iOS 26.4/macOS 26.5では動作 (更新: 2026-06-10 / SpeakerKit: degenerate diarization on iOS 27.0 beta (single cluster + degraded VAD) — identical on all computeUnits; works on iOS 26.4 / macOS 26.5)
最新リリース: v1.0.0 (2026-05-01)
