1,644 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#データセット生成 (2 repos)

「データセット生成」タグが付いたリポジトリ

マルチモーダル
GitHub
synthvision
SynthVisionは、医療画像VQA(Visual Question Answering)データセットの生成と、それを用いたVLM(Vision Language…
★ 32 ⑂ 5 2026-03-23
ASR / 音声認識
GitHub
noisekit
noisekitは、自動音声認識(ASR)システムのロバスト性ベンチマークのために、ノイズ層別化された音声データセットを…
★ 1 MIT 2026-05-22