ASR / 音声認識 GitHub espnet
ESPnetは、音声認識、音声合成、音声翻訳など、様々なエンドツーエンドの音声処理タスクに対応する包括的なツールキ…
★ 9.9k ⑂ 2.4k Apache-2.0 2026-06-24
音声生成 / TTS GitHub voltagent
VoltAgentは、オープンソースのTypeScriptフレームワークとVoltOpsコンソールからなるAIエージェント開発プラットフ…
★ 9.8k ⑂ 1.0k MIT 2026-06-23
マルチモーダル GitHub X-AnyLabeling
X-AnyLabelingは、Segment Anythingなどの強力なAIモデルを活用し、データラベリングを効率化するツールです。自動ラ…
★ 9.6k ⑂ 1.0k GPL-3.0 2026-06-28
マルチモーダル GitHub seatunnel
Apache SeaTunnelは、マルチモーダルかつ高性能な分散型データ統合ツールです。日々大量のデータを効率的かつ安定し…
★ 9.4k ⑂ 2.3k Apache-2.0 2026-06-25
ASR / 音声認識 GitHub inference
Xorbits Inference (Xinference) は、言語、音声認識、マルチモーダルモデルの提供を容易にする強力で多機能なライブ…
★ 9.4k ⑂ 837 Apache-2.0 2026-06-24
3D / NeRF GitHub supersplat
SuperSplat Editorは、3D Gaussian Splatsの検査、編集、最適化、公開を可能にする無料のオープンソースツールです。…
★ 9.4k ⑂ 1.0k MIT 2026-06-24
マルチモーダル GitHub deeplake
Deep LakeはAIワークロードに特化したデータベースで、深層学習アプリケーション向けのストレージ形式を採用していま…
★ 9.2k ⑂ 717 Apache-2.0 2026-05-21
LLM GitHub learn-harness-engineering
AIコーディングエージェントが確実に動作するためのHarness Engineeringに特化したプロジェクトベースの学習コースで…
★ 9.1k ⑂ 964 MIT 2026-06-16
画像生成 GitHub StableStudio
StableStudioは、Stability AIが提供する生成AI用UI「DreamStudio」の公式オープンソース版です。ユーザーが生成され…
★ 9.1k ⑂ 919 MIT 2024-04-30
ASR / 音声認識 GitHub speech_recognition
このPythonライブラリ「SpeechRecognition」は、多様なオンラインおよびオフラインの音声認識エンジンとAPIに対応し…
★ 9.0k ⑂ 2.4k BSD-3-Clause 2026-06-16
マルチモーダル GitHub all-in-rag
このプロジェクト「All-in-RAG」は、大規模言語モデル(LLM)アプリケーション開発者向けのRAG(検索拡張生成)技術…
★ 9.0k ⑂ 4.5k 2026-06-05
マルチモーダル GitHub MobileAgent
Mobile-Agentは、Alibaba GroupのTongyi Labが開発した強力なGUIエージェントファミリーです。デスクトップ、モバイ…
★ 8.9k ⑂ 891 MIT 2026-05-14
3D / NeRF GitHub stable-dreamfusion
Stable-Dreamfusionは、テキストや画像から3Dモデルを生成するDreamfusionのPyTorch実装です。Stable Diffusionを2D…
★ 8.8k ⑂ 770 Apache-2.0 2023-12-10
LLM GitHub KAG
KAGは、OpenSPGエンジンと大規模言語モデル(LLM)を基盤とする、専門ドメインの知識ベース向け論理推論・Q&Aフレー…
★ 8.8k ⑂ 691 Apache-2.0 2026-01-28
LLM GitHub garden-skills
Garden Skillsは、Claude Code、Cursor、CodexなどのAIコーディングエージェント向けに、Webデザイン、知識検索、画…
★ 8.8k ⑂ 1.2k MIT 2026-06-10
音声生成 / TTS GitHub Bert-VITS2
Bert-VITS2は、多言語BERTをVITS2バックボーンに統合したテキスト読み上げ(TTS)システムです。このツールは、高度…
★ 8.8k ⑂ 1.3k AGPL-3.0 2026-06-22
3D / NeRF GitHub awesome-3D-gaussian-splatting
「Awesome 3D Gaussian Splatting」は、3D Gaussian Splatting(3DGS)および関連技術に特化した厳選されたリソース…
★ 8.7k ⑂ 538 MIT 2026-06-26
音楽生成 GitHub introtodeeplearning
MIT 6.S191「Introduction to Deep Learning」の公式コードとソフトウェアラボ資料を提供するリポジトリです。本コー…
★ 8.7k ⑂ 4.5k MIT 2026-01-04
画像生成 GitHub VAR
VARは、拡散モデルの枠を超え、GPTスタイルのアプローチで視覚生成の新たな地平を切り開く最先端の画像生成手法です…
★ 8.7k ⑂ 570 MIT 2025-11-10
マルチモーダル GitHub BentoML
BentoMLは、AIアプリケーションとモデル推論のために最適化されたオンラインサービングシステムを構築するためのPyth…
★ 8.7k ⑂ 978 Apache-2.0 2026-06-22
ASR / 音声認識 GitHub SenseVoice
SenseVoiceは、自動音声認識(ASR)、話者言語識別、音声感情認識、音声イベント検出、そして最新のアップデートでは…
★ 8.7k ⑂ 787 NOASSERTION 2026-06-22
LLM GitHub hermes-web-ui
「Hermes Web UI」は、AIエージェントである「Hermes Agent」のための高機能なウェブダッシュボードです。このツール…
★ 8.6k ⑂ 1.1k NOASSERTION 2026-06-27
音声生成 / TTS GitHub moonshine
Moonshine Voiceは、開発者向けのオープンソースAIツールキットで、リアルタイムの音声エージェントやアプリケーショ…
★ 8.6k ⑂ 464 NOASSERTION 2026-06-26
音声生成 / TTS GitHub EmotiVoice
EmotiVoiceは、Netease Youdaoが開発したオープンソースの多感情・プロンプト制御型テキスト読み上げ(TTS)エンジン…
★ 8.5k ⑂ 755 Apache-2.0 2024-08-13