ASR / 音声認識 GitHub ASRT_SpeechRecognition
ASRTは、TensorFlow.kerasを基盤とした深層学習ベースの中国語音声認識システムです。深度畳み込みニューラルネット…
★ 8.4k ⑂ 1.9k GPL-3.0 2026-04-10
マルチモーダル GitHub minimind-v
MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトで…
★ 8.2k ⑂ 897 Apache-2.0 2026-05-19
画像生成 GitHub nexa-sdk
NexaSDKは、AIモデルをデバイス上で最小限のエネルギーで高速かつスマートに実行するための高性能ローカル推論フレー…
★ 8.1k ⑂ 1.0k Apache-2.0 2026-06-25
3D / NeRF GitHub LiveTalking
LiveTalkingは、リアルタイムでインタラクティブなストリーミングデジタルヒューマンを作成・操作するためのツールで…
★ 8.0k ⑂ 1.3k Apache-2.0 2026-06-20
AIエージェント GitHub Upsonic
Upsonicは、Pythonで自律型AIエージェントや従来のAIエージェントを構築するためのフレームワークです。大規模言語モ…
★ 7.9k ⑂ 737 MIT 2026-06-18
音声生成 / TTS GitHub vits
VITSは、エンドツーエンドのテキスト読み上げ(Text-to-Speech, TTS)システムであり、条件付き変分オートエンコーダ…
★ 7.9k ⑂ 1.4k MIT 2023-12-06
画像生成 GitHub Dreambooth-Stable-Diffusion
本リポジトリは、GoogleのDreamboothのアイデアをStable Diffusionに実装したものです。従来のTextual Inversionが単…
★ 7.7k ⑂ 799 MIT 2022-12-08
LLM GitHub rig
Rigは、スケーラブルでモジュール化された人間工学的なLLM(大規模言語モデル)アプリケーションを構築するためのRus…
★ 7.7k ⑂ 857 MIT 2026-06-23
AIエージェント GitHub inkos
InkOSは、AIエージェントが小説の執筆、監査、改訂を自律的に行うためのツールです。人間によるレビューゲートを設け…
★ 7.6k ⑂ 1.4k AGPL-3.0 2026-06-25
LLM GitHub Horizon
Horizonは、AIを活用して個人のニュースレーダーを構築し、日報形式のブリーフィングを英語と中国語で提供するツール…
★ 7.6k ⑂ 1.1k MIT 2026-06-28
AIエージェント GitHub yao
Yaoは、AIエージェントとWebアプリケーションを単一バイナリで構築するためのオープンソースランタイムです。会話型…
★ 7.5k ⑂ 683 NOASSERTION 2026-06-25
画像生成 GitHub lora
このツールは、拡散モデル(特にStable Diffusion)を効率的にファインチューニングするためのLow-rank adaptation (…
★ 7.5k ⑂ 493 Apache-2.0 2024-03-22
音声生成 / TTS GitHub MeloTTS
MeloTTSは、MITとMyShell.aiによって開発された、高品質な多言語テキスト読み上げライブラリです。英語(複数アクセ…
★ 7.5k ⑂ 1.1k MIT 2024-12-24
AIエージェント GitHub terax-ai
Teraxは、軽量でターミナルファーストのAIネイティブ開発ワークスペースです。Tauri 2、Rust、React 19を基盤とし、…
★ 7.5k ⑂ 810 Apache-2.0 2026-06-28
画像生成 GitHub mmagic
MMagic (OpenMMLab Multimodal Advanced, Generative, and Intelligent Creation Toolbox)は、テキストから画像生成…
★ 7.4k ⑂ 1.1k Apache-2.0 2024-08-06
ASR / 音声認識 GitHub mlx-audio
MLX-Audioは、AppleのMLXフレームワークを基盤とし、Apple Silicon (Mシリーズチップ) に最適化された高速で効率的な…
★ 7.4k ⑂ 650 MIT 2026-06-19
LLM GitHub opencompass
OpenCompassは、大規模言語モデル(LLM)の評価を効率的かつ正確に行うための包括的なプラットフォームです。強力な…
★ 7.1k ⑂ 793 Apache-2.0 2026-06-24
AIエージェント GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 7.0k ⑂ 833 MIT 2026-06-27
AIエージェント GitHub Bindu
Binduは、AIエージェントのためのアイデンティティ、通信、決済レイヤーを提供するプラットフォームです。エージェン…
★ 7.0k ⑂ 408 NOASSERTION 2026-06-22
音声生成 / TTS GitHub espeak-ng
eSpeak NGは、Linux、Windows、Androidなど多様なOSに対応するオープンソースのコンパクトなテキスト読み上げシンセ…
★ 6.6k ⑂ 1.2k GPL-3.0 2026-06-22
ASR / 音声認識 GitHub vibe
Vibeは、OpenAI Whisper技術を利用してオーディオやビデオをオフラインで高精度に文字起こしするツールです。データ…
★ 6.6k ⑂ 427 MIT 2026-05-01
AIエージェント GitHub CubeSandbox
Cube Sandboxは、AIエージェント向けに設計された高性能で安全なサンドボックスサービスです。RustVMMとKVMに基づい…
★ 6.5k ⑂ 534 NOASSERTION 2026-06-27
3D / NeRF GitHub openMVG
OpenMVGは、3DコンピュータビジョンとStructure from MotionのためのオープンソースC++ライブラリです。画像からの3D…
★ 6.5k ⑂ 1.7k MPL-2.0 2025-12-17
ASR / 音声認識 GitHub wav2letter
wav2letter++は、Facebook AI Researchが開発した自動音声認識(ASR)ツールキットです。現在はFlashlightフレームワ…
★ 6.4k ⑂ 992 NOASSERTION 2026-01-12