ASR / 音声認識 GitHub ASRT_SpeechRecognition
ASRTは、TensorFlow.kerasを基盤とした深層学習ベースの中国語音声認識システムです。深度畳み込みニューラルネット…
★ 8.4k ⑂ 1.9k GPL-3.0 2026-04-10
マルチモーダル GitHub minimind-v
MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトで…
★ 8.2k ⑂ 897 Apache-2.0 2026-05-19
画像生成 GitHub nexa-sdk
NexaSDKは、AIモデルをデバイス上で最小限のエネルギーで高速かつスマートに実行するための高性能ローカル推論フレー…
★ 8.1k ⑂ 1.0k Apache-2.0 2026-06-25
3D / NeRF GitHub LiveTalking
LiveTalkingは、リアルタイムでインタラクティブなストリーミングデジタルヒューマンを作成・操作するためのツールで…
★ 8.0k ⑂ 1.3k Apache-2.0 2026-06-20
音声生成 / TTS GitHub Vision-Agents
StreamのOpen Vision Agentsは、リアルタイムビデオAIを構築するためのマルチモーダルAIエージェントフレームワーク…
★ 8.0k ⑂ 662 Apache-2.0 2026-06-24
AIエージェント GitHub Upsonic
Upsonicは、Pythonで自律型AIエージェントや従来のAIエージェントを構築するためのフレームワークです。大規模言語モ…
★ 7.9k ⑂ 737 MIT 2026-06-18
ASR / 音声認識 GitHub OmniVoice-Studio
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。リアルタイムディクテーション、3秒の音声クリップ…
★ 7.7k ⑂ 1.2k NOASSERTION 2026-06-28
LLM GitHub Horizon
Horizonは、AIを活用して個人のニュースレーダーを構築し、日報形式のブリーフィングを英語と中国語で提供するツール…
★ 7.6k ⑂ 1.1k MIT 2026-06-28
ASR / 音声認識 GitHub mlx-audio
MLX-Audioは、AppleのMLXフレームワークを基盤とし、Apple Silicon (Mシリーズチップ) に最適化された高速で効率的な…
★ 7.4k ⑂ 650 MIT 2026-06-19
LLM GitHub opencompass
OpenCompassは、大規模言語モデル(LLM)の評価を効率的かつ正確に行うための包括的なプラットフォームです。強力な…
★ 7.1k ⑂ 793 Apache-2.0 2026-06-24
AIエージェント GitHub text-to-cad
このツールは、コーディングエージェント(Codex、Claude Codeなど)を使用して3Dモデルを生成するためのオープンソ…
★ 7.0k ⑂ 833 MIT 2026-06-27
AIエージェント GitHub Bindu
Binduは、AIエージェントのためのアイデンティティ、通信、決済レイヤーを提供するプラットフォームです。エージェン…
★ 7.0k ⑂ 408 NOASSERTION 2026-06-22
ASR / 音声認識 GitHub PaddleX
PaddleX 3.0は、飛桨(PaddlePaddle)フレームワークを基盤とした低コード開発ツールです。200以上の開箱即用な事前…
★ 6.2k ⑂ 1.2k Apache-2.0 2026-06-25
LLM GitHub atomic-agents
Atomic Agentsは、AIパイプラインとアプリケーションを構築するための軽量でモジュール式のフレームワークです。LEGO…
★ 6.0k ⑂ 514 MIT 2026-06-20
ASR / 音声認識 GitHub silero-models
Silero Modelsは、事前学習済みのテキスト読み上げ(TTS)モデルを開発者向けに提供するライブラリです。このツール…
★ 6.0k ⑂ 366 NOASSERTION 2026-06-04
ASR / 音声認識 GitHub FunClip
FunClipは、オープンソースで高精度かつ使いやすい動画クリッピングツールです。Alibaba TONGYIのFunASR Paraformer…
★ 5.9k ⑂ 705 MIT 2026-06-25
動画生成 GitHub Awesome-Video-Diffusion
「Awesome Video Diffusion」は、動画生成、編集、復元、理解、NeRFなど、動画関連の多岐にわたるタスクに対応する最…
★ 5.7k ⑂ 365 2026-06-16
AIエージェント GitHub semble
Sembleは、AIエージェント向けに設計された高速かつ正確なコード検索ライブラリです。`grep+read`と比較して約98%も…
★ 5.4k ⑂ 232 MIT 2026-06-24
LLM GitHub awesome-free-llm-apis
このリポジトリは、永続的な無料利用枠を提供する大規模言語モデル(LLM)APIの厳選されたリストを提供します。コス…
★ 5.4k ⑂ 511 CC0-1.0 2026-06-16
マルチモーダル GitHub vllm-omni
vLLM-Omniは、既存のvLLMを拡張し、オムニモダリティモデルの効率的かつ低コストな推論と提供を可能にするフレームワ…
★ 5.3k ⑂ 1.2k Apache-2.0 2026-06-29
3D / NeRF GitHub gsplat
gsplatは、3D Gaussian Splatting技術のCUDA高速化ラスタライゼーションを実現するオープンソースライブラリで、Pyth…
★ 5.3k ⑂ 884 Apache-2.0 2026-06-23
LLM GitHub whichllm
「whichllm」は、ユーザーのコンピューターハードウェア(GPU/CPU/RAM)を自動検出し、その環境で最も性能を発揮する…
★ 5.2k ⑂ 279 MIT 2026-06-24
ASR / 音声認識 GitHub wenet
WeNetは、「Production First and Production Ready」を掲げるエンドツーエンド音声認識ツールキットです。最先端の…
★ 5.2k ⑂ 1.2k Apache-2.0 2026-06-15
3D / NeRF GitHub kaolin
NVIDIA Kaolinは、3D深層学習研究を加速するために設計されたPyTorchライブラリです。GPUに最適化された操作群を提供…
★ 5.1k ⑂ 624 Apache-2.0 2026-06-18