ASR / 音声認識 GitHub FunClip
FunClipは、オープンソースで高精度かつ使いやすい動画クリッピングツールです。Alibaba TONGYIのFunASR Paraformer…
★ 5.9k ⑂ 705 MIT 2026-06-25
AIエージェント GitHub semble
Sembleは、AIエージェント向けに設計された高速かつ正確なコード検索ライブラリです。`grep+read`と比較して約98%も…
★ 5.4k ⑂ 232 MIT 2026-06-24
ASR / 音声認識 GitHub cactus
Cactusは、モバイルデバイスやウェアラブル向けに設計された低遅延AIエンジンです。ARM CPU上での高速かつ高精度な推…
★ 5.4k ⑂ 432 NOASSERTION 2026-06-26
マルチモーダル GitHub vllm-omni
vLLM-Omniは、既存のvLLMを拡張し、オムニモダリティモデルの効率的かつ低コストな推論と提供を可能にするフレームワ…
★ 5.3k ⑂ 1.2k Apache-2.0 2026-06-29
3D / NeRF GitHub gsplat
gsplatは、3D Gaussian Splatting技術のCUDA高速化ラスタライゼーションを実現するオープンソースライブラリで、Pyth…
★ 5.3k ⑂ 884 Apache-2.0 2026-06-23
LLM GitHub whichllm
「whichllm」は、ユーザーのコンピューターハードウェア(GPU/CPU/RAM)を自動検出し、その環境で最も性能を発揮する…
★ 5.2k ⑂ 279 MIT 2026-06-24
ASR / 音声認識 GitHub wenet
WeNetは、「Production First and Production Ready」を掲げるエンドツーエンド音声認識ツールキットです。最先端の…
★ 5.2k ⑂ 1.2k Apache-2.0 2026-06-15
マルチモーダル GitHub mlx-vlm
MLX-VLMは、Apple Silicon Mac上でMLXを利用してVision Language Models(VLM)および音声・動画対応のOmni Modelsの…
★ 5.1k ⑂ 645 MIT 2026-06-24
AIエージェント GitHub omnigent
Omnigentは、Claude Code、Codex、Pi、およびユーザーが作成したカスタムエージェントを含む、あらゆるAIエージェン…
★ 5.1k ⑂ 622 Apache-2.0 2026-06-27
マルチモーダル GitHub PixelRAG
PixelRAGは、ウェブページ、PDF、画像をスクリーンショットとして視覚的にレンダリングし、ビジョン言語モデルで埋め…
★ 5.0k ⑂ 387 Apache-2.0 2026-06-24
LLM GitHub opensquilla
OpenSquillaは、トークン効率を最大化するマイクロカーネルAIエージェントです。限られた予算で高い知能密度と優れた…
★ 4.9k ⑂ 360 Apache-2.0 2026-06-27
ASR / 音声認識 GitHub speech-to-speech
Speech To Speechは、オープンソースモデルを活用してローカルで高度な音声エージェントを構築するためのプロジェク…
★ 4.9k ⑂ 584 Apache-2.0 2026-06-26
3D / NeRF GitHub brush
Brushは、Gaussian splattingを活用した3D再構築エンジンです。macOS、Windows、Linux、Android、Webブラウザなど、…
★ 4.8k ⑂ 273 Apache-2.0 2026-06-24
3D / NeRF GitHub tiny-cuda-nn
NVlabs/tiny-cuda-nnは、高速なC++/CUDAベースのニューラルネットワークフレームワークです。「完全に融合された」多…
★ 4.5k ⑂ 574 NOASSERTION 2026-04-21
LLM GitHub memory-lancedb-pro
memory-lancedb-proは、OpenClawエージェントに長期記憶能力を付与するLanceDBベースのプラグインです。AIエージェン…
★ 4.4k ⑂ 729 2026-06-27
マルチモーダル GitHub lmms-eval
lmms-evalは、テキスト、画像、ビデオ、オーディオといった様々なモダリティを横断する、オールインワンのマルチモー…
★ 4.3k ⑂ 605 NOASSERTION 2026-06-24
LLM GitHub Clawith
Clawithは、オープンソースのマルチエージェントコラボレーションプラットフォームです。各AIエージェントに永続的な…
★ 4.0k ⑂ 658 Apache-2.0 2026-06-16
動画生成 GitHub lingbot-world
LingBot-Worldは、ビデオ生成技術を基盤としたオープンソースの世界シミュレーター(ワールドモデル)です。リアルタ…
★ 4.0k ⑂ 363 Apache-2.0 2026-05-22
AIエージェント GitHub guizang-social-card-skill
このツールは、GitHub上のAI関連OSSを自動でWordPressカタログ化するシステムです。LLM(Gemini, Claude, Codexなど…
★ 4.0k ⑂ 340 AGPL-3.0 2026-05-27
AIエージェント GitHub awesome-opensource-ai
このリポジトリは、オープンソースのAIプロジェクト、モデル、ツール、インフラストラクチャを厳選したリストです。P…
★ 4.0k ⑂ 466 CC0-1.0 2026-06-28
3D / NeRF GitHub OpenSfM
OpenSfMはPythonで書かれたStructure from Motion(SfM)ライブラリで、複数の画像からカメラの姿勢と3Dシーンを再構…
★ 3.8k ⑂ 898 BSD-2-Clause 2026-06-18
音声生成 / TTS GitHub MOSS-TTS-Nano
MOSS-TTS-Nanoは、MOSI.AIとOpenMOSSチームが開発したオープンソースの多言語対応小型音声生成モデルです。わずか0.1…
★ 3.8k ⑂ 479 Apache-2.0 2026-06-02
動画生成 GitHub FastVideo
FastVideoは、ビデオ生成を高速化するための統合された推論および後処理フレームワークです。最先端のビデオ生成モデ…
★ 3.8k ⑂ 370 Apache-2.0 2026-06-26
画像生成 GitHub remove-ai-watermarks
「Remove-AI-Watermarks」は、Google Gemini、ChatGPT/DALL-E、Stable Diffusion、Adobe Firefly、Midjourneyなど、…
★ 3.7k ⑂ 334 Apache-2.0 2026-06-26