ASR / 音声認識 GitHub whisper-jax
Whisper JAXは、OpenAIのWhisperモデルをJAXで実装したもので、特にTPUでの実行時にOpenAIのPyTorch版と比較して最大…
★ 4.7k ⑂ 414 Apache-2.0 2024-04-03
マルチモーダル GitHub align-anything
Align-Anythingは、あらゆるモダリティの大規模モデル(any-to-anyモデル)を人間の意図や価値観に合わせることを目…
★ 4.7k ⑂ 505 Apache-2.0 2025-11-27
3D / NeRF GitHub neuralangelo
「Neuralangelo」は、CVPR 2023で発表された高精度なニューラル表面再構成のための公式実装ツールです。既存の動画か…
★ 4.6k ⑂ 403 NOASSERTION 2024-04-14
3D / NeRF GitHub tiny-cuda-nn
NVlabs/tiny-cuda-nnは、高速なC++/CUDAベースのニューラルネットワークフレームワークです。「完全に融合された」多…
★ 4.5k ⑂ 574 NOASSERTION 2026-04-21
LLM GitHub memory-lancedb-pro
memory-lancedb-proは、OpenClawエージェントに長期記憶能力を付与するLanceDBベースのプラグインです。AIエージェン…
★ 4.4k ⑂ 729 2026-06-27
画像生成 GitHub deep-daze
Deep Dazeは、OpenAIのCLIPとSiren(Implicit neural representation network)を活用して、テキストプロンプトから…
★ 4.3k ⑂ 311 MIT 2022-03-13
動画生成 GitHub champ
Champは、3Dパラメトリックガイダンスを用いて、人間画像の制御可能かつ一貫したアニメーションを生成するツールです…
★ 4.3k ⑂ 482 MIT 2024-07-10
マルチモーダル GitHub lmms-eval
lmms-evalは、テキスト、画像、ビデオ、オーディオといった様々なモダリティを横断する、オールインワンのマルチモー…
★ 4.3k ⑂ 605 NOASSERTION 2026-06-24
動画生成 GitHub Text2Video-Zero
Text2Video-Zeroは、既存のText-to-Image拡散モデルを活用し、テキストプロンプトから動画をゼロショット生成するツ…
★ 4.2k ⑂ 387 NOASSERTION 2023-05-06
LLM GitHub Clawith
Clawithは、オープンソースのマルチエージェントコラボレーションプラットフォームです。各AIエージェントに永続的な…
★ 4.0k ⑂ 658 Apache-2.0 2026-06-16
動画生成 GitHub lingbot-world
LingBot-Worldは、ビデオ生成技術を基盤としたオープンソースの世界シミュレーター(ワールドモデル)です。リアルタ…
★ 4.0k ⑂ 363 Apache-2.0 2026-05-22
AIエージェント GitHub guizang-social-card-skill
このツールは、GitHub上のAI関連OSSを自動でWordPressカタログ化するシステムです。LLM(Gemini, Claude, Codexなど…
★ 4.0k ⑂ 340 AGPL-3.0 2026-05-27
AIエージェント GitHub awesome-opensource-ai
このリポジトリは、オープンソースのAIプロジェクト、モデル、ツール、インフラストラクチャを厳選したリストです。P…
★ 4.0k ⑂ 466 CC0-1.0 2026-06-28
動画生成 GitHub VACE
VACEは、ICCV 2025で発表された論文の公式実装で、ビデオの作成と編集を目的としたオールインワンのAIモデルです。参…
★ 3.8k ⑂ 266 Apache-2.0 2025-10-17
3D / NeRF GitHub 4DGaussians
このツールは、リアルタイム動的シーンレンダリングのための「4D Gaussian Splatting」手法を実装しています。CVPR 2…
★ 3.8k ⑂ 375 Apache-2.0 2024-10-27
3D / NeRF GitHub OpenSfM
OpenSfMはPythonで書かれたStructure from Motion(SfM)ライブラリで、複数の画像からカメラの姿勢と3Dシーンを再構…
★ 3.8k ⑂ 898 BSD-2-Clause 2026-06-18
音声生成 / TTS GitHub MOSS-TTS-Nano
MOSS-TTS-Nanoは、MOSI.AIとOpenMOSSチームが開発したオープンソースの多言語対応小型音声生成モデルです。わずか0.1…
★ 3.8k ⑂ 479 Apache-2.0 2026-06-02
動画生成 GitHub FastVideo
FastVideoは、ビデオ生成を高速化するための統合された推論および後処理フレームワークです。最先端のビデオ生成モデ…
★ 3.8k ⑂ 370 Apache-2.0 2026-06-26
画像生成 GitHub remove-ai-watermarks
「Remove-AI-Watermarks」は、Google Gemini、ChatGPT/DALL-E、Stable Diffusion、Adobe Firefly、Midjourneyなど、…
★ 3.7k ⑂ 334 Apache-2.0 2026-06-26
動画生成 GitHub Generative-Media-Skills
このツールは、AIエージェント(Claude Code、Cursor、Gemini CLIなど)向けに設計されたマルチモーダル生成メディア…
★ 3.6k ⑂ 411 MIT 2026-06-22
3D / NeRF GitHub BlenderProc
BlenderProc2は、フォトリアリスティックなトレーニング画像を生成するためのプロシージャルなBlenderパイプラインで…
★ 3.6k ⑂ 512 GPL-3.0 2026-01-20
画像生成 GitHub TurboDiffusion
TurboDiffusionは、ビデオ拡散モデルによる動画生成を100〜200倍に高速化するフレームワークです。単一のRTX 5090な…
★ 3.5k ⑂ 267 Apache-2.0 2026-06-17
3D / NeRF GitHub map-anything
MapAnythingは、画像、キャリブレーション、ポーズ、深度などの多様な入力から、統一されたフィードフォワードのトラ…
★ 3.5k ⑂ 269 Apache-2.0 2026-06-03
3D / NeRF GitHub AliceVision
AliceVisionは、写真から3Dオブジェクトやシーンを再構築し、カメラの動きを追跡するフォトグラメトリー・コンピュー…
★ 3.5k ⑂ 874 NOASSERTION 2026-06-26