音声生成 / TTS GitHub openclaw.net
OpenClaw.NETは、.NET開発者と運用者向けの、NativeAOT対応AIエージェントランタイムおよびゲートウェイです。ローカ…
★ 422 ⑂ 77 MIT 2026-06-27
ComfyUI GitHub ComfyUI-DepthAnythingV3
ComfyUI上でDepth Anything V3を使えるようにするカスタムノード集です。単一画像や複数視点画像から深度推定を行い…
★ 422 ⑂ 29 MIT 2026-06-06
LLM GitHub KVarN
KVarNは、LLMのKVキャッシュ量子化をvLLM環境で実現するネイティブバックエンドです。特に、エージェントや長文コン…
★ 419 ⑂ 27 Apache-2.0 2026-06-22
マルチモーダル GitHub VEGA-3D
VEGA-3Dは、「Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding」の公式実装…
★ 418 ⑂ 23 Apache-2.0 2026-06-18
3D / NeRF HF HY-Motion-1.0
「HY-Motion 1.0」は、Tencentが開発した、テキストプロンプトから3Dヒューマンモーションを生成するための最先端モ…
❤ 418 ↓ 483 other 2025-12-31
LLM GitHub paper-plot-skills
「Paper Plot Skills」は、学術論文で用いる図表を効率的に再現・生成するためのAIスキルツールボックスです。厳選さ…
★ 417 ⑂ 23 2026-04-20
動画生成 HF LTX2.3-10Eros
10 Erosは、LTX系のimage-to-video向けに調整されたモデル/チェックポイントで、ComfyUIワークフローや専用ノードと…
❤ 416 ↓ 250.9k 2026-06-18
動画生成 GitHub OmniShow
OmniShowは、ByteDanceが開発した人間とオブジェクトのインタラクションビデオ生成(HOIVG)のための統合モデルです…
★ 416 ⑂ 23 Apache-2.0 2026-05-19
LLM GitHub entroly
Entrolyは、AIのハルシネーションを検知し、トークン費用を70-95%削減するオープンソースのコンテキストエンジンです…
★ 415 ⑂ 66 Apache-2.0 2026-06-22
3D / NeRF GitHub MasterSelects
MasterSelectsは、ブラウザ上で動作するローカルファーストのメディアエディターで、ビデオ、オーディオ、ベクターア…
★ 414 ⑂ 52 MIT 2026-06-25
マルチモーダル HF BiomedCLIP-PubMedBERT_256-vit_base_patch16_224
BiomedCLIP-PubMedBERT_256-vit_base_patch16_224は、PubMed Central由来の1500万件の医用画像とキャプション対で事…
❤ 411 ↓ 724.6k mit 2025-01-14
AIエージェント GitHub aiden
Aidenは、プロンプトに基づいてコンピュータを操作する自律型AIエージェントです。ブラウザ制御、ターミナル実行、ワ…
★ 406 ⑂ 78 AGPL-3.0 2026-05-27
AIエージェント GitHub deep-research
このスキルは、与えられたテーマに基づき、わずか1コマンドで深層調査レポートを自動生成します。約10分という短時間…
★ 403 ⑂ 43 MIT 2026-06-24
AIエージェント GitHub mobileClaw
MobileClawは、Androidデバイス上でLLMエージェントを動作させるためのオープンソースの実験的なモバイルアプリです…
★ 402 ⑂ 16 NOASSERTION 2026-06-26
LLM GitHub awesome-ai-auto-research
AIによる自動研究やAI支援研究に関する論文を体系的に追跡・整理するリポジトリです。論文「AI for Auto-Research: R…
★ 402 ⑂ 31 MIT 2026-06-21
LLM GitHub Nova3D
Nova3Dは、テキストまたは参照画像から編集可能で、パーツごとに分割された3Dモデルを生成するAIツールです。従来の…
★ 401 ⑂ 42 MIT 2026-06-28
動画生成 GitHub World-R1
World-R1は、テキストからビデオを生成する際に、3Dの幾何学的制約を強化学習で強化する新しいフレームワークです。…
★ 400 ⑂ 15 MIT 2026-06-03
マルチモーダル GitHub antfly
Antflyは、etcdのRaftライブラリを基盤とした分散型検索エンジンです。フルテキスト検索(BM25)、ベクトル類似性、…
★ 400 ⑂ 27 NOASSERTION 2026-06-29
音声生成 / TTS GitHub unified-audio
QuarkAudioは、音声、音楽、一般的なオーディオイベントの処理と生成を統一するオープンソースプロジェクトです。こ…
★ 397 ⑂ 27 Apache-2.0 2026-05-07
画像生成 GitHub FluxRT
FluxRTは、FLUX.2-klein-4Bモデルを搭載し、消費者向けGPUに最適化されたリアルタイムストリーム編集パイプラインで…
★ 397 ⑂ 56 Unlicense 2026-06-13
AIエージェント GitHub bux
Browser Use Box (bux)は、Claude Codeエージェントと実際のChromiumブラウザを組み合わせて、Playwrightスタイルの…
★ 395 ⑂ 48 MIT 2026-06-17
音声生成 / TTS GitHub personalized-podcast
このツールは、任意のコンテンツ(テキスト、ファイル、URL)を、ユーザーがスクリプト、プロンプト、ホストの役割、…
★ 393 ⑂ 47 2026-04-08
ASR / 音声認識 GitHub LiveTranslate
LiveTranslateは、Windows向けのリアルタイム音声翻訳ツールです。システムオーディオとマイク入力をキャプチャし、A…
★ 392 ⑂ 36 MIT 2026-06-20
ASR / 音声認識 GitHub freestyle
Freestyleは、音声を瞬時にテキストへ変換するディクテーションアプリです。ホットキーを押しながら話すだけで、カー…
★ 391 ⑂ 51 MIT 2026-06-23