音楽生成 GitHub portable-hermes-agent
Portable Hermes Agentは、Windows向けのポータブルAIエージェントデスクトップアプリケーションです。インストール…
★ 178 ⑂ 35 MIT 2026-05-22
ComfyUI GitHub ComfyUI-InstanceDiffusion
このツールは、画像生成AI「ComfyUI」向けにInstanceDiffusionを統合するノードセットです。複数のオブジェクトを詳…
★ 176 ⑂ 13 Apache-2.0 2024-08-30
マルチモーダル HF Qwen2-Audio-7B
Qwen2-Audio-7Bは、音声を入力として受け取り、内容理解や音声指示に基づく応答を行える大規模音声言語モデルです。…
❤ 172 ↓ 5.0k apache-2.0 2024-11-20
ComfyUI GitHub ComfyUI-VoxCPM2
このツールは、ComfyUI用のVoxCPM2テキスト読み上げノードを提供します。200万時間以上の多言語音声データで訓練され…
★ 171 ⑂ 13 Apache-2.0 2026-04-12
LLM GitHub Awesome-Process-Reward-Models
「Awesome Process Reward Models」は、プロセス報酬モデル(PRM)に関する最新かつ包括的な研究論文やプロジェクト…
★ 171 ⑂ 4 2026-06-06
3D / NeRF GitHub WorldStereo
「WorldStereo」は、カメラ制御ビデオ生成と3Dシーン再構築を融合する革新的なフレームワークです。Global-Geometric…
★ 171 ⑂ 8 Apache-2.0 2026-04-24
3D / NeRF GitHub MotionCrafter
MotionCrafterは、単一のモノクロビデオ入力から密な4Dジオメトリとオブジェクトの動きを同時に再構築する、革新的な…
★ 169 ⑂ 10 NOASSERTION 2026-06-11
LLM GitHub gbase
GBaseは、自己進化を核とするAIエージェントフレームワークです。エージェントが過去の経験を記憶し、自身の行動を反…
★ 168 ⑂ 2 MIT 2026-06-20
AIエージェント GitHub OpenHack
OpenHackは、コードベースの脆弱性を検出・検証するためのオープンソースのAgenticセキュリティスキャナーです。Clau…
★ 167 ⑂ 18 MIT 2026-06-12
AIエージェント GitHub piia-engram
piia-engramは、ユーザーのアイデンティティ、好み、学習した教訓、重要な決定事項をローカルのJSONファイルとして保…
★ 167 ⑂ 10 AGPL-3.0 2026-06-23
音声生成 / TTS GitHub eva
EVAは、会話型音声エージェントの性能をエンドツーエンドで評価するためのオープンソースフレームワークです。エージ…
★ 167 ⑂ 24 MIT 2026-06-26
ComfyUI GitHub Pixal3D-ComfyUI
Pixal3D-ComfyUIは、単一の画像から高品質な3Dモデルを生成するためのComfyUI用カスタムノードです。TencentARCのPix…
★ 166 ⑂ 17 MIT 2026-06-12
画像生成 GitHub WaDi
WaDiは、CVPR 2026で発表された、ワンステップ画像生成のための公式PyTorch実装です。Weight Direction-aware Distil…
★ 164 ⑂ 23 2026-05-26
3D / NeRF GitHub oxford_spires_dataset
このツールは、Oxford Spires Datasetを用いて、SLAM(自己位置推定と環境地図作成)、NeRF(Neural Radiance Fields…
★ 161 ⑂ 5 NOASSERTION 2026-06-19
ComfyUI GitHub ComfyUI-openpose-editor
このツールは、ComfyUI上で動作するOpenPoseエディターであり、AI画像生成におけるキャラクターのポーズを細かく制御…
★ 159 ⑂ 16 GPL-3.0 2024-07-31
マルチモーダル GitHub Multimodal-Recommendation-Library
MRLibは、マルチモーダル推薦システムの研究開発に特化したオープンソースライブラリです。画像、テキスト、音声など…
★ 155 ⑂ 13 MIT 2026-05-08
マルチモーダル GitHub EI-Beginner
このリポジトリは、OpenMOSS研究室が提供する具身知能および人型ロボット知能の入門実践チュートリアルです。ロボッ…
★ 155 ⑂ 7 2026-05-27
AIエージェント GitHub 21-day-self-interview
このツール「21 Days of Self-Interview」は、AIが実存主義心理カウンセラーとして、21日間毎晩3つの質問を投げかけ…
★ 153 ⑂ 54 MIT 2026-06-08
3D / NeRF GitHub MAGICIAN
MAGICIANは、CVPR 2026で発表された、能動的なマッピングのための効率的な長期計画手法です。このツールは「Imagined…
★ 151 ⑂ 8 2026-05-27
音声生成 / TTS GitHub kokoclone
KokoCloneは、Kokoro-ONNXを基盤とする高速な多言語音声クローンシステムです。短い音声サンプルからリアルタイムで…
★ 151 ⑂ 23 Apache-2.0 2026-04-19
AIエージェント GitHub invincat
Invincat CLIは、DeepAgents CLIを基盤としたPython製のターミナルAIプログラミングアシスタントです。ローカルリポ…
★ 151 ⑂ 15 MIT 2026-05-26
動画生成 GitHub HiAR
HiARは、階層的な自己回帰型のビデオ生成ツールで、従来のブロックファースト型からステップファースト型へと処理を…
★ 150 ⑂ 6 Apache-2.0 2026-06-19
画像生成 GitHub Mobile-O
Mobile-Oは、モバイルデバイス上で動作する、統一されたマルチモーダルAIモデルです。画像理解(VQA、OCR、推論)と…
★ 150 ⑂ 15 NOASSERTION 2026-04-13
LLM GitHub DocPaws
DocPawsは、FastAPIとVue3で構築された企業向けのRAG (Retrieval-Augmented Generation) ドキュメントアシスタントで…
★ 147 ⑂ 2 MIT 2026-06-17