AIエージェント GitHub uv-scripts-for-ai
このツールは、OCR、画像処理、音声処理など、データおよび機械学習タスク向けの自己完結型UVスクリプト集です。各ス…
★ 76 ⑂ 4 Apache-2.0 2026-06-23
画像生成 GitHub claude-image
このツールは、Claude CodeやCodexなどのAIエージェントがGPT Image 2を効果的に活用できるようにするドロップインス…
★ 76 ⑂ 4 MIT 2026-04-26
LLM GitHub FeatureBench
FeatureBenchは、複雑な機能開発におけるエージェント型コーディングのベンチマーキングを目的とした、テスト駆動型…
★ 76 ⑂ 8 MIT 2026-06-13
ComfyUI GitHub UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 76 ⑂ 2 GPL-3.0 2026-05-11
マルチモーダル GitHub locate-anything
「locate-anything」は、NVIDIAのLocateAnything-3Bモデルを利用した、モバイルフレンドリーなWebインターフェースで…
★ 76 ⑂ 10 Apache-2.0 2026-06-22
画像生成 GitHub LongLive-RAG
LongLive-RAGは、長尺動画生成における品質と一貫性の課題を解決するための汎用的なRetrieval-Augmented Frameworkで…
★ 76 Apache-2.0 2026-06-04
マルチモーダル HF MOSS-Audio-8B-Thinking
MOSS-Audio-8B-Thinkingは、音声・環境音・音楽を横断的に理解できるオープンソースの音声理解モデルです。文字起こ…
❤ 76 ↓ 5.2k apache-2.0 2026-06-11
ComfyUI GitHub ComfyUI-QwenPromptRewriter
lihaoyun6/ComfyUI-QwenPromptRewriterは、Qwen LLMを活用してプロンプトを高度化し、Qwen-Image/Editオンライン版の…
★ 75 ⑂ 4 GPL-3.0 2025-10-07
3D / NeRF GitHub hybrid-radiance-fields
HyRFは、効率的かつ高品質な新規視点合成を実現する、ハイブリッド・ラディアンス・フィールドの公式実装です。最先…
★ 75 ⑂ 3 NOASSERTION 2025-12-17
ComfyUI GitHub ComfyUI_GraftingRayman
GraftingRayman/ComfyUI_GraftingRaymanは、画像生成と操作を行うComfyUIユーザー向けのカスタムノード集です。既存…
★ 75 ⑂ 6 GPL-3.0 2026-05-19
ASR / 音声認識 HF wav2vec2-large-xlsr-53-russian
このリポジトリは、Jonatas Grosman氏が開発したロシア語音声認識用のWav2Vec2-large-xlsr-53モデルを提供します。Hu…
❤ 75 ↓ 3.2M apache-2.0 2022-12-14
音声生成 / TTS GitHub Talker-T2AV
Talker-T2AVは、自己回帰拡散モデリングを使い、テキスト、音声、動画を連携させて生成するAIツールです。Qwen3-0.6B…
★ 75 ⑂ 3 Apache-2.0 2026-05-24
ComfyUI GitHub comfyui-WhiteRabbit
comfyui-WhiteRabbitは、ComfyUIユーザー向けの強力なビデオフレーム操作ノードパックです。効率的な高品質バッチス…
★ 74 ⑂ 7 AGPL-3.0 2026-05-27
AIエージェント GitHub deputies
Deputiesは、エンジニアリング作業をバックグラウンドエージェントに委任するためのコントロールプレーンです。プロ…
★ 74 ⑂ 8 MIT 2026-06-18
動画生成 GitHub ReVidgen
ReVidgenは、具現化されたAI領域における動画生成モデルを再考するための公式実装リポジトリです。本プロジェクトは…
★ 74 2026-06-01
LLM GitHub opencode-chrome-annotation
このツールは、Chromeブラウザ上で任意のウェブページにアノテーションを付け、そのスクリーンショット、選択された…
★ 74 ⑂ 5 GPL-3.0 2026-04-30
音声生成 / TTS GitHub heygen-cli
HeyGen CLIは、HeyGenのAIビデオ生成APIをコマンドラインから操作するための公式ツールです。コーディングエージェン…
★ 74 ⑂ 6 Apache-2.0 2026-06-23
画像生成 GitHub Rose
RoseはPyTorch向けに開発された、ステートレスな最適化を実現する新しいオプティマイザです。従来の適応型オプティマ…
★ 74 ⑂ 5 Apache-2.0 2026-04-28
ComfyUI GitHub comfyui_sam3
ComfyUI向けのSAM3カスタムノード集で、自然言語のテキスト指示から画像内の対象物を高精度に切り抜き・マスク生成で…
★ 74 ⑂ 10 MIT 2026-01-01
マルチモーダル HF MOSS-Audio-4B-Instruct
MOSS-Audio-4B-Instructは、音声・環境音・音楽を統合的に理解し、テキストで応答するオープンソースの音声理解モデ…
❤ 73 ↓ 17.1k apache-2.0 2026-04-14
ComfyUI GitHub ComfyUI-DiffusionLight
このツールは、拡散モデルベースの画像生成ツール「ComfyUI」において、DiffusionLightのライトプローブ作成手法を簡…
★ 73 ⑂ 5 GPL-3.0 2024-05-21
AIエージェント GitHub active_harness
ActiveHarnessは、Ruby/Rails開発者向けに設計された、プロダクションレベルのLLM(大規模言語モデル)パイプライン…
★ 73 ⑂ 2 MIT 2026-06-15
動画生成 GitHub fpv-immersive-video-prompting
このツールは、FPV(一人称視点)AIビデオプロンプト作成に特化したSkillです。従来の「画面記述」を超え、カメラの…
★ 73 ⑂ 21 MIT 2026-06-10
動画生成 GitHub ReImagine
ReImagineは、画像優先合成という先進的な手法を用いて、高品質で制御可能な人間動画を生成するためのフレームワーク…
★ 73 ⑂ 12 Apache-2.0 2026-04-23