動画生成 GitHub Crayotter
Crayotterは、単一のテキストリクエストから完全に編集されたビデオを生成する、マルチモーダルでエージェント駆動型…
★ 129 ⑂ 9 2026-06-27
ComfyUI GitHub Minimalistic-Comfy-Wrapper-WebUI
Minimalistic Comfy Wrapper WebUI (MCWW) は、ComfyUIに推論に特化したシンプルなUIを追加する拡張機能です。既存の…
★ 129 ⑂ 10 AGPL-3.0 2026-06-24
動画生成 GitHub EffectErase
「EffectErase」は、ビデオからのオブジェクト除去と挿入を同時に、かつ高品質に行うためのツールです。CVPR 2026で…
★ 128 ⑂ 7 NOASSERTION 2026-04-10
動画生成 GitHub OpenReels
OpenReelsは、YouTube、Instagram、TikTok向けのショート動画を自動生成するオープンソースのAIパイプラインです。ト…
★ 128 ⑂ 30 MIT 2026-04-10
ASR / 音声認識 GitHub MioVRC_Translator
VRChat向けデスクトップリアルタイム翻訳ツール「Mio RealTime Translator」は、VRChatでの国際交流を支援します。主…
★ 127 ⑂ 1 NOASSERTION 2026-06-18
マルチモーダル GitHub count-anything
Count Anythingは、テキストクエリに基づいて画像内のあらゆるオブジェクトを数えることができる汎用モデルです。自…
★ 127 ⑂ 6 Apache-2.0 2026-06-04
動画生成 GitHub PSIVG
このリポジトリは、CVPR 2026で発表される研究プロジェクト「Physical Simulator In-the-Loop Video Generation」の…
★ 126 ⑂ 14 Apache-2.0 2026-06-01
3D / NeRF GitHub gaussian-point-splatting
本ツールは、独自の確率的なアプローチ「Gaussian Point Splatting」により、数億個に及ぶ大規模な3D Gaussian Splat…
★ 126 ⑂ 11 BSD-3-Clause 2026-06-05
LLM GitHub VidCom2
VidCom2は、Video Large Language Models (VideoLLMs) の推論を高速化するためのプラグアンドプレイなフレームワーク…
★ 126 ⑂ 14 Apache-2.0 2026-05-14
LLM GitHub chunky
Chunkyは、RAG(Retrieval-Augmented Generation)パイプラインの品質を向上させるためのローカルでオープンソースの…
★ 126 ⑂ 11 MIT 2026-06-06
画像生成 GitHub Spectrum
「Spectrum」は、学習不要なスペクトル拡散特徴予測を用いて、拡散モデルのサンプリング速度を大幅に向上させるツー…
★ 125 ⑂ 7 MIT 2026-04-30
ASR / 音声認識 GitHub wispr
Wisprは、macOSユーザー向けのプライバシーを重視した音声書き起こしアプリケーションです。OpenAI WhisperとNVIDIA …
★ 124 ⑂ 18 Apache-2.0 2026-06-24
AIエージェント GitHub lecture-to-hw
「lecture-to-hw」は、大学の授業資料(講義、宿題ファイル、コード、過去の解答スタイル)から、簡潔なMarkdown形式…
★ 124 ⑂ 6 MIT 2026-05-08
ASR / 音声認識 GitHub ai-course-notes
このプロジェクトは、AI/LLM関連の公開講義、インタビュー、技術記事を中国語でまとめた学習リソースです。合計303の…
★ 123 ⑂ 4 NOASSERTION 2026-05-25
画像生成 GitHub ImageLens
Image Lens(图透镜)は、ウェブページ上の画像から、その画像を生成したと考えられるプロンプト(提示詞)を逆生成…
★ 123 ⑂ 7 MIT 2026-06-23
ComfyUI GitHub OpenWebui-Tools
このプロジェクトは、Open WebUIの体験を強化するために設計された26種類のカスタムツール集です。主な特徴は、30秒…
★ 122 ⑂ 6 MIT 2026-06-01
画像生成 GitHub codex-imagen
Codex Imagenは、ChatGPT/CodexのResponsesバックエンドを利用して画像を生成・編集するためのOpenClawスキル兼ヘル…
★ 122 ⑂ 37 MIT 2026-06-06
画像生成 GitHub Evolving-Visual-Generation
このGitHubリポジトリは、現代のビジュアル生成技術を「視覚的知能」の進化という視点から体系的に整理した「生きて…
★ 121 ⑂ 5 2026-06-09
AIエージェント GitHub ogcode
Ogcodeは、Go言語で開発されたWeb UIベースのエージェント型AIコーディングアシスタントです。コードベース全体を理…
★ 121 ⑂ 9 MIT 2026-06-23
マルチモーダル GitHub Auto-Use
Auto Useは、AIがmacOSおよびWindowsオペレーティングシステム全体を自然言語で制御できる、エンドツーエンドのコン…
★ 120 ⑂ 13 Apache-2.0 2026-06-24
AIエージェント GitHub ai-desk-card
「AI Desk Card」は、Claude CodeやCodexなどのAI AgentとM5Paper墨水屏を連携させるデスクトップサブスクリーンSkil…
★ 120 ⑂ 10 NOASSERTION 2026-05-22
画像生成 GitHub image-prompt-library
Image Prompt Libraryは、生成AIで作成された画像とそのプロンプトをローカルで一元管理するための視覚的ライブラリ…
★ 120 ⑂ 17 AGPL-3.0 2026-05-06
音楽生成 GitHub VODER
VODERは、ローカルで動作し、無料で利用できるプロフェッショナルグレードの音声処理ツールです。音声認識、テキスト…
★ 119 ⑂ 11 AGPL-3.0 2026-06-20
動画生成 GitHub Echo-Memory
Echo-Memoryは、Joy Future AcademyのEcho Teamが開発した、ビデオワールドモデルにおけるメモリの役割を研究するた…
★ 119 ⑂ 6 2026-06-25