画像生成 GitHub SD-Anima-Prompt-Studio
SD-Anima-Prompt-Studioは、Stable DiffusionとAnimaのプロンプト作成を支援する、洗練されたガラスモフィズムデザイ…
★ 88 ⑂ 7 2026-06-02
ComfyUI GitHub ComfyUI-RookieUI
ComfyUI-RookieUIは、ComfyUIのカスタムノード拡張で、A1111(Automatic1111)スタイルのサイドバーUIとワークフロー…
★ 88 ⑂ 7 AGPL-3.0 2026-06-24
ComfyUI GitHub Facefusion_comfyui
FaceFusion ComfyUIは、ComfyUIに統合された非公式の拡張機能で、高度な顔スワッピングをローカルで実行します。API…
★ 88 ⑂ 15 NOASSERTION 2025-11-30
ComfyUI GitHub ComfyUI-WanVaceAdvanced
ComfyUI上でWan系動画モデルのVACE制御を拡張する上級者向けノード集です。参照画像、制御用動画、マスク、Phantom埋…
★ 87 ⑂ 9 GPL-3.0 2026-02-10
動画生成 GitHub MobileI2V
「MobileI2V」は、画像から高品質な動画を高速で生成できるツールです。特にモバイルデバイスでの利用に最適化されて…
★ 87 ⑂ 5 Apache-2.0 2026-05-20
LLM GitHub OpenDocuments
OpenDocumentsは、GitHub、Notion、Google Drive、ローカルファイル、Webソースなど、分散した組織の知識ソースを統…
★ 87 ⑂ 15 MIT 2026-05-27
ASR / 音声認識 GitHub diarize
diarizeは、音声ファイルから「誰がいつ話したか」を自動的に識別するPython製のスピーカーダイアリゼーションツール…
★ 86 ⑂ 8 Apache-2.0 2026-05-06
LLM GitHub SR-Agents
SR-Agentsは、大規模言語モデル(LLM)エージェントにおけるスキル検索拡張(SRA)の研究と評価を目的としたコミュニ…
★ 86 ⑂ 11 MIT 2026-05-21
ASR / 音声認識 GitHub HearoPilot-App
HearoPilotは、Androidデバイス上で動作するオンデバイスAI会議アシスタントです。リアルタイムの音声文字起こしとLL…
★ 86 ⑂ 31 Apache-2.0 2026-06-10
音声生成 / TTS GitHub reels-af
REELS-AFは、AIマルチエージェントシステム「AgentField」上で構築されたAIネイティブな動画生成ツールです。記事URL…
★ 85 ⑂ 32 Apache-2.0 2026-06-05
画像生成 HF ddpm-cifar10-32
google/ddpm-cifar10-32は、CIFAR-10向けに学習済みのDDPM画像生成モデルです。Hugging Face Diffusersの`DDPMPipeli…
❤ 85 ↓ 23.0k apache-2.0 2023-08-03
LLM GitHub pmb
PMB (Personal Memory Brain)は、AIコーディングエージェント(Claude Code、Cursor、Codexなど)にローカルファース…
★ 85 ⑂ 10 Apache-2.0 2026-06-22
音楽生成 GitHub AceForge
AceForgeは、macOS Silicon向けに設計されたローカルファーストのAI音楽ワークステーションです。ACE-Step技術を核と…
★ 85 ⑂ 11 Apache-2.0 2026-02-11
ComfyUI GitHub Comfyui_MiniCPMv2_6-prompt-generator
このComfyui_MiniCPMv2_6-prompt-generatorは、ComfyUIのカスタムノードで、画像から自動的にプロンプトやキャプショ…
★ 84 ⑂ 9 Apache-2.0 2024-08-30
動画生成 GitHub agnes-video-generator
Agnes Video Generatorは、Agnes AIを活用したワンクリックAI動画生成ツールです。テキストのアイデアから複数のシー…
★ 84 ⑂ 16 MIT 2026-06-24
音声生成 / TTS GitHub volocal
Volocalは、iOSデバイス上で完全にローカルに動作する音声AIアプリです。STT(音声認識)からLLM(大規模言語モデル…
★ 84 ⑂ 8 MIT 2026-04-02
マルチモーダル GitHub openmelon
OpenMelonは、ターミナル上で動作するAIコンテンツ作成エージェントです。ユーザーは単一のターミナルセッション内で…
★ 84 ⑂ 10 Apache-2.0 2026-05-11
ComfyUI GitHub comfyui-tcd-scheduler
このツールは、ComfyUIにZhengらが提唱するTrajectory Consistency Distillation (TCD)サンプリングを導入するカスタ…
★ 84 ⑂ 9 GPL-3.0 2024-05-22
3D / NeRF GitHub guidance-for-open-source-3d-reconstruction-toolbox-for-gaussian-splats-on-aws
AWS向けオープンソース3D再構築ツールボックスは、画像や動画入力から3Dシーンやオブジェクトを再構築するためのエン…
★ 84 ⑂ 5 MIT-0 2026-06-25
LLM GitHub trove-ai
Trove AIは、中国のインターネットコンテンツに特化した自己ホスト可能なAI搭載型「後で読む」ツール兼知識ベースで…
★ 83 ⑂ 12 NOASSERTION 2026-06-22
LLM GitHub Awesome-Diffusion-LLM
「Awesome-Large-Language-Diffusion-Models」は、大規模言語拡散モデル(dLLM)に関する研究論文を網羅的かつ体系的…
★ 83 ⑂ 14 2026-06-04
画像生成 GitHub Unify-Agent
「Unify-Agent」は、Web検索等で外部の知識を能動的に参照し、事実に忠実な画像を生成する統一マルチモーダルAIエー…
★ 83 ⑂ 4 MIT 2026-05-02
ASR / 音声認識 GitHub AriaType
AriaTypeは、デスクトップ向けの音声入力ツールで、話した内容をカーソルがある場所に直接テキストとして挿入します…
★ 83 ⑂ 7 AGPL-3.0 2026-06-15
AIエージェント GitHub kstack
「kstack」は、Claude Code向けのスキルパックで、Kubernetesクラスターの監視、トラブルシューティング、監査をAIの…
★ 82 ⑂ 7 Apache-2.0 2026-05-08