マルチモーダル GitHub MGM
「Mini-Gemini」は、画像理解、推論、生成を同時に行うことができるマルチモダリティ大規模言語モデル(LLM)フレー…
★ 3.3k ⑂ 275 Apache-2.0 2024-05-04
画像生成 GitHub gpt_image_2_skill
このツールは、OpenAIのGPT Image 2モデルを用いた画像生成のためのプロンプトギャラリー、画像プロンプトライブラリ…
★ 3.3k ⑂ 291 MIT 2026-05-23
LLM GitHub awesome-harness-engineering
「Awesome Harness Engineering」は、AIエージェントが信頼性の高い動作を保つための環境構築「ハーネスエンジニアリ…
★ 3.3k ⑂ 263 NOASSERTION 2026-05-22
3D / NeRF GitHub LichtFeld-Studio
LichtFeld Studioは、3D Gaussian Splattingシーンの学習、検査、編集、自動化、エクスポートを単一のネイティブアプ…
★ 3.3k ⑂ 368 GPL-3.0 2026-06-26
3D / NeRF GitHub 2d-gaussian-splatting
「2D Gaussian Splatting for Geometrically Accurate Radiance Fields」論文の公式実装です。2Dの指向性ディスク(…
★ 3.2k ⑂ 313 NOASSERTION 2025-11-24
ComfyUI GitHub rgthree-comfy
rgthree-comfyは、ComfyUIのワークフローをより快適にするためのノードと改善のコレクションです。ComfyUIユーザーが…
★ 3.2k ⑂ 239 MIT 2026-06-20
音声生成 / TTS GitHub TTS-WebUI
TTS WebUIは、GradioとReactを基盤とする統合型Webユーザーインターフェースで、様々なテキスト読み上げ(TTS)、音…
★ 3.2k ⑂ 326 MIT 2026-05-14
AIエージェント GitHub oh-story-claudecode
このツールは、長編および短編のウェブ小説執筆を支援する「oh-story-claudecode」スキルパックです。市場トレンド分…
★ 3.2k ⑂ 528 MIT 2026-06-27
AIエージェント GitHub nexu
nexuは、オープンソースのデスクトップクライアントで、AIエージェント「OpenClaw」をWeChat、Feishu、Slack、Discor…
★ 3.2k ⑂ 255 MIT 2026-04-26
ComfyUI GitHub ComfyUI-Custom-Scripts
ComfyUI-Custom-Scriptsは、AI画像生成ツールComfyUIのユーザーインターフェースを強化し、実験的な機能を追加するた…
★ 3.1k ⑂ 265 MIT 2026-02-12
AIエージェント GitHub agents-cli
agents-cliは、Google Cloud上でAIエージェントを構築、評価、デプロイするためのコマンドラインインターフェース(C…
★ 3.1k ⑂ 372 Apache-2.0 2026-06-26
LLM GitHub hands-on-modern-rl
このプロジェクトは、現代の強化学習を実践的に学ぶためのオープンソースカリキュラム「Hands-On Modern RL」です。…
★ 3.1k ⑂ 216 NOASSERTION 2026-06-27
3D / NeRF GitHub 3D-Gaussian-Splatting-Papers
本リポジトリは、3D Gaussian Splattingに関する最新の研究論文を会議やジャーナル別に分類・整理したリストです。20…
★ 3.1k ⑂ 119 2026-06-12
動画生成 GitHub DynamiCrafter
DynamiCrafterは、テキストプロンプトに基づいてオープンドメインの静止画をアニメーション化するツールです。事前学…
★ 3.0k ⑂ 245 Apache-2.0 2024-09-08
ComfyUI GitHub ComfyUI-nunchaku
Nunchaku ComfyUI Pluginは、SVDQuantで量子化された4-bitニューラルネットワーク向けの効率的な推論エンジン「Nunch…
★ 2.9k ⑂ 166 Apache-2.0 2026-02-19
LLM GitHub lean-ctx
LeanCTXは、AIエージェントの非効率なコンテキスト管理を解決するための軽量なコグニティブレイヤーです。ファイルや…
★ 2.9k ⑂ 278 Apache-2.0 2026-06-24
音声生成 / TTS GitHub AudioLDM
AudioLDMは、テキスト入力からスピーチ、効果音、音楽などを生成できる革新的なオーディオ生成ツールです。ICML 2023…
★ 2.9k ⑂ 266 NOASSERTION 2025-06-25
AIエージェント GitHub gitagent-protocol
GitAgentProtocol (Open GAP) は、AIエージェントを定義するためのフレームワーク非依存かつGitネイティブな標準規格…
★ 2.9k ⑂ 343 MIT 2026-05-28
LLM GitHub clawpanel
ClawPanelは、OpenClawとHermes Agentを含む複数のAIエージェントフレームワークを管理するための可視化管理パネルで…
★ 2.9k ⑂ 353 NOASSERTION 2026-06-15
音声生成 / TTS GitHub MARS5-TTS
MARS5は、CAMB.AIが開発した英語の音声合成(TTS)モデルです。わずか5秒の音声とテキストスニペットから、スポーツ…
★ 2.8k ⑂ 245 AGPL-3.0 2024-08-01
3D / NeRF GitHub Papers-in-100-Lines-of-Code
このリポジトリは、主要なAI/機械学習の学術論文で提唱されたアルゴリズムやモデルを、わずか100行程度の簡潔なPytho…
★ 2.8k ⑂ 254 MIT 2026-04-08
画像生成 GitHub Kandinsky-2
Kandinsky 2.2は、多言語対応のテキストから画像を生成する強力な潜在拡散モデルです。前バージョンのKandinsky 2.1…
★ 2.8k ⑂ 317 Apache-2.0 2024-05-01
動画生成 GitHub ArcReel
ArcReelは、AI Agentを駆使して小説のようなテキストから短編動画を生成するオープンソースの動画生成ワークベンチで…
★ 2.8k ⑂ 586 AGPL-3.0 2026-06-23
3D / NeRF GitHub nerf_pl
このツールは、NeRF (Neural Radiance Fields) をPyTorch-Lightningで非公式に実装したものです。公式実装と比較して…
★ 2.8k ⑂ 460 MIT 2023-08-03