画像生成 GitHub transformerlab-app
Transformer Labは、AI研究者向けに設計されたオープンソースの機械学習プラットフォームです。モデルの訓練、評価、…
★ 5.1k ⑂ 535 AGPL-3.0 2026-06-25
マルチモーダル GitHub mlx-vlm
MLX-VLMは、Apple Silicon Mac上でMLXを利用してVision Language Models(VLM)および音声・動画対応のOmni Modelsの…
★ 5.1k ⑂ 645 MIT 2026-06-24
AIエージェント GitHub omnigent
Omnigentは、Claude Code、Codex、Pi、およびユーザーが作成したカスタムエージェントを含む、あらゆるAIエージェン…
★ 5.1k ⑂ 622 Apache-2.0 2026-06-27
マルチモーダル GitHub PixelRAG
PixelRAGは、ウェブページ、PDF、画像をスクリーンショットとして視覚的にレンダリングし、ビジョン言語モデルで埋め…
★ 5.0k ⑂ 387 Apache-2.0 2026-06-24
LLM GitHub opensquilla
OpenSquillaは、トークン効率を最大化するマイクロカーネルAIエージェントです。限られた予算で高い知能密度と優れた…
★ 4.9k ⑂ 360 Apache-2.0 2026-06-27
ASR / 音声認識 GitHub speech-to-speech
Speech To Speechは、オープンソースモデルを活用してローカルで高度な音声エージェントを構築するためのプロジェク…
★ 4.9k ⑂ 584 Apache-2.0 2026-06-26
動画生成 GitHub HunyuanVideo-1.5
HunyuanVideo-1.5は、わずか8.3Bのパラメーターでトップクラスの品質を提供する軽量な動画生成モデルです。コンシュ…
★ 4.5k ⑂ 229 NOASSERTION 2026-04-10
LLM GitHub memory-lancedb-pro
memory-lancedb-proは、OpenClawエージェントに長期記憶能力を付与するLanceDBベースのプラグインです。AIエージェン…
★ 4.4k ⑂ 729 2026-06-27
LLM GitHub tiny-llm
このプロジェクト「tiny-llm」は、システムエンジニア向けに大規模言語モデル(LLM)の推論サービスをMLXフレームワ…
★ 4.3k ⑂ 334 Apache-2.0 2026-06-13
マルチモーダル GitHub lmms-eval
lmms-evalは、テキスト、画像、ビデオ、オーディオといった様々なモダリティを横断する、オールインワンのマルチモー…
★ 4.3k ⑂ 605 NOASSERTION 2026-06-24
音楽生成 GitHub ace-step-ui
ACE-Step UIは、オープンソースのAI音楽生成モデル「ACE-Step 1.5」のためのプロフェッショナルなユーザーインターフ…
★ 4.2k ⑂ 629 2026-06-04
LLM GitHub Clawith
Clawithは、オープンソースのマルチエージェントコラボレーションプラットフォームです。各AIエージェントに永続的な…
★ 4.0k ⑂ 658 Apache-2.0 2026-06-16
動画生成 GitHub lingbot-world
LingBot-Worldは、ビデオ生成技術を基盤としたオープンソースの世界シミュレーター(ワールドモデル)です。リアルタ…
★ 4.0k ⑂ 363 Apache-2.0 2026-05-22
AIエージェント GitHub awesome-opensource-ai
このリポジトリは、オープンソースのAIプロジェクト、モデル、ツール、インフラストラクチャを厳選したリストです。P…
★ 4.0k ⑂ 466 CC0-1.0 2026-06-28
動画生成 GitHub ComfyUI-LTXVideo
ComfyUI-LTXVideoは、人気の画像生成Web UIであるComfyUIの機能を拡張し、LTX-2動画生成モデルを最大限に活用するた…
★ 3.8k ⑂ 439 NOASSERTION 2026-06-17
3D / NeRF GitHub OpenSfM
OpenSfMはPythonで書かれたStructure from Motion(SfM)ライブラリで、複数の画像からカメラの姿勢と3Dシーンを再構…
★ 3.8k ⑂ 898 BSD-2-Clause 2026-06-18
音声生成 / TTS GitHub MOSS-TTS-Nano
MOSS-TTS-Nanoは、MOSI.AIとOpenMOSSチームが開発したオープンソースの多言語対応小型音声生成モデルです。わずか0.1…
★ 3.8k ⑂ 479 Apache-2.0 2026-06-02
動画生成 GitHub FastVideo
FastVideoは、ビデオ生成を高速化するための統合された推論および後処理フレームワークです。最先端のビデオ生成モデ…
★ 3.8k ⑂ 370 Apache-2.0 2026-06-26
画像生成 GitHub remove-ai-watermarks
「Remove-AI-Watermarks」は、Google Gemini、ChatGPT/DALL-E、Stable Diffusion、Adobe Firefly、Midjourneyなど、…
★ 3.7k ⑂ 334 Apache-2.0 2026-06-26
画像生成 GitHub PromptEnhancer
PromptEnhancerは、Text-to-Image生成およびImage-to-Image編集の両方に対応するプロンプト書き換えツールです。ユー…
★ 3.7k ⑂ 324 NOASSERTION 2026-06-10
音声生成 / TTS GitHub MOSS-TTS
MOSS-TTS Familyは、MOSI.AIとOpenMOSSチームが開発したオープンソースの音声およびサウンド生成モデル群です。高忠…
★ 3.6k ⑂ 315 Apache-2.0 2026-06-22
画像生成 GitHub TurboDiffusion
TurboDiffusionは、ビデオ拡散モデルによる動画生成を100〜200倍に高速化するフレームワークです。単一のRTX 5090な…
★ 3.5k ⑂ 267 Apache-2.0 2026-06-17
3D / NeRF GitHub map-anything
MapAnythingは、画像、キャリブレーション、ポーズ、深度などの多様な入力から、統一されたフィードフォワードのトラ…
★ 3.5k ⑂ 269 Apache-2.0 2026-06-03
3D / NeRF GitHub AliceVision
AliceVisionは、写真から3Dオブジェクトやシーンを再構築し、カメラの動きを追跡するフォトグラメトリー・コンピュー…
★ 3.5k ⑂ 874 NOASSERTION 2026-06-26