2,519 repos GH 2,404 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
LLM GitHub opensquilla
OpenSquillaは、トークン効率を最大化するマイクロカーネルAIエージェントです。限られた予算で高い知能密度と優れた…
★ 2.1k ⑂ 141 Apache-2.0 2026-05-30
動画生成 HF Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 1.4k ↓ 1.5M 2026-05-22
LLM GitHub tokenspeed
TokenSpeedは、agentic workloadsのために設計された「光速」LLM推論エンジンです。TensorRT-LLMと同等の高性能とvLL…
★ 1.3k ⑂ 133 MIT 2026-05-30
AIエージェント GitHub agents-best-practices
「agents-best-practices」は、エージェントハーネスの設計、MVPブループリントの生成、監査、リファクタリング、説…
★ 1.2k ⑂ 106 MIT 2026-05-30
AIエージェント GitHub Agent-Runtime-Community
Agent Runtime Security Platformは、自律型AIエージェントのためのオープンソースのゼロトラストセキュリティ、ガバ…
★ 1 2026-05-31
LLM GitHub Continue-NIM-Proxy
このツールは、Continue/VSCodiumでNVIDIA NIMの「Step 3.7 Flash」モデルを使用する際に発生する、応答がサイレント…
★ 2 MIT 2026-05-31
マルチモーダル GitHub esp32-cam-with-gemma
ESP32-CAMオフラインAIビジョンアシスタントは、IoT、コンピュータビジョン、ローカル大規模言語モデルを組み合わせ…
★ 1 MIT 2026-05-31
LLM GitHub ring-fenced-rag
Ring-Fenced RAG (RFR)は、自己ホスト型でゼロトラストの検索拡張生成(RAG)システムです。特徴は、データベースレ…
★ 1 2026-05-31
⚖️GitHub vs HuggingFace TOP 両方を一画面で比較
画像生成 GitHub stable-diffusion-webui
Stable Diffusion web UIは、Gradioライブラリで実装された、画像生成AI「Stable Diffusion」の多機能なWebインター…
★ 163.3k ⑂ 30.4k AGPL-3.0 2026-03-02
画像生成 GitHub LocalAI
LocalAIは、大規模言語モデル(LLMs)、視覚、音声、画像、ビデオなど、様々なAIモデルをどんなハードウェア環境でも…
★ 46.5k ⑂ 4.1k MIT 2026-05-28
画像生成 GitHub khoj
Khojは、個人の能力を拡張するAIセカンドブレインアプリです。ローカルまたはオンラインのLLM(llama3, GPT, Gemini…
★ 34.8k ⑂ 2.2k AGPL-3.0 2026-03-26
画像生成 GitHub diffusers
🤗 Diffusersは、画像、音声、分子の3D構造生成のための最先端の拡散モデルを提供するPythonライブラリです。シンプ…
★ 33.7k ⑂ 7.0k Apache-2.0 2026-05-30
画像生成 GitHub Lance
Lanceは、ByteDanceが開発した30億の有効パラメータを持つ統合マルチモーダルAIモデルです。このモデルは、単一のフ…
★ 955 ⑂ 62 Apache-2.0 2026-05-26
画像生成 GitHub CDM
本ツールは、「Continuous-Time Distribution Matching (CDM)」技術を用いた、少ステップ拡散蒸留のためのフレームワ…
★ 138 ⑂ 6 MIT 2026-05-11
画像生成 GitHub ian-xiaohei-illustrations
「Ian Xiaohei Illustrations」は、AIエージェントが中国語の文章、ブログ記事、Notionドキュメントなどに、白背景の…
★ 82 ⑂ 18 MIT 2026-05-28
画像生成 GitHub ReactiveGWM
ReactiveGWMは、プレイヤー操作とNPCの自律性を分離することで、ゲーム内のNPCをより動的に制御する新しいゲーム世界…
★ 63 ⑂ 8 2026-05-18
画像生成 GitHub gpt-image-2
「GPT Image 2」は、OpenAIの最新画像生成モデルを基盤とした無料のAI画像生成ツールです。テキストプロンプトから写…
★ 1 MIT 2026-05-30
画像生成 GitHub claude-imagegen-skill
このClaude Codeスキルは、DALL-EによるAI画像生成、デザインシステムのインテリジェンス、およびPencil MCPとの統合…
★ 1 MIT 2026-05-30
画像生成 GitHub anime-sd-mcp
anime-sd-mcpは、MCP(Model Context Protocol)サーバーとして機能し、AIクライアント(Claude Desktop、Claude Cod…
★ 1 MIT 2026-05-30
画像生成 GitHub Petal
PetalGenは、AI画像生成のためのプロンプトエンジニアリングツールです。Pollinations.aiによって提供されており、ユ…
★ 1 ⑂ 1 MIT 2026-05-30
動画生成 GitHub LivePortrait
LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…
★ 18.4k ⑂ 1.9k NOASSERTION 2026-03-02
動画生成 GitHub Open-Generative-AI
Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…
★ 17.5k ⑂ 3.0k 2026-05-26
動画生成 GitHub Wan2.2
Wan2.2は、オープンで先進的な大規模ビデオ生成モデルWanの主要なアップグレード版です。専門家混合(MoE)アーキテ…
★ 16.0k ⑂ 2.0k Apache-2.0 2026-03-17
動画生成 GitHub Duix-Avatar
Duix.Avatarは、Duix.comによって開発された、完全にオープンソースのAIアバターツールキットです。本ツールは、ユー…
★ 13.4k ⑂ 2.2k NOASSERTION 2026-04-21
動画生成 HF Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 1.4k ↓ 1.5M 2026-05-22
動画生成 GitHub lanshu-awesome-ai-video-kit
この「lanshu-awesome-ai-video-kit」は、企業におけるAIビデオプロジェクトの課題解決のために開発されたオープンソ…
★ 155 ⑂ 36 MIT 2026-05-27
動画生成 GitHub ARIS-in-AI-Offer
このツールは、中国語のML/LLM/マルチモーダル/生成モデル分野における就職活動(秋招)向けの面接チートシート集で…
★ 138 ⑂ 6 MIT 2026-05-31
動画生成 GitHub comfyui-mesh
ComfyUI Meshは、拡散モデル(FLUX.2、LTX 2.3など)の計算を2つのNVIDIA GPU(同一マシンまたはLAN経由)に分散させ…
★ 110 ⑂ 14 2026-05-17
動画生成 GitHub Morpheus
Morpheusは、動画生成モデルが生成した映像がニュートン物理学の法則にどれだけ従っているかを定量的に評価する、物…
★ 2 MIT 2026-05-28
動画生成 GitHub SA-IR
SA-IR (Semantic-Axiomatic Intermediate Representation) は、単なるプロンプトではなく、DALL-E 3やImagenなどのAI…
★ 2 NOASSERTION 2026-05-28
動画生成 GitHub comfy-prompt-skill
comfy-promptは、Comfy Cloud向けのプレミアム優先AI生成ワークフローです。50種類以上の画像および動画モデル(Gemi…
★ 1 NOASSERTION 2026-05-27
動画生成 GitHub ai-kissing-video-generator
「AI Kissing Video Generator」は、2枚のポートレート写真を統合し、AIでロマンチックなキス動画を生成するオープン…
★ 1 2026-05-27
ComfyUI GitHub ComfyUI
ComfyUIは、画像、ビデオ、3Dモデル、オーディオなどのコンテンツをAIで生成するための強力かつモジュール式のエンジ…
★ 114.8k ⑂ 13.4k GPL-3.0 2026-05-28
ComfyUI GitHub Pixelle-Video
Pixelle-Videoは、入力されたテーマに基づいて、AIが短尺動画を全自動で生成するエンジンです。動画のスクリプト作成…
★ 20.5k ⑂ 2.9k Apache-2.0 2026-05-18
ComfyUI GitHub StabilityMatrix
Stability Matrixは、Stable Diffusion向けのマルチプラットフォームパッケージマネージャーおよび推論UIです。AUTOM…
★ 8.2k ⑂ 560 AGPL-3.0 2026-05-26
ComfyUI GitHub fast-stable-diffusion
TheLastBen/fast-stable-diffusionは、Google Colab上でStable Diffusion環境を迅速に構築・実行するためのノートブ…
★ 7.9k ⑂ 1.4k MIT 2025-11-29
ComfyUI GitHub Pixal3D-ComfyUI
Pixal3D-ComfyUIは、単一の画像から高品質な3Dモデルを生成するためのComfyUI用カスタムノードです。TencentARCのPix…
★ 138 ⑂ 13 MIT 2026-05-26
ComfyUI GitHub UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 71 ⑂ 2 GPL-3.0 2026-05-11
ComfyUI GitHub ComfyUI-Workflow-Debugger
ComfyUI Workflow Debuggerは、ComfyUIワークフローの破損、グラフのロード失敗、ノード接続エラーなどを解決するた…
★ 20 2026-05-26
ComfyUI GitHub ComfyUI-Pixal3D
ComfyUI-Pixal3Dは、Tencentの「Pixal3D」パイプラインをComfyUIで利用するためのカスタムノードです。単一の画像か…
★ 16 ⑂ 1 NOASSERTION 2026-05-14
ComfyUI GitHub L2MAS
L2MASは、Live2Dアニメーション制作を多エージェントAIで自動化するためのプロトタイプです。MCPおよびA2Aプロトコル…
★ 1 Apache-2.0 2026-05-30
ComfyUI GitHub Comfyui-anima-sampler
ComfyUI Anima Flow Corrective Samplerは、ComfyUI用のカスタムサンプラーノードで、AnimaおよびCosmosスタイルの画…
★ 5 ⑂ 1 MIT 2026-05-30
ComfyUI GitHub comfyui-gallery-loader
comfyui-gallery-loaderは、ComfyUIの画像およびパスウィジェット向けに設計された、タッチフレンドリーなギャラリー…
★ 1 ⑂ 1 MIT 2026-05-29
ComfyUI GitHub gpus-python-example
このリポジトリは、Novita GPUs SDKを使用してPythonワーカーハンドラを実装する方法を示すための具体例を提供します…
★ 1 Apache-2.0 2026-05-28
AIエージェント GitHub langflow
Langflowは、AIエージェントやAIを活用したワークフローを構築・デプロイするための強力なプラットフォームです。視…
★ 148.9k ⑂ 9.1k MIT 2026-05-30
AIエージェント GitHub Front-End-Checklist
「Frontend Checklist」は、ウェブ開発のベストプラクティスを人間とAIエージェント向けのレビューワークフローに変…
★ 72.7k ⑂ 6.6k 2026-05-29
AIエージェント GitHub learn-claude-code
本リポジトリ「Learn Claude Code」は、Claudeなどの大規模言語モデル(LLM)を活用したリアルなエージェント製品開…
★ 63.7k ⑂ 10.4k MIT 2026-05-29
AIエージェント GitHub autogen
AutoGenは、自律的に動作したり人間と共同作業したりするマルチエージェントAIアプリケーションを構築するためのフレ…
★ 58.5k ⑂ 8.8k CC-BY-4.0 2026-04-15
AIエージェント GitHub agents-best-practices
「agents-best-practices」は、エージェントハーネスの設計、MVPブループリントの生成、監査、リファクタリング、説…
★ 1.2k ⑂ 106 MIT 2026-05-30
AIエージェント GitHub files-sdk
Files SDKは、様々なオブジェクトストレージやブロブストレージバックエンド(S3、GCS、Azure、Vercel Blob、ローカ…
★ 1.1k ⑂ 32 MIT 2026-05-29
AIエージェント GitHub Photo-agents
Photo Agentsは、視覚情報に基づいてPCを操作する自律進化型エージェントです。画面上の情報を認識し、推論し、行動…
★ 963 ⑂ 19 MIT 2026-05-18
AIエージェント GitHub guizang-social-card-skill
このツールは、Claude CodeやCodexといったAIエージェント環境向けに設計されたソーシャルカード作成スキルです。記…
★ 592 ⑂ 73 AGPL-3.0 2026-05-27
AIエージェント GitHub agent-pods
Agent Podsは、AIエージェントをルートレスPodmanポッドで管理するための、プライベートかつGit管理されたコントロー…
★ 1 MIT 2026-05-31
AIエージェント GitHub Agent-Runtime-Community
Agent Runtime Security Platformは、自律型AIエージェントのためのオープンソースのゼロトラストセキュリティ、ガバ…
★ 1 2026-05-31
AIエージェント GitHub laravel-agent-mcp
「laravel-agent-mcp」は、Laravelアプリケーションのデータベーススキーマ、クエリ、ログ、キュー、キャッシュ、ル…
★ 1 MIT 2026-05-31
AIエージェント GitHub agentmd
AgentMDは、Claude Codeエージェントの監査、整理、安全なルーティングを支援するCLIおよびMCP(Claude Code)ベース…
★ 1 MIT 2026-05-31
LLM GitHub everything-claude-code
Everything Claude Codeは、Claude CodeやCodex、Cursor、OpenCode、Geminiなど複数のAIエージェント実行環境を強化…
★ 196.8k ⑂ 30.3k MIT 2026-05-28
LLM GitHub AutoGPT
AutoGPTは、継続実行型のAIエージェントを構築・配備・運用できるプラットフォームです。低コードのAgent Builderで…
★ 184.6k ⑂ 46.2k NOASSERTION 2026-05-28
LLM GitHub ollama
Ollamaは、GemmaやQwenなどのオープンモデルをローカル環境で手早く実行・管理できるツールです。macOS/Windows/Linu…
★ 172.5k ⑂ 16.3k MIT 2026-05-27
LLM GitHub hermes-agent
Hermes Agentは、CLIと各種メッセージング基盤を横断して使える自己改善型AIエージェントです。会話履歴検索、永続メ…
★ 171.1k ⑂ 28.6k MIT 2026-05-28
LLM GitHub how-to-train-your-gpt
このリポジリは、ChatGPTなどに使われている大規模言語モデル(LLM)をゼロから構築、学習、実行する方法を学ぶため…
★ 2.2k ⑂ 276 MIT 2026-05-27
LLM GitHub opensquilla
OpenSquillaは、トークン効率を最大化するマイクロカーネルAIエージェントです。限られた予算で高い知能密度と優れた…
★ 2.1k ⑂ 141 Apache-2.0 2026-05-30
LLM GitHub tokenspeed
TokenSpeedは、agentic workloadsのために設計された「光速」LLM推論エンジンです。TensorRT-LLMと同等の高性能とvLL…
★ 1.3k ⑂ 133 MIT 2026-05-30
LLM GitHub zerostack
「zerostack」は、Rustで書かれた軽量かつ高性能なミニマルなコーディングエージェントです。OpenAI、Gemini、Ollama…
★ 1.0k ⑂ 67 GPL-3.0 2026-05-31
LLM GitHub Continue-NIM-Proxy
このツールは、Continue/VSCodiumでNVIDIA NIMの「Step 3.7 Flash」モデルを使用する際に発生する、応答がサイレント…
★ 2 MIT 2026-05-31
LLM GitHub ring-fenced-rag
Ring-Fenced RAG (RFR)は、自己ホスト型でゼロトラストの検索拡張生成(RAG)システムです。特徴は、データベースレ…
★ 1 2026-05-31
LLM GitHub rag-chatbot-university
UniMindは、大学生向けのAIを活用したRAG(検索拡張生成)チャットボットで、大学のノートに関する質問に即座に答え…
★ 1 2026-05-30
LLM GitHub gitclaw
GitClawは、GitHub ActionsとGitHub Issuesを基盤として動作する、サーバーレスなAIアシスタントのプロトタイプです…
★ 1 2026-05-31
マルチモーダル GitHub anything-llm
AnythingLLMは、ドキュメントとのチャットやAIエージェントの利用を可能にするオールインワンのAI生産性向上ツールで…
★ 60.8k ⑂ 6.6k MIT 2026-05-30
マルチモーダル GitHub UI-TARS-desktop
UI-TARS-desktopは、マルチモーダルAIエージェントスタックTARSの一部であり、UI-TARSモデルに基づくネイティブGUIエ…
★ 35.7k ⑂ 3.6k Apache-2.0 2026-05-18
マルチモーダル GitHub LLaVA
LLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ…
★ 24.8k ⑂ 2.8k Apache-2.0 2024-08-12
マルチモーダル GitHub unilm
このGitHubリポジトリ「microsoft/unilm」は、Microsoftが提供する、タスク、言語、モダリティ(テキスト、画像、音…
★ 22.1k ⑂ 2.7k MIT 2026-01-23
マルチモーダル GitHub OpenSearch-VL
OpenSearch-VLは、最先端のマルチモーダル深層検索エージェントを訓練するためのオープンソースのレシピです。単一の…
★ 201 ⑂ 18 Apache-2.0 2026-05-19
マルチモーダル HF Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF
このREADMEは、Qwen 3.6系をベースに40Bへ拡張し、Deckard系データセットやClaude 4.6 Opus由来データで多段階調整し…
❤ 174 ↓ 483.0k apache-2.0 2026-05-15
マルチモーダル HF Qwopus3.6-35B-A3B-v1-GGUF
Qwopus3.6-35B-A3B-v1-GGUFは、Qwen3.6-35B-A3BをベースにLoRAで推論能力を強化した実験的なGGUF形式モデルです。35B…
❤ 169 ↓ 374.0k apache-2.0 2026-05-28
マルチモーダル GitHub facio
Facioは、長期間のワークフローにおいて人間が介入できる、セキュアで追跡可能なプロアクティブAIエージェントです。…
★ 76 ⑂ 1 AGPL-3.0 2026-05-28
マルチモーダル GitHub esp32-cam-with-gemma
ESP32-CAMオフラインAIビジョンアシスタントは、IoT、コンピュータビジョン、ローカル大規模言語モデルを組み合わせ…
★ 1 MIT 2026-05-31
マルチモーダル GitHub vision-bridge
Vision Bridgeは、DeepSeek V4 PROやGPT-4o-textのような純粋なテキストベースのLLMに「視覚能力」を付与するツール…
★ 1 MIT 2026-05-29
マルチモーダル GitHub wardrobeAssistant
wardrobeAssistantは、ローカルファーストのAI搭載パーソナルワードローブ管理ツールです。自動的な衣類セグメンテー…
★ 1 2026-05-30
マルチモーダル GitHub PixelRAG
PixelRAGは、ウェブページ、PDF、画像をスクリーンショットとして視覚的にレンダリングし、ビジョン言語モデルで埋め…
★ 5 Apache-2.0 2026-05-29
音声生成 / TTS GitHub unsloth
Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…
★ 65.2k ⑂ 5.8k Apache-2.0 2026-05-28
音声生成 / TTS GitHub Real-Time-Voice-Cloning
このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TT…
★ 59.8k ⑂ 9.4k NOASSERTION 2026-03-09
音声生成 / TTS GitHub GPT-SoVITS
GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-s…
★ 58.1k ⑂ 6.4k MIT 2026-04-30
音声生成 / TTS GitHub TTS
Coqui.aiの🐸TTSは、深層学習を用いた先進的なテキスト音声合成(Text-to-Speech)ライブラリです。1100以上の言語に…
★ 45.4k ⑂ 6.1k MPL-2.0 2024-08-16
音声生成 / TTS HF supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 720 ↓ 52.0k openrail 2026-05-18
音声生成 / TTS GitHub video-recap
「video-recap」は、入力された動画に対して自動で中国語のナレーション付き解説動画を生成するスキルです。動画の内…
★ 82 ⑂ 10 MIT 2026-05-18
音声生成 / TTS GitHub docker-ai-stack
このツールは、Ollama(LLM)、LiteLLM(AIゲートウェイ)、Whisper(STT)、Kokoro(TTS)、Embeddings(RAG)など…
★ 47 ⑂ 8 MIT 2026-05-29
音声生成 / TTS GitHub voice-agents-from-scratch
「Voice agents from scratch」は、Pythonでリアルタイム音声エージェントをゼロから構築するための実践的なチュート…
★ 29 ⑂ 3 MIT 2026-05-03
音声生成 / TTS GitHub hermes-embodiment
hermes-embodimentは、Hermesエージェントに物理的な具現化レイヤーを提供するツールです。エージェントの「思考中」…
★ 3 MIT 2026-05-30
音声生成 / TTS GitHub learn-almost-anything
「Learn (Almost) Anything」は、選択したトピックからパーソナライズされたコースを作成し、その学習を支援するデス…
★ 1 2026-05-30
音声生成 / TTS GitHub kokoro-server
「kokoro-infer」は、高速で軽量なKokoro-82M TTS(Text-to-Speech)推論エンジンおよびサーバーです。CPU、CUDA、そ…
★ 3 2026-05-29
音声生成 / TTS GitHub shotfun-creator
shotfun-creatorは、画像、動画、音声、デジタルヒューマンといった多様なAIコンテンツ制作を網羅するスキル集です。…
★ 6 ⑂ 1 NOASSERTION 2026-05-29
音楽生成 GitHub Amphion
Amphionは、音声、音楽、スピーチ生成のためのオープンソースツールキットです。再現可能な研究を支援し、音声生成分…
★ 9.8k ⑂ 813 MIT 2026-03-25
音楽生成 GitHub introtodeeplearning
MIT 6.S191「Introduction to Deep Learning」の公式コードとソフトウェアラボ資料を提供するリポジトリです。本コー…
★ 8.7k ⑂ 4.5k MIT 2026-01-04
音楽生成 GitHub YuE
YuEは、歌詞からボーカルと伴奏を含む数分間のフルソングを生成できる、オープンソースの音楽生成基盤モデルです。多…
★ 6.3k ⑂ 741 Apache-2.0 2025-06-04
音楽生成 GitHub ace-step-ui
ACE-Step UIは、オープンソースのAI音楽生成モデル「ACE-Step 1.5」のためのプロフェッショナルなユーザーインターフ…
★ 4.0k ⑂ 597 2026-03-02
音楽生成 GitHub studiomi300
studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…
★ 38 ⑂ 8 MIT 2026-05-22
音楽生成 GitHub Steerable-music-transformer
このプロジェクトは、論文「Steerable Rhythmic Complexity in Autoregressive Music Generation」の公式PyTorch実装…
★ 21 ⑂ 5 MIT 2026-05-27
音楽生成 GitHub StableDAW
StableDAWは、Stability AIのStable Audio 3拡散パイプラインを基盤とした、高品質なテキスト条件付きオーディオ生成…
★ 6 ⑂ 3 MIT 2026-05-26
音楽生成 GitHub aeon-music-maker
aeon-music-makerは、AEON Media Productionファミリーの一部であるスタンドアロンの音楽生成ツールです。ACE Step 1…
★ 6 ⑂ 2 MIT 2026-05-01
音楽生成 GitHub AuraDev
AuraDevは、開発者のリアルタイムの認知状態(集中、行き詰まり、デバッグなど)に適応してアンビエント音楽を生成す…
★ 1 GPL-3.0 2026-05-31
音楽生成 GitHub Steerable-music-transformer
このプロジェクトは、論文「Steerable Rhythmic Complexity in Autoregressive Music Generation」の公式PyTorch実装…
★ 21 ⑂ 5 MIT 2026-05-27
音楽生成 GitHub StableDAW
StableDAWは、Stability AIのStable Audio 3拡散パイプラインを基盤とした、高品質なテキスト条件付きオーディオ生成…
★ 6 ⑂ 3 MIT 2026-05-26
音楽生成 GitHub anvil-audio-v2
Anvil Audioは、Stability AIの`stable-audio-tools`を拡張し、AIオーディオ生成のためのプラグイン可能なスタジオツ…
★ 2 MIT 2026-05-27
ASR / 音声認識 GitHub whisper.cpp
whisper.cppは、OpenAIの高性能な音声認識モデルWhisperをC/C++で軽量に実装したライブラリです。依存関係を最小限に…
★ 50.2k ⑂ 5.6k MIT 2026-05-28
ASR / 音声認識 GitHub voicebox
Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。数秒の音声サンプルから…
★ 28.7k ⑂ 3.5k MIT 2026-04-26
ASR / 音声認識 GitHub llamafile
llamafileは、大規模言語モデル(LLM)を単一の実行可能ファイルとして配布・実行できる革新的なツールです。llama.c…
★ 24.5k ⑂ 1.4k NOASSERTION 2026-05-28
ASR / 音声認識 GitHub faster-whisper
「SYSTRAN/faster-whisper」は、OpenAIのWhisperモデルをCTranslate2で再実装した高速音声転写ツールです。オリジナ…
★ 23.3k ⑂ 1.9k MIT 2025-11-19
ASR / 音声認識 GitHub axon
AXONは、チャットボットではなく、生物学的にインスパイアされた学習型AIシステムです。セッション間で永続的な記憶…
★ 42 MIT 2026-05-08
ASR / 音声認識 GitHub dictly
Dictlyは、macOS向けの無料オープンソースのメニューバー音声入力アプリです。Apple Silicon搭載Macで、グローバルホ…
★ 38 ⑂ 2 MIT 2026-05-30
ASR / 音声認識 GitHub freestyle
Freestyleは、音声を瞬時にテキストへ変換するディクテーションアプリです。ホットキーを押しながら話すだけで、カー…
★ 37 ⑂ 2 NOASSERTION 2026-05-27
ASR / 音声認識 GitHub Pixel-Pets
Pixel Petsは、M5Stackハードウェア上で動作するオープンソースのバーチャルペットエコシステムです。Muffin(LLM搭…
★ 23 NOASSERTION 2026-05-17
ASR / 音声認識 GitHub Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-05-30
ASR / 音声認識 GitHub proto-android-native
PROTO Androidは、KotlinとJetpack Composeで開発された公式Androidメッセンジャークライアントです。チャット、音声…
★ 1 NOASSERTION 2026-05-30
ASR / 音声認識 GitHub watch
「/watch」は、YouTube、Instagram、X(旧Twitter)など多様なオンライン動画サイトやローカルファイルから、Claude…
★ 10 ⑂ 1 MIT 2026-05-29
ASR / 音声認識 GitHub waveshare-esp32-s3-ai-home-assistant-voice
このリポジトリは、Waveshare ESP32-S3 AI Smart Speaker Development BoardをHome Assistantのローカル音声アシスタ…
★ 2 MIT 2026-05-30
3D / NeRF GitHub instant-ngp
「NVlabs/instant-ngp」は、ニューラル放射輝度フィールド(NeRF)や符号付き距離関数(SDF)などを雷のように高速に…
★ 17.4k ⑂ 2.1k NOASSERTION 2026-02-02
3D / NeRF GitHub engine
PlayCanvas Engineは、WebGL2とWebGPUをベースにしたオープンソースのゲームエンジンです。Webブラウザ上で動作する…
★ 15.9k ⑂ 1.9k MIT 2026-05-29
3D / NeRF GitHub Meshroom
Meshroomは、複雑なデータ処理パイプラインを作成、管理、実行するためのオープンソースのノードベースのビジュアル…
★ 12.8k ⑂ 1.2k NOASSERTION 2026-05-29
3D / NeRF GitHub nerfstudio
nerfstudioは、NeRF(Neural Radiance Fields)の作成、学習、テストを簡素化するAPIを提供する、コラボレーションし…
★ 11.6k ⑂ 1.6k Apache-2.0 2025-07-29
3D / NeRF GitHub SpatialBench
SpatialBenchは、マルチモーダル大規模言語モデル(MLLM)のビデオ空間理解能力を評価するオープンソースベンチマー…
★ 51 2026-05-27
3D / NeRF GitHub MuGS
MuGSは、MuJoCo物理シミュレーションと3D Gaussian Splatting (3DGS) を組み合わせたハイブリッドレンダリングパイプ…
★ 49 ⑂ 1 NOASSERTION 2026-05-14
3D / NeRF GitHub LATO
LATOは、3Dメッシュのトポロジーを保持したまま圧縮し、効率的に生成する新しい手法を提案しています。これは、Verte…
★ 39 MIT 2026-05-14
3D / NeRF GitHub vggt-factor-refinement
このプロジェクトは、ビデオから3D再構築を効率的に行うためのツールです。VGGT(Video-based General-purpose Geome…
★ 18 ⑂ 1 2026-05-07
3D / NeRF GitHub autosplat-viewer
autosplat-viewerは、3D Gaussian Splats用の静的なビューアPWAです。`.ply`や`.sog`ファイルをブラウザにドラッグ&…
★ 1 AGPL-3.0 2026-05-30
3D / NeRF GitHub video-to-3d-gaussian-splat
video-to-3d-gaussian-splatは、ビデオ映像(.mp4/.mov)からインタラクティブな3D Gaussian Splatモデルを自動生成…
★ 1 AGPL-3.0 2026-05-30
3D / NeRF GitHub splattie-widget
「splattie-widget」は、インタラクティブな3D Gaussian SplattingをWebコンポーネントとして提供するツールです。Ri…
★ 1 MIT 2026-05-28
3D / NeRF GitHub VolFill
VolFillは、単一のRGB画像から屋内の完全な3Dシーンジオメトリを再構築する革新的なツールです。前景の背後に隠れた…
★ 2 2026-05-29
マルチモーダル HF RMBG-1.4
BRIA Background Removal v1.4は、画像内の前景を高精度に切り出して背景を除去できる画像セグメンテーションモデル…
❤ 2.0k ↓ 358.0k other 2025-07-06
マルチモーダル HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 586 ↓ 979.2k mit 2026-02-04
マルチモーダル HF segformer_b2_clothes
SegFormer B2をATRベースの人間パースデータセットで衣服セグメンテーション向けに微調整したモデルです。人物画像か…
❤ 501 ↓ 305.5k other 2025-09-19
マルチモーダル HF YOLOv8
Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…
❤ 352 ↓ 7.2k agpl-3.0 2025-01-11
LLM GitHub Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 202 ⑂ 20 Apache-2.0 2026-04-26
その他 GitHub Frequencer
Frequencerは、Go言語で開発されたデスクトップアプリケーションです。集中力と注意力を向上させることを目的とし、…
★ 1 2026-03-21
マルチモーダル HF BEN2
BEN2は、画像や動画から人物・物体の前景を高精度に切り抜き、背景除去やマスク生成を行うためのPython向けセグメン…
❤ 233 ↓ 203.9k mit 2025-12-31
マルチモーダル HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 586 ↓ 979.2k mit 2026-02-04