2,149 repos GH 2,034 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
LLM
GitHub how-to-train-your-gpt
このリポジトリは、現代の大規模言語モデル(LLM)をゼロから構築、訓練、実行する方法を学ぶための12章構成のインタ…
★ 1.9k ⑂ 243 MIT 2026-05-24
LLM GitHub openless
OpenLessは、macOSおよびWindows向けのオープンソース音声入力アプリケーションです。ホットキーを押して話すだけで…
★ 1.7k ⑂ 140 MIT 2026-05-26
動画生成 HF Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 1.3k ↓ 1.4M 2026-05-22
LLM GitHub tokenspeed
TokenSpeedは、agentic workloadsのために設計された「光速」LLM推論エンジンです。TensorRT-LLMと同等の高性能とvLL…
★ 1.2k ⑂ 118 MIT 2026-05-26
音声生成 / TTS
GitHub the-muser
The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…
★ 1 MIT 2026-05-27
画像生成
GitHub ImageManager
ImageManagerは、OpenAI互換の画像API(gpt-image-2など)向けのデスクトップクライアントです。自社デプロイや任意…
★ 2 Apache-2.0 2026-05-27
音声生成 / TTS
GitHub everything-to-podcast
「万物播客(Everything-to-Podcast)」は、AIを活用してあらゆるテキストコンテンツをポッドキャストやオーディオブ…
★ 1 2026-05-27
ASR / 音声認識 GitHub Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
⚖️GitHub vs HuggingFace TOP 両方を一画面で比較
画像生成 GitHub stable-diffusion-webui
Stable Diffusion web UIは、Gradioライブラリで実装された、画像生成AI「Stable Diffusion」の多機能なWebインター…
★ 163.3k ⑂ 30.4k AGPL-3.0 2026-03-02
画像生成 GitHub LocalAI
LocalAIは、大規模言語モデル(LLMs)、視覚、音声、画像、ビデオなど、様々なAIモデルをどんなハードウェア環境でも…
★ 46.5k ⑂ 4.1k MIT 2026-05-26
画像生成 GitHub khoj
Khojは、個人の能力を拡張するAIセカンドブレインアプリです。ローカルまたはオンラインのLLM(llama3, GPT, Gemini…
★ 34.7k ⑂ 2.2k AGPL-3.0 2026-03-26
画像生成 GitHub diffusers
🤗 Diffusersは、画像、音声、分子の3D構造生成のための最先端の拡散モデルを提供するPythonライブラリです。シンプ…
★ 33.7k ⑂ 7.0k Apache-2.0 2026-05-26
画像生成 GitHub Lance
Lanceは、ByteDanceが開発した30億の有効パラメータを持つ統合マルチモーダルAIモデルです。このモデルは、単一のフ…
★ 955 ⑂ 62 Apache-2.0 2026-05-26
画像生成 GitHub Hallo-Live
Hallo-Liveは、テキスト入力からリアルタイムでアバターのビデオと音声を生成する先進的なフレームワークです。因果…
★ 141 ⑂ 19 MIT 2026-05-22
画像生成 GitHub CDM
本ツールは、「Continuous-Time Distribution Matching (CDM)」技術を用いた、少ステップ拡散蒸留のためのフレームワ…
★ 135 ⑂ 6 MIT 2026-05-11
画像生成 GitHub gpt-image2-ecommerce
E-Commerce Image Generatorは、GPT-Image-2を活用し、ECサイト向け素材画像を効率的に生成するツールです。Codex CL…
★ 103 ⑂ 17 MIT 2026-04-27
画像生成
GitHub ImageManager
ImageManagerは、OpenAI互換の画像API(gpt-image-2など)向けのデスクトップクライアントです。自社デプロイや任意…
★ 2 Apache-2.0 2026-05-27
画像生成 GitHub J.A.R.V.I.S
J.A.R.V.I.S.は、Windows向けのローカルファーストAIコマンドセンターです。React/Three.jsのHUDとFastAPIのバックエ…
★ 1 2026-05-26
画像生成
GitHub awesome-ai-image-prompts
このリポジトリは、GPT-Image-2、Nano Banana、Seedance、Qwen-VL、Gemini ImagenなどのAI画像生成モデル向けの、955…
★ 2 ⑂ 2 Apache-2.0 2026-05-26
画像生成
GitHub Animerge
Animergeは、AnimaモデルのチェックポイントやLoRAファイルをデスクトップGUIで統合的に管理・分析・学習するための…
★ 1 2026-05-27
動画生成 GitHub LivePortrait
LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…
★ 18.4k ⑂ 1.9k NOASSERTION 2026-03-02
動画生成
GitHub Open-Generative-AI
Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…
★ 17.0k ⑂ 2.9k 2026-05-26
動画生成 GitHub Wan2.2
Wan2.2は、オープンで先進的な大規模ビデオ生成モデルWanの主要なアップグレード版です。専門家混合(MoE)アーキテ…
★ 15.9k ⑂ 2.0k Apache-2.0 2026-03-17
動画生成 GitHub Duix-Avatar
Duix.Avatarは、Duix.comによって開発された、完全にオープンソースのAIアバターツールキットです。本ツールは、ユー…
★ 13.1k ⑂ 2.2k NOASSERTION 2026-04-21
動画生成 HF Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 1.3k ↓ 1.4M 2026-05-22
画像生成 GitHub nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 472 ⑂ 24 MIT 2026-05-26
動画生成 HF LTX2.3-10Eros
10 Erosは、LTX系のimage-to-video向けに調整されたモデル/チェックポイントで、ComfyUIワークフローや専用ノードと…
❤ 315 ↓ 203.6k 2026-05-11
動画生成 GitHub lanshu-awesome-ai-video-kit
この「lanshu-awesome-ai-video-kit」は、企業におけるAIビデオプロジェクトの課題解決のために開発されたオープンソ…
★ 155 ⑂ 36 MIT 2026-05-27
動画生成 GitHub lanshu-awesome-ai-video-kit
この「lanshu-awesome-ai-video-kit」は、企業におけるAIビデオプロジェクトの課題解決のために開発されたオープンソ…
★ 155 ⑂ 36 MIT 2026-05-27
動画生成
GitHub seedance-movie-mcp
Seedance Movie MCPは、火山方舟Seedance/即夢ビデオ生成のためのローカルMCPサーバーです。物語や長文をシーンプロ…
★ 1 MIT 2026-05-25
動画生成 GitHub awesome-gemini-omni-guide-api-and-prompt
このリポジトリは、Google Gemini OmniのAPI利用ガイドとプロンプト集です。Gemini Omniの高度な機能(動画生成、編…
★ 4 NOASSERTION 2026-05-26
動画生成
GitHub volcengine-hermes-plugin
このプラグインは、Hermes Agentに火山引擎(Volcengine)のDoubao LLM(大規模言語モデル)、Doubao Seedream(画像…
★ 2 2026-05-25
ComfyUI GitHub ComfyUI
ComfyUIは、画像、ビデオ、3Dモデル、オーディオなどのコンテンツをAIで生成するための強力かつモジュール式のエンジ…
★ 114.5k ⑂ 13.4k GPL-3.0 2026-05-26
ComfyUI GitHub Pixelle-Video
Pixelle-Videoは、入力されたテーマに基づいて、AIが短尺動画を全自動で生成するエンジンです。動画のスクリプト作成…
★ 19.9k ⑂ 2.8k Apache-2.0 2026-05-18
ComfyUI GitHub StabilityMatrix
Stability Matrixは、Stable Diffusion向けのマルチプラットフォームパッケージマネージャーおよび推論UIです。AUTOM…
★ 8.2k ⑂ 560 AGPL-3.0 2026-05-26
ComfyUI GitHub fast-stable-diffusion
TheLastBen/fast-stable-diffusionは、Google Colab上でStable Diffusion環境を迅速に構築・実行するためのノートブ…
★ 7.9k ⑂ 1.4k MIT 2025-11-29
ComfyUI GitHub Pixal3D-ComfyUI
Pixal3D-ComfyUIは、単一の画像から高品質な3Dモデルを生成するためのComfyUI用カスタムノードです。TencentARCのPix…
★ 124 ⑂ 12 MIT 2026-05-26
ComfyUI GitHub UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 70 ⑂ 2 GPL-3.0 2026-05-11
ComfyUI GitHub comfyui-aeon-spark
このツールは、NVIDIA DGX Spark (GB10 / Blackwell / sm_121a) に特化して最適化された、最先端のComfyUIディストリ…
★ 35 ⑂ 9 2026-05-04
ComfyUI GitHub ComfyUI-Sapiens2-Easy
「ComfyUI-Sapiens2-Easy」は、Meta Sapiens2モデルをComfyUIのネイティブノードとして統合するツールです。単一の画…
★ 21 ⑂ 2 NOASSERTION 2026-05-04
ComfyUI
GitHub video-to-prompt
nanofatdog/video-to-promptは、動画からAI画像生成プロンプトを抽出するためのGradioベースのWebアプリケーションで…
★ 5 NOASSERTION 2026-05-26
ComfyUI
GitHub nodeguard
nodeguardは、ComfyUIのカスタムノードやノードベースのワークフロープラグイン向けのセキュリティスキャナーです。…
★ 3 ⑂ 2 Apache-2.0 2026-05-27
ComfyUI GitHub ComfyUI-NVML-Monitor
ComfyUI-NVML-Monitorは、ComfyUI向けのNVIDIA専用ハードウェアテレメトリー拡張機能です。ComfyUIのタブを離れるこ…
★ 2 MIT 2026-05-25
ComfyUI
GitHub vramsuite
VRAM Suiteは、ローカルAI推論ワークフローにおけるGPUメモリ診断のためのPythonフレームワークです。OOMエラーによ…
★ 4 ⑂ 1 NOASSERTION 2026-05-26
AIエージェント GitHub langflow
Langflowは、AIエージェントやAIを活用したワークフローを構築・デプロイするための強力なプラットフォームです。視…
★ 148.8k ⑂ 9.1k MIT 2026-05-26
AIエージェント GitHub learn-claude-code
本リポジトリ「Learn Claude Code」は、Claudeなどの大規模言語モデル(LLM)を活用したリアルなエージェント製品開…
★ 62.7k ⑂ 10.3k MIT 2026-05-26
AIエージェント GitHub autogen
AutoGenは、自律的に動作したり人間と共同作業したりするマルチエージェントAIアプリケーションを構築するためのフレ…
★ 58.4k ⑂ 8.8k CC-BY-4.0 2026-04-15
AIエージェント GitHub mem0
Mem0は、AIエージェントにパーソナライズされたインタラクションを可能にするためのインテリジェントな記憶層を提供…
★ 56.9k ⑂ 6.5k Apache-2.0 2026-05-27
AIエージェント GitHub agents-best-practices
「agents-best-practices」は、エージェントハーネスの設計、MVPブループリントの生成、監査、リファクタリング、説…
★ 1.1k ⑂ 96 MIT 2026-05-15
AIエージェント GitHub Photo-agents
Photo Agentsは、視覚情報に基づいてPCを操作する自律進化型エージェントです。画面上の情報を認識し、推論し、行動…
★ 1.0k ⑂ 20 MIT 2026-05-18
AIエージェント
GitHub files-sdk
Files SDKは、様々なオブジェクトストレージやブロブストレージバックエンド(S3、GCS、Azure、Vercel Blob、ローカ…
★ 986 ⑂ 31 MIT 2026-05-26
AIエージェント GitHub deepcode-cli
Deep Code CLIは、deepseek-v4モデルに特化して最適化されたコマンドラインAIコーディングアシスタントです。深度思…
★ 938 ⑂ 77 MIT 2026-05-26
AIエージェント
GitHub claude-code-companion
Claude Code Companionは、Apple Silicon Mac上で動作する、コーディング時の孤独を和らげる音声コンパニオンツール…
★ 1 2026-05-27
AIエージェント
GitHub AutoRun
AutoRUN v1は、OpenAIおよびAnthropic互換の各種API(OpenAI、Azure OpenAI、DeepSeek、Groq、Claudeなど)をサポー…
★ 24 ⑂ 3 MIT 2026-05-27
AIエージェント
GitHub ApocData-skill
ApocDataは、中国A株市場のAIネイティブな金融データベースを提供するツールです。株価、財務データ、資金流動、各種…
★ 2 ⑂ 1 Apache-2.0 2026-05-26
AIエージェント
GitHub heya.skill
本ツールは、Bilibiliの動画投稿者「黒鴉」(Heya)の動画タイトルスタイル(長文、感情を煽る表現、複数の出来事を…
★ 6 MIT 2026-05-26
LLM GitHub everything-claude-code
Everything Claude Codeは、Claude CodeやCodex、Cursor、OpenCode、Geminiなど複数のAIエージェント実行環境を強化…
★ 193.5k ⑂ 29.9k MIT 2026-05-25
LLM
GitHub AutoGPT
AutoGPTは、継続実行型のAIエージェントを構築・配備・運用できるプラットフォームです。低コードのAgent Builderで…
★ 184.6k ⑂ 46.2k NOASSERTION 2026-05-26
LLM GitHub ollama
Ollamaは、GemmaやQwenなどのオープンモデルをローカル環境で手早く実行・管理できるツールです。macOS/Windows/Linu…
★ 172.3k ⑂ 16.3k MIT 2026-05-25
LLM GitHub hermes-agent
Hermes Agentは、CLIと各種メッセージング基盤を横断して使える自己改善型AIエージェントです。会話履歴検索、永続メ…
★ 168.1k ⑂ 27.8k MIT 2026-05-26
LLM GitHub opensquilla
OpenSquillaは、トークン効率を最大化するマイクロカーネルAIエージェントです。限られた予算で高い知能密度と優れた…
★ 2.0k ⑂ 132 Apache-2.0 2026-05-26
LLM
GitHub how-to-train-your-gpt
このリポジトリは、現代の大規模言語モデル(LLM)をゼロから構築、訓練、実行する方法を学ぶための12章構成のインタ…
★ 1.9k ⑂ 243 MIT 2026-05-24
LLM GitHub openless
OpenLessは、macOSおよびWindows向けのオープンソース音声入力アプリケーションです。ホットキーを押して話すだけで…
★ 1.7k ⑂ 140 MIT 2026-05-26
LLM GitHub tokenspeed
TokenSpeedは、agentic workloadsのために設計された「光速」LLM推論エンジンです。TensorRT-LLMと同等の高性能とvLL…
★ 1.2k ⑂ 118 MIT 2026-05-26
LLM
GitHub zero
「Zero」は、経験豊富なセキュリティ研究者のように直接的な推論でセキュリティ問題に取り組むことを目指した、小規…
★ 1 Apache-2.0 2026-05-27
LLM
GitHub AgentSimulator
AI Agent Simulatorは、実際のAIエージェントがチャットメッセージを処理する内部プロセスをリアルタイムで可視化す…
★ 1 MIT 2026-05-27
LLM GitHub lodestar
Lodestarは、2026年に開発されたHBCU学生向けのAIキャリアアシスタントです。これは、HP FOWA 2024で優勝したIgniteA…
★ 1 NOASSERTION 2026-05-26
LLM
GitHub rag-agent
このツールは、本番環境に対応したRAG(検索拡張生成)とAIエージェントプラットフォームです。高密度、BM25、RRFを…
★ 1 2026-05-26
マルチモーダル GitHub anything-llm
AnythingLLMは、ドキュメントとのチャットやAIエージェントの利用を可能にするオールインワンのAI生産性向上ツールで…
★ 60.6k ⑂ 6.6k MIT 2026-05-24
マルチモーダル GitHub UI-TARS-desktop
UI-TARS-desktopは、マルチモーダルAIエージェントスタックTARSの一部であり、UI-TARSモデルに基づくネイティブGUIエ…
★ 35.4k ⑂ 3.6k Apache-2.0 2026-05-18
マルチモーダル GitHub LLaVA
LLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ…
★ 24.8k ⑂ 2.8k Apache-2.0 2024-08-12
マルチモーダル
GitHub unilm
このGitHubリポジトリ「microsoft/unilm」は、Microsoftが提供する、タスク、言語、モダリティ(テキスト、画像、音…
★ 22.1k ⑂ 2.7k MIT 2026-01-23
マルチモーダル HF Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF
このREADMEは、Qwen 3.6 27Bをベースに検閲緩和と追加ファインチューニングを施し、さらにGGUF量子化版を多数用意し…
❤ 231 ↓ 532.1k apache-2.0 2026-05-14
マルチモーダル GitHub Thinking-with-Visual-Primitives
「Thinking with Visual Primitives」は、Multimodal Large Language Models (MLLM) が抱える「Reference Gap」を解…
★ 214 ⑂ 59 MIT 2026-05-22
マルチモーダル GitHub OpenSearch-VL
OpenSearch-VLは、最先端のマルチモーダル深層検索エージェントを訓練するためのオープンソースのレシピです。単一の…
★ 198 ⑂ 18 Apache-2.0 2026-05-19
マルチモーダル HF Qwen3.5-9B-DeepSeek-V4-Flash-GGUF
Qwen3.5-9Bをベースに、DeepSeek-V4由来の高品質な推論データで蒸留した軽量推論モデルのREADMEです。多段階の論理展…
❤ 183 ↓ 499.6k apache-2.0 2026-05-02
マルチモーダル GitHub aiyeah
AIyeahは、AIアプリケーション開発を簡素化するモジュール型AIプラットフォームです。複数のAIツールやプロバイダー…
★ 1 MIT 2026-05-26
マルチモーダル
GitHub opencode-vision
opencode-visionは、マルチモーダルに対応していないOpenCodeモデルに画像認識機能を追加するツールです。ユーザーが…
★ 1 MIT 2026-05-27
マルチモーダル GitHub awesome-gemini-omni
このリポジトリは、Googleの次世代マルチモーダルAIモデル「Gemini Omni」に関する厳選されたリソース集です。テキス…
★ 6 CC0-1.0 2026-05-25
マルチモーダル
GitHub Aibys2
Aibys2は、インドネシアに根ざしたAIエコシステム向けの、スクラッチから大規模言語モデル(LLM)を構築・学習するた…
★ 1 NOASSERTION 2026-05-24
音声生成 / TTS GitHub unsloth
Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…
★ 65.2k ⑂ 5.8k Apache-2.0 2026-05-26
音声生成 / TTS
GitHub Real-Time-Voice-Cloning
このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TT…
★ 59.8k ⑂ 9.4k NOASSERTION 2026-03-09
音声生成 / TTS
GitHub GPT-SoVITS
GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-s…
★ 57.8k ⑂ 6.3k MIT 2026-04-30
音声生成 / TTS GitHub TTS
Coqui.aiの🐸TTSは、深層学習を用いた先進的なテキスト音声合成(Text-to-Speech)ライブラリです。1100以上の言語に…
★ 45.4k ⑂ 6.1k MPL-2.0 2024-08-16
音声生成 / TTS HF supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 684 ↓ 48.1k openrail 2026-05-18
音声生成 / TTS GitHub video-recap
「video-recap」は、入力された動画に対して自動で中国語のナレーション付き解説動画を生成するスキルです。動画の内…
★ 76 ⑂ 10 MIT 2026-05-18
音声生成 / TTS
GitHub korean-voice-acting-engine
Korean Voice Acting Engine (KVAE) は、韓国語音声に特化したローカルファーストのツールキットです。ユーザーが自…
★ 64 ⑂ 5 NOASSERTION 2026-05-05
音声生成 / TTS
GitHub docker-ai-stack
このツールは、Ollama(LLM)、LiteLLM(AIゲートウェイ)、Whisper(STT)、Kokoro(TTS)、Embeddings(RAG)など…
★ 41 ⑂ 8 MIT 2026-05-25
音声生成 / TTS
GitHub the-muser
The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…
★ 1 MIT 2026-05-27
音声生成 / TTS
GitHub everything-to-podcast
「万物播客(Everything-to-Podcast)」は、AIを活用してあらゆるテキストコンテンツをポッドキャストやオーディオブ…
★ 1 2026-05-27
音声生成 / TTS GitHub Supertonic_3_TTS_App
「Supertonic 3 TTS App」は、Supertone Supertonic 3エンジンを搭載した、Windows向けのオンデバイス・ニューラルテ…
★ 1 2026-05-27
音声生成 / TTS GitHub ai-google-voice-agent
「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…
★ 1 2026-05-26
音楽生成
GitHub Amphion
Amphionは、音声、音楽、スピーチ生成のためのオープンソースツールキットです。再現可能な研究を支援し、音声生成分…
★ 9.8k ⑂ 814 MIT 2026-03-25
音楽生成 GitHub introtodeeplearning
MIT 6.S191「Introduction to Deep Learning」の公式コードとソフトウェアラボ資料を提供するリポジトリです。本コー…
★ 8.7k ⑂ 4.5k MIT 2026-01-04
音楽生成
GitHub YuE
YuEは、歌詞からボーカルと伴奏を含む数分間のフルソングを生成できる、オープンソースの音楽生成基盤モデルです。多…
★ 6.2k ⑂ 741 Apache-2.0 2025-06-04
音楽生成
GitHub ace-step-ui
ACE-Step UIは、オープンソースのAI音楽生成モデル「ACE-Step 1.5」のためのプロフェッショナルなユーザーインターフ…
★ 4.0k ⑂ 588 2026-03-02
音楽生成
GitHub studiomi300
studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…
★ 38 ⑂ 8 MIT 2026-05-22
音楽生成 GitHub aeon-music-maker
aeon-music-makerは、AEON Media Productionファミリーの一部であるスタンドアロンの音楽生成ツールです。ACE Step 1…
★ 6 ⑂ 2 MIT 2026-05-01
音楽生成
GitHub StableDAW
StableDAWは、Stability AIのStable Audio 3拡散パイプラインを基盤とした、高品質なテキスト条件付きオーディオ生成…
★ 6 ⑂ 3 MIT 2026-05-26
音楽生成 GitHub cadenza
CADENZAは、AIを活用してプログレッシブハウスやメロディックテクノ向けのMIDIを生成するツールです。BPMとキーを入…
★ 5 MIT 2026-05-18
音楽生成
GitHub StableDAW
StableDAWは、Stability AIのStable Audio 3拡散パイプラインを基盤とした、高品質なテキスト条件付きオーディオ生成…
★ 6 ⑂ 3 MIT 2026-05-26
音楽生成
GitHub anvil-audio-v2
Anvil Audioは、Stability AIの`stable-audio-tools`を拡張し、AIオーディオ生成のためのプラグイン可能なスタジオツ…
★ 2 MIT 2026-05-27
音楽生成
GitHub vibe-sing
Vibe-singは、Claude Codeセッションの終わりに、そのセッションのトランスクリプトからユーザーの気分を読み取り、…
★ 4 MIT 2026-05-11
音楽生成
GitHub studiomi300
studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…
★ 38 ⑂ 8 MIT 2026-05-22
ASR / 音声認識 GitHub whisper.cpp
whisper.cppは、OpenAIの高性能な音声認識モデルWhisperをC/C++で軽量に実装したライブラリです。依存関係を最小限に…
★ 50.1k ⑂ 5.6k MIT 2026-05-26
ASR / 音声認識 GitHub voicebox
Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。数秒の音声サンプルから…
★ 28.5k ⑂ 3.5k MIT 2026-04-26
ASR / 音声認識 GitHub llamafile
llamafileは、大規模言語モデル(LLM)を単一の実行可能ファイルとして配布・実行できる革新的なツールです。llama.c…
★ 24.5k ⑂ 1.4k NOASSERTION 2026-05-26
ASR / 音声認識
GitHub faster-whisper
「SYSTRAN/faster-whisper」は、OpenAIのWhisperモデルをCTranslate2で再実装した高速音声転写ツールです。オリジナ…
★ 23.2k ⑂ 1.9k MIT 2025-11-19
ASR / 音声認識 GitHub freestyle
Freestyleは、音声を瞬時にテキストへ変換するディクテーションアプリです。ホットキーを押しながら話すだけで、カー…
★ 37 ⑂ 2 NOASSERTION 2026-05-27
ASR / 音声認識 GitHub dictly
Dictlyは、macOS向けの無料オープンソースのメニューバー音声入力アプリです。Apple Silicon搭載Macで、グローバルホ…
★ 33 ⑂ 2 MIT 2026-05-15
ASR / 音声認識 GitHub FastWord
FastWordは、macOSユーザー向けのプライベートでローカルなプッシュトゥトーク音声入力アプリケーションです。ホット…
★ 32 ⑂ 3 2026-05-23
ASR / 音声認識 GitHub openquack
OpenQuackはmacOS向けの音声文字変換メニューバーアプリです。ホットキーを押して話すだけで、話した内容がカーソル…
★ 28 ⑂ 4 MIT 2026-05-26
ASR / 音声認識
GitHub aria-ai
Ariaは6〜17歳の子ども向けに設計されたデスクトップAIコンパニオンアプリです。ローカルで動作し、データプライバシ…
★ 1 AGPL-3.0 2026-05-27
ASR / 音声認識 GitHub Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
ASR / 音声認識
GitHub Benetto
Benetto — VoiceNotes Localは、Androidデバイス上で動作する音声ノート録音・文字起こしツールです。OpenAIのWhispe…
★ 10 MIT 2026-05-26
ASR / 音声認識
GitHub whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-05-27
3D / NeRF GitHub instant-ngp
「NVlabs/instant-ngp」は、ニューラル放射輝度フィールド(NeRF)や符号付き距離関数(SDF)などを雷のように高速に…
★ 17.4k ⑂ 2.1k NOASSERTION 2026-02-02
3D / NeRF GitHub engine
PlayCanvas Engineは、WebGL2とWebGPUをベースにしたオープンソースのゲームエンジンです。Webブラウザ上で動作する…
★ 15.9k ⑂ 1.9k MIT 2026-05-26
3D / NeRF GitHub Meshroom
Meshroomは、複雑なデータ処理パイプラインを作成、管理、実行するためのオープンソースのノードベースのビジュアル…
★ 12.8k ⑂ 1.2k NOASSERTION 2026-05-26
3D / NeRF GitHub nerfstudio
nerfstudioは、NeRF(Neural Radiance Fields)の作成、学習、テストを簡素化するAPIを提供する、コラボレーションし…
★ 11.6k ⑂ 1.6k Apache-2.0 2025-07-29
3D / NeRF GitHub Awesome-Gaussian-Skills
「Awesome Gaussian Skills」は、3D Gaussian Splatting (3DGS) およびコンピュータグラフィックス研究のための画期…
★ 74 ⑂ 7 Apache-2.0 2026-05-25
3D / NeRF GitHub SpatialBench
SpatialBenchは、マルチモーダル大規模言語モデル(MLLM)のビデオ空間理解能力を評価するオープンソースベンチマー…
★ 51 2026-05-27
3D / NeRF GitHub MuGS
MuGSは、MuJoCo物理シミュレーションと3D Gaussian Splatting (3DGS) を組み合わせたハイブリッドレンダリングパイプ…
★ 49 ⑂ 1 NOASSERTION 2026-05-14
3D / NeRF GitHub LATO
LATOは、3Dメッシュのトポロジーを保持したまま圧縮し、効率的に生成する新しい手法を提案しています。これは、Verte…
★ 37 MIT 2026-05-14
3D / NeRF
GitHub splatfastk1
SplatfastK1は、スマートフォンで撮影した動画をGPU不要で3D Gaussian splatに変換できる無料のWindowsデスクトップ…
★ 2 MIT 2026-05-26
3D / NeRF
GitHub Future-Droidux
Future Droiduxは、動き、知能、適応型インターフェースデザインの交差点を探索する次世代の没入型Web体験です。人間…
★ 4 2026-05-21
3D / NeRF GitHub SceneAligner
SceneAlignerは、様々な実環境画像とラスタライズされたフロアプランを入力として、画像から重力に沿った3D点群を再…
★ 8 2026-05-22
3D / NeRF GitHub Painterly-2DGS-For-Unity
「Painterly 2D Gaussian Splatting for Unity」は、Unityエンジン向けに最適化された高速な2D Gaussian Splattingシ…
★ 1 Unlicense 2026-05-25
マルチモーダル HF RMBG-1.4
BRIA Background Removal v1.4は、画像内の前景を高精度に切り出して背景を除去できる画像セグメンテーションモデル…
❤ 2.0k ↓ 411.3k other 2025-07-06
マルチモーダル
HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 586 ↓ 995.2k mit 2026-02-04
マルチモーダル HF segformer_b2_clothes
SegFormer B2をATRベースの人間パースデータセットで衣服セグメンテーション向けに微調整したモデルです。人物画像か…
❤ 501 ↓ 328.4k other 2025-09-19
マルチモーダル HF YOLOv8
Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…
❤ 350 ↓ 7.2k agpl-3.0 2025-01-11
LLM
GitHub Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 296 ⑂ 54 Apache-2.0 2026-04-26
その他
GitHub Frequencer
Frequencerは、Go言語で開発されたデスクトップアプリケーションです。集中力と注意力を向上させることを目的とし、…
★ 1 2026-03-21
マルチモーダル HF BEN2
BEN2は、画像や動画から人物・物体の前景を高精度に切り抜き、背景除去やマスク生成を行うためのPython向けセグメン…
❤ 233 ↓ 216.9k mit 2025-12-31
マルチモーダル
HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 586 ↓ 995.2k mit 2026-02-04