3,433 repos GH 3,318 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
画像生成 GitHub ian-xiaohei-illustrations
「Ian Xiaohei Illustrations」は、AIエージェントが中国語の文章、ブログ記事、Notionドキュメントなどに、白背景の…
★ 3.6k ⑂ 318 MIT 2026-06-03
AIエージェント GitHub guizang-social-card-skill
このツールは、Claude CodeやCodexといったAIエージェント環境向けに設計されたソーシャルカード作成スキルです。記…
★ 3.2k ⑂ 297 AGPL-3.0 2026-05-27
動画生成 GitHub html-video
「html-video」は、HTML、CSS、およびデータを使用してプログラム的にMP4動画を生成する革新的なツールです。Gemini…
★ 2.8k ⑂ 321 Apache-2.0 2026-06-10
AIエージェント GitHub agents-best-practices
「agents-best-practices」は、エージェントハーネスの設計、MVPブループリントの生成、監査、リファクタリング、説…
★ 1.9k ⑂ 165 MIT 2026-06-06
音声生成 / TTS GitHub code-driven-video-template
「Code-Driven Video Template」は、スクリプトからナレーション付きのデータスタイルの動画をコードベースで生成す…
★ 1 MIT 2026-06-14
音声生成 / TTS GitHub sharky-ai-terminal
SHARKY AIは、アニメーション化されたネオンボイスオーブとハンズフリー音声チャット機能を備えた、ターミナル専用の…
★ 1 2026-06-14
ASR / 音声認識 GitHub Premiere-Pro-edit-bibl
Premiere Auto-Editは、話している動画(ロングフォーム・トーク・ライブ)のラフカットを、たった1つのコマンドで自…
★ 4 MIT 2026-06-14
画像生成 GitHub GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
⚖️GitHub vs HuggingFace TOP 両方を一画面で比較
画像生成 GitHub stable-diffusion-webui
Stable Diffusion web UIは、Gradioライブラリで実装された、画像生成AI「Stable Diffusion」の多機能なWebインター…
★ 163.7k ⑂ 30.4k AGPL-3.0 2026-03-02
画像生成 GitHub LocalAI
LocalAIは、大規模言語モデル(LLMs)、視覚、音声、画像、ビデオなど、様々なAIモデルをどんなハードウェア環境でも…
★ 46.8k ⑂ 4.1k MIT 2026-06-13
画像生成 GitHub khoj
Khojは、個人の能力を拡張するAIセカンドブレインアプリです。ローカルまたはオンラインのLLM(llama3, GPT, Gemini…
★ 35.1k ⑂ 2.2k AGPL-3.0 2026-03-26
画像生成 GitHub diffusers
🤗 Diffusersは、画像、音声、分子の3D構造生成のための最先端の拡散モデルを提供するPythonライブラリです。シンプ…
★ 33.8k ⑂ 7.1k Apache-2.0 2026-06-13
画像生成 GitHub ian-xiaohei-illustrations
「Ian Xiaohei Illustrations」は、AIエージェントが中国語の文章、ブログ記事、Notionドキュメントなどに、白背景の…
★ 3.6k ⑂ 318 MIT 2026-06-03
画像生成 GitHub Lance
LanceはByteDanceが開発した30億パラメータのマルチモーダルAIモデルです。単一フレームワーク内で画像および動画の…
★ 1.1k ⑂ 76 Apache-2.0 2026-06-02
画像生成 GitHub image-extender
Image Extenderは、AIを使用して画像をあらゆる方向にシームレスに拡張できるオープンソースのWebアプリケーションで…
★ 966 ⑂ 107 MIT 2026-05-31
画像生成 GitHub webchat2api
webchat2apiは、GPT/ChatGPT Web、Grok/xAI Web、Gemini Webの機能を標準API(OpenAI互換APIおよびGeminiネイティブA…
★ 325 ⑂ 64 MIT 2026-06-07
画像生成 GitHub GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
画像生成 GitHub generative-modeling-scientific
このリポジトリは、科学計算タスクに適用されるスコアベースの生成モデルの研究用ベンチマークフレームワークです。…
★ 1 2026-06-13
画像生成 GitHub illo-skill
illoは、アイデアや記事をオリジナルのプリントスタイル編集イラストに変換するAIエージェントスキルです。特徴とし…
★ 18 MIT 2026-06-13
画像生成 GitHub open-dungeon
「Open Dungeon」は、完全にローカル環境で動作するAIロールプレイングアプリケーションです。アカウント登録やAPIキ…
★ 46 ⑂ 3 MIT 2026-06-12
動画生成 GitHub Open-Generative-AI
Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…
★ 19.1k ⑂ 3.3k MIT 2026-06-12
動画生成 GitHub LivePortrait
LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…
★ 18.5k ⑂ 1.9k NOASSERTION 2026-06-01
動画生成 GitHub Wan2.2
Wan2.2は、オープンで先進的な大規模ビデオ生成モデルWanの主要なアップグレード版です。専門家混合(MoE)アーキテ…
★ 16.2k ⑂ 2.0k Apache-2.0 2026-03-17
動画生成 GitHub Duix-Avatar
Duix.Avatarは、Duix.comによって開発された、完全にオープンソースのAIアバターツールキットです。本ツールは、ユー…
★ 13.6k ⑂ 2.3k NOASSERTION 2026-04-21
動画生成 GitHub html-video
「html-video」は、HTML、CSS、およびデータを使用してプログラム的にMP4動画を生成する革新的なツールです。Gemini…
★ 2.8k ⑂ 321 Apache-2.0 2026-06-10
動画生成 GitHub Bernini
Berniniは、動画の生成と編集を統一的に行うためのフレームワークです。MLLM(マルチモーダル大規模言語モデル)ベー…
★ 663 ⑂ 48 Apache-2.0 2026-06-09
動画生成 GitHub lanshu-awesome-ai-video-kit
この「lanshu-awesome-ai-video-kit」は、企業におけるAIビデオプロジェクトの課題解決のために開発されたオープンソ…
★ 262 ⑂ 73 MIT 2026-06-01
動画生成 GitHub ai-shortVideo-pipeline
myAiVideosは、AIを活用した中国語短編動画の自動制作パイプラインです。トピック発見からクリエイティブ生成、視覚…
★ 138 ⑂ 1 MIT 2026-06-04
動画生成 GitHub ComfyUI-MediaHub
ComfyUI MediaHubは、クラウドベースの画像および動画生成APIを、構成可能でクリーンなComfyUIワークフローに統合す…
★ 1 MIT 2026-06-13
動画生成 GitHub agnes-video-generator
Agnes Video Generatorは、Agnes AIを活用したワンクリックAI動画生成ツールです。テキストのアイデアから複数のシー…
★ 1 2026-06-12
動画生成 GitHub ai-video-creator
このツールは、Claude Agent Skillとして機能し、生活の知恵に関するアイデアを、AIナレーション付きで直接公開可能…
★ 1 MIT 2026-06-11
動画生成 GitHub p-video-avatar-generator
「P-Video Avatar generator」は、PrunaAIのP-Video Avatarモデルを搭載した、無料のAIトークアバター動画生成デスク…
★ 1 ⑂ 1 MIT 2026-06-10
ComfyUI GitHub ComfyUI
ComfyUIは、画像、ビデオ、3Dモデル、オーディオなどのコンテンツをAIで生成するための強力かつモジュール式のエンジ…
★ 116.8k ⑂ 13.7k GPL-3.0 2026-06-13
ComfyUI GitHub Pixelle-Video
Pixelle-Videoは、入力されたテーマに基づいて、AIが短尺動画を全自動で生成するエンジンです。動画のスクリプト作成…
★ 22.2k ⑂ 3.1k Apache-2.0 2026-06-08
ComfyUI GitHub StabilityMatrix
Stability Matrixは、Stable Diffusion向けのマルチプラットフォームパッケージマネージャーおよび推論UIです。AUTOM…
★ 8.3k ⑂ 564 AGPL-3.0 2026-06-08
ComfyUI GitHub fast-stable-diffusion
TheLastBen/fast-stable-diffusionは、Google Colab上でStable Diffusion環境を迅速に構築・実行するためのノートブ…
★ 7.9k ⑂ 1.4k MIT 2025-11-29
ComfyUI GitHub Pixal3D-ComfyUI
Pixal3D-ComfyUIは、単一の画像から高品質な3Dモデルを生成するためのComfyUI用カスタムノードです。TencentARCのPix…
★ 157 ⑂ 16 MIT 2026-06-12
ComfyUI GitHub comfy-skills
Comfy-Org/comfy-skillsは、AIコーディングエージェントがComfy Cloudを介して、画像、ビデオ、オーディオ、3Dコンテ…
★ 37 MIT 2026-06-04
ComfyUI GitHub Comfyui-anima-sampler
ComfyUI Anima Flow Corrective Samplerは、ComfyUI用のカスタムサンプラーノードで、AnimaおよびCosmosスタイルの画…
★ 22 ⑂ 1 MIT 2026-06-10
ComfyUI GitHub ComfyUI-Workflow-Debugger
ComfyUI Workflow Debuggerは、ComfyUIワークフローの破損、グラフのロード失敗、ノード接続エラーなどを解決するた…
★ 20 2026-06-06
ComfyUI GitHub Zonos2_TTS-ComfyUI
このツールは、Zyphra/ZONOS2モデルをComfyUIで利用するためのカスタムノード集です。テキスト読み上げ、音声のみで…
★ 2 MIT 2026-06-13
ComfyUI GitHub runpod-comfyui-controller
RunPod上でComfyUIをインタラクティブに実行するための、費用管理機能を重視したローカルファーストなセッションコン…
★ 1 MIT 2026-06-12
ComfyUI GitHub isometric-game-skills
このリポジトリは、AIエージェントがアイソメトリックゲームを構築するための、20の専門スキルセットを提供します。A…
★ 1 MIT 2026-06-10
ComfyUI GitHub ComfyUI-LongCat-Avatar
rookiestar28/ComfyUI-LongCat-Avatarは、ComfyUI用のカスタムノード集で、LongCat Video Avatar 1.5のオーディオ駆…
★ 17 ⑂ 1 MIT 2026-06-10
AIエージェント GitHub langflow
Langflowは、AIエージェントやAIを活用したワークフローを構築・デプロイするための強力なプラットフォームです。視…
★ 149.6k ⑂ 9.3k MIT 2026-06-13
AIエージェント GitHub Front-End-Checklist
Front-End Checklistは、人間とAIエージェント向けに設計されたオープンソースのフロントエンド品質システムです。フ…
★ 72.9k ⑂ 6.6k 2026-06-02
AIエージェント GitHub learn-claude-code
本リポジトリ「Learn Claude Code」は、Claudeなどの大規模言語モデル(LLM)を活用したリアルなエージェント製品開…
★ 66.4k ⑂ 10.8k MIT 2026-06-07
AIエージェント GitHub ruflo
Rufloは、Agenticなワークフローを構築・実行するためのツールです。Web UIを通じて、エージェントベースの目標計画…
★ 59.2k ⑂ 6.8k MIT 2026-06-13
AIエージェント GitHub guizang-social-card-skill
このツールは、Claude CodeやCodexといったAIエージェント環境向けに設計されたソーシャルカード作成スキルです。記…
★ 3.2k ⑂ 297 AGPL-3.0 2026-05-27
AIエージェント GitHub agents-best-practices
「agents-best-practices」は、エージェントハーネスの設計、MVPブループリントの生成、監査、リファクタリング、説…
★ 1.9k ⑂ 165 MIT 2026-06-06
AIエージェント GitHub loom
Loomは、AIを活用してJSON Schema形式のAPIドキュメントを生成するツールです。TUI(テキストユーザーインターフェー…
★ 940 ⑂ 33 2026-05-28
AIエージェント GitHub mobilegym
MobileGymは、モバイルGUIエージェントの研究を目的とした、検証可能で高並列なシミュレーションプラットフォームで…
★ 577 ⑂ 89 Apache-2.0 2026-06-08
AIエージェント GitHub Flowork-OS
Floworkは、ユーザーが自身のAIエージェントを所有し、ローカルで実行するための主権的なAIエージェントOSです。USB…
★ 1 AGPL-3.0 2026-06-14
AIエージェント GitHub server-projects
dirjaker/server-projectsは、Ubuntu 22.04サーバー上に22の多様なプロジェクト(AIエージェントインフラ、VitePress…
★ 1 MIT 2026-06-14
AIエージェント GitHub agent-harness-generator
agent-harness-generatorは、AIエージェント向けの「メタハーネス」であり、ユーザー独自のAIエージェントハーネスを…
★ 16 ⑂ 3 MIT 2026-06-14
AIエージェント GitHub agentwikis-mcp
「agentwikis-mcp」は、AIエージェントが利用することを目的とした知識ベース「Agent Wikis」にアクセスするためのMC…
★ 1 MIT 2026-06-14
LLM GitHub everything-claude-code
Everything Claude Codeは、Claude CodeやCodex、Cursor、OpenCode、Geminiなど複数のAIエージェント実行環境を強化…
★ 214.6k ⑂ 33.0k MIT 2026-06-11
LLM GitHub hermes-agent
Hermes Agentは、CLIと各種メッセージング基盤を横断して使える自己改善型AIエージェントです。会話履歴検索、永続メ…
★ 192.4k ⑂ 33.5k MIT 2026-06-13
LLM GitHub AutoGPT
AutoGPTは、継続実行型のAIエージェントを構築・配備・運用できるプラットフォームです。低コードのAgent Builderで…
★ 184.9k ⑂ 46.2k NOASSERTION 2026-06-13
LLM GitHub ollama
Ollamaは、GemmaやQwenなどのオープンモデルをローカル環境で手早く実行・管理できるツールです。macOS/Windows/Linu…
★ 174.0k ⑂ 16.6k MIT 2026-06-13
LLM GitHub ponytail
Ponytailは、AIエージェントに「最も怠惰なシニア開発者」のように思考させるツールです。AIエージェントがコードを…
★ 4.0k ⑂ 169 MIT 2026-06-13
LLM GitHub awesome-architecture
このリポジトリは、コードを書くことよりも「アーキテクチャ」に焦点を当てたオープンソースの知識ベースです。AIが…
★ 1.1k ⑂ 116 MIT 2026-05-30
LLM GitHub memory-os
Memory OSは、Hermes Agentに永続的な長期記憶機能を提供する7層構造のメモリオペレーティングシステムです。エージ…
★ 1.1k ⑂ 99 MIT 2026-06-10
LLM GitHub Duel-Agents
Duel Agentsは、複数の大規模言語モデル(LLM)に対してプロンプトを実行し、最もコスト効率が高く、かつ最適な回答…
★ 1.0k ⑂ 19 MIT 2026-06-05
LLM GitHub model-monitor
「模型 API 监控工具」は、OpenAI、DeepSeek、MiMoなど、複数のモデルAPIの利用状況をリアルタイムで監視・管理する…
★ 1 MIT 2026-06-14
LLM GitHub OracleBase
Oracleは、Agnoを基盤とした自律型AIコーディングエージェントです。CLIまたはWeb UIを通じて、コードの読み書き、編…
★ 1 MIT 2026-06-13
LLM GitHub local-llm-2-2026
このツール「Local Llm 2 2026」は、Windowsユーザー向けにローカル環境で大規模言語モデル(LLM)を簡単に実行でき…
★ 1 2026-06-14
LLM GitHub ponytail
Ponytailは、AIエージェントに「最も怠惰なシニア開発者」のように思考させるツールです。AIエージェントがコードを…
★ 4.0k ⑂ 169 MIT 2026-06-13
マルチモーダル GitHub anything-llm
AnythingLLMは、ドキュメントとのチャットやAIエージェントの利用を可能にするオールインワンのAI生産性向上ツールで…
★ 61.5k ⑂ 6.7k MIT 2026-06-13
マルチモーダル GitHub UI-TARS-desktop
UI-TARS-desktopは、マルチモーダルAIエージェントスタックTARSの一部であり、UI-TARSモデルに基づくネイティブGUIエ…
★ 36.4k ⑂ 3.7k Apache-2.0 2026-05-18
マルチモーダル GitHub LLaVA
LLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ…
★ 24.9k ⑂ 2.8k Apache-2.0 2024-08-12
マルチモーダル GitHub unilm
このGitHubリポジトリ「microsoft/unilm」は、Microsoftが提供する、タスク、言語、モダリティ(テキスト、画像、音…
★ 22.1k ⑂ 2.7k MIT 2026-01-23
マルチモーダル GitHub llm-intern-skill
「LLMInternSkill」は、大規模言語モデル(LLM)関連のインターンシップやAI分野での就職活動を目指す学生・求職者向…
★ 184 ⑂ 6 MIT 2026-06-04
マルチモーダル GitHub WebDroid-Agent
WebDroid Agentは、ブラウザベースのAndroidスマートフォンエージェント実験プロジェクトです。WebUSB/WebADBを介し…
★ 78 ⑂ 13 MIT 2026-05-28
マルチモーダル GitHub count-anything
Count Anythingは、テキストクエリに基づいて画像内のあらゆるオブジェクトを数えることができる汎用モデルです。自…
★ 73 ⑂ 3 Apache-2.0 2026-06-04
マルチモーダル GitHub cc-VisionRouter
cc-VisionRouterは、Claude Code環境で画像非対応のLLMを利用する際に、画像を含むリクエストを自動的にマルチモーダ…
★ 57 MIT 2026-06-07
マルチモーダル GitHub Awesome-TTT-in-Vision
「Awesome-TTT-in-Vision」は、コンピュータビジョン分野におけるTest-Time Training (TTT)に関する厳選された論文と…
★ 2 Apache-2.0 2026-06-13
マルチモーダル GitHub CaptionEvalKit-for-VLMs
CaptionEvalKit-for-VLMsは、VLM(Visual Language Model)向け画像キャプション評価を再現性高く、オールインワンで…
★ 2 BSD-3-Clause-Clear 2026-06-13
マルチモーダル GitHub airline-support-agent
このツールは、架空の航空会社FlightAIのためのマルチモーダルAIカスタマーサポートチャットボット「Airline Support…
★ 1 ⑂ 1 2026-06-12
マルチモーダル GitHub multimodal-rock-classification
このツールは、手持ちの岩石・鉱物の写真から種類を識別するMATLABデスクトップアプリケーションです。畳み込みニュ…
★ 2 2026-06-10
音声生成 / TTS GitHub unsloth
Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…
★ 66.4k ⑂ 5.9k Apache-2.0 2026-06-13
音声生成 / TTS GitHub Real-Time-Voice-Cloning
このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TT…
★ 59.9k ⑂ 9.4k NOASSERTION 2026-03-09
音声生成 / TTS GitHub GPT-SoVITS
GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-s…
★ 58.6k ⑂ 6.4k MIT 2026-04-30
音声生成 / TTS GitHub TTS
Coqui.aiの🐸TTSは、深層学習を用いた先進的なテキスト音声合成(Text-to-Speech)ライブラリです。1100以上の言語に…
★ 45.6k ⑂ 6.1k MPL-2.0 2024-08-16
音声生成 / TTS GitHub Confucius4-TTS
Confucius4-TTSは、LLMと音声エンコーダをベースにした、多言語・異言語対応のゼロショット音声合成エンジンです。「…
★ 145 ⑂ 13 NOASSERTION 2026-06-06
音声生成 / TTS GitHub ai-avatar-bot
「AI仮想人ウィジェット」は、Live2Dキャラクターを任意のウェブサイトに簡単に埋め込むことができる音声AIアシスタ…
★ 82 ⑂ 25 NOASSERTION 2026-06-11
音声生成 / TTS GitHub Audio-Oscar
Audio-Oscarは、複雑な音声シーン記述から長尺で制御可能な音声を生成するためのマルチエージェントフレームワークで…
★ 40 ⑂ 4 Apache-2.0 2026-06-08
音声生成 / TTS GitHub Artemis
「Shiki Natsume」は、四季夏目をキャラクターとする、完全オフライン動作のAIガールフレンドプロジェクトです。Open…
★ 40 ⑂ 2 NOASSERTION 2026-06-11
音声生成 / TTS GitHub Velora
Veloraは、Groqの高速LLMを活用したAI駆動の多言語翻訳プラットフォームです。単なる単語の翻訳にとどまらず、語彙、…
★ 1 MIT 2026-06-14
音声生成 / TTS GitHub code-driven-video-template
「Code-Driven Video Template」は、スクリプトからナレーション付きのデータスタイルの動画をコードベースで生成す…
★ 1 MIT 2026-06-14
音声生成 / TTS GitHub sharky-ai-terminal
SHARKY AIは、アニメーション化されたネオンボイスオーブとハンズフリー音声チャット機能を備えた、ターミナル専用の…
★ 1 2026-06-14
音声生成 / TTS GitHub HiggsAudio-Studio
Higgs Audio Studioは、Higgs Audio v3 TTSを基盤としたポータブルなローカルテキスト読み上げ(TTS)ツールです。10…
★ 14 ⑂ 1 2026-06-14
音楽生成 GitHub Amphion
Amphionは、音声、音楽、スピーチ生成のためのオープンソースツールキットです。再現可能な研究を支援し、音声生成分…
★ 9.8k ⑂ 814 MIT 2026-03-25
音楽生成 GitHub introtodeeplearning
MIT 6.S191「Introduction to Deep Learning」の公式コードとソフトウェアラボ資料を提供するリポジトリです。本コー…
★ 8.7k ⑂ 4.5k MIT 2026-01-04
音楽生成 GitHub YuE
YuEは、歌詞からボーカルと伴奏を含む数分間のフルソングを生成できる、オープンソースの音楽生成基盤モデルです。多…
★ 6.3k ⑂ 744 Apache-2.0 2025-06-04
音楽生成 GitHub ace-step-ui
ACE-Step UIは、オープンソースのAI音楽生成モデル「ACE-Step 1.5」のためのプロフェッショナルなユーザーインターフ…
★ 4.1k ⑂ 616 2026-06-04
音楽生成 GitHub Steerable-music-transformer
このプロジェクトは、論文「Steerable Rhythmic Complexity in Autoregressive Music Generation」の公式PyTorch実装…
★ 21 ⑂ 5 MIT 2026-05-27
音楽生成 GitHub StableDAW
theDAWは、AIを活用した音楽生成からプロフェッショナルな制作、ライブパフォーマンスまでを網羅するオールインワン…
★ 10 ⑂ 5 MIT 2026-06-09
音楽生成 GitHub AuraDev
AuraDevは、開発者のリアルタイムの認知状態(集中、行き詰まり、デバッグなど)に適応してアンビエント音楽を生成す…
★ 3 GPL-3.0 2026-05-31
音楽生成 GitHub theDAW
「theDAW」はGANTASMOが開発したAI音楽制作のためのオールインワンスタジオです。既存のオーディオ、テキストプロン…
★ 3 ⑂ 1 MIT 2026-06-11
音楽生成 GitHub theDAW
「theDAW」はGANTASMOが開発したAI音楽制作のためのオールインワンスタジオです。既存のオーディオ、テキストプロン…
★ 3 ⑂ 1 MIT 2026-06-11
音楽生成 GitHub suno-songsmith
このツールは、Claude AI向けのスキルで、Sunoでの楽曲制作において、リリース品質の素材を作成することを支援します…
★ 2 2026-06-04
音楽生成 GitHub ima-skills
本リポジトリは、AI漫画作成、ソーシャルメディア運営、AI画像生成、音楽生成など多岐にわたる25種類のAIスキルをIMA…
★ 2 ⑂ 1 MIT 2026-06-05
音楽生成 GitHub mcp
RunAPI MCP Serverは、AI画像生成、動画生成、音楽作成、テキスト読み上げ、プロンプト検索、モデル発見といった多岐…
★ 1 Apache-2.0 2026-06-04
ASR / 音声認識 GitHub whisper.cpp
whisper.cppは、OpenAIの高性能な音声認識モデルWhisperをC/C++で軽量に実装したライブラリです。依存関係を最小限に…
★ 50.7k ⑂ 5.7k MIT 2026-06-09
ASR / 音声認識 GitHub voicebox
Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。数秒の音声サンプルから…
★ 29.9k ⑂ 3.7k MIT 2026-04-26
ASR / 音声認識 GitHub llamafile
llamafileは、大規模言語モデル(LLM)を単一の実行可能ファイルとして配布・実行できる革新的なツールです。llama.c…
★ 24.9k ⑂ 1.4k NOASSERTION 2026-06-09
ASR / 音声認識 GitHub Handy
Handyは、完全にオフラインで動作する無料のオープンソース音声認識デスクトップアプリケーションです。プライバシー…
★ 23.7k ⑂ 2.0k MIT 2026-06-11
ASR / 音声認識 GitHub freestyle
Freestyleは、音声を瞬時にテキストへ変換するディクテーションアプリです。ホットキーを押しながら話すだけで、カー…
★ 322 ⑂ 40 MIT 2026-06-09
ASR / 音声認識 GitHub SoulX-Transcriber
SoulX-Transcriberは、複数の話者が登場する対話シナリオにおいて、話者特定(ダイアライゼーション)、タイムスタン…
★ 225 ⑂ 10 Apache-2.0 2026-06-04
ASR / 音声認識 GitHub blitztext-app
Blitztext Appは、macOS向けの実験的なオープンソースのメニューバーアプリです。ホットキーで音声を録音し、テキス…
★ 136 ⑂ 47 MIT 2026-06-02
ASR / 音声認識 GitHub subforge
SubForgeは、動画字幕制作を再現性のあるAIパイプラインに変えるために設計されたRust製のコマンドラインインターフ…
★ 86 ⑂ 8 MIT 2026-06-01
ASR / 音声認識 GitHub Premiere-Pro-edit-bibl
Premiere Auto-Editは、話している動画(ロングフォーム・トーク・ライブ)のラフカットを、たった1つのコマンドで自…
★ 4 MIT 2026-06-14
ASR / 音声認識
GitHub funasr-whisper-api
このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…
★ 1 MIT 2026-06-14
ASR / 音声認識 GitHub claude-baby
Claude Babyは、ハンズフリーで音声操作が可能なClaude Codeエージェントです。このツールはデスクトップペットとし…
★ 1 AGPL-3.0 2026-06-14
ASR / 音声認識 GitHub diting-ai-bilibili-video-to-text-notes
本ツールは、Bilibiliの人気動画やプレイリストのURLから、AIを活用して自動的にMarkdown形式のスマートノートを生成…
★ 1 MIT 2026-06-14
3D / NeRF GitHub instant-ngp
「NVlabs/instant-ngp」は、ニューラル放射輝度フィールド(NeRF)や符号付き距離関数(SDF)などを雷のように高速に…
★ 17.4k ⑂ 2.1k NOASSERTION 2026-02-02
3D / NeRF GitHub engine
PlayCanvas Engineは、WebGL2とWebGPUをベースにしたオープンソースのゲームエンジンです。Webブラウザ上で動作する…
★ 16.0k ⑂ 1.9k MIT 2026-06-13
3D / NeRF GitHub Meshroom
Meshroomは、複雑なデータ処理パイプラインを作成、管理、実行するためのオープンソースのノードベースのビジュアル…
★ 12.8k ⑂ 1.2k NOASSERTION 2026-06-12
3D / NeRF GitHub nerfstudio
nerfstudioは、NeRF(Neural Radiance Fields)の作成、学習、テストを簡素化するAPIを提供する、コラボレーションし…
★ 11.7k ⑂ 1.6k Apache-2.0 2025-07-29
3D / NeRF GitHub dvlt.cu
dvlt.cuは、NVIDIAのDVLT (Déjà View Looping Transformer) をCUDA/C++で再実装した、依存関係のない高速な3D再構築…
★ 52 ⑂ 8 Apache-2.0 2026-06-04
3D / NeRF GitHub LATO
LATOは、3Dメッシュのトポロジーを保持したまま圧縮し、効率的に生成する新しい手法を提案しています。これは、Verte…
★ 49 MIT 2026-05-14
3D / NeRF GitHub SceneAligner
SceneAlignerは、様々な実環境画像とラスタライズされたフロアプランを入力として、画像から重力に沿った3D点群を再…
★ 9 2026-05-22
3D / NeRF GitHub iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 9 2026-06-09
3D / NeRF GitHub daily-webapp-2026-06-10-gaussiansplatlab
GaussianSplatLabは、リアルタイム放射輝度場レンダリングの画期的な技術である3D Gaussian Splatting (3DGS) の理論…
★ 1 MIT 2026-06-10
3D / NeRF GitHub vision-embodied-ai-roadmap
このプロジェクトは、コンピュータビジョン、3Dビジョン、自動運転、マルチモーダル知覚、具身知能、ロボティクスと…
★ 1 NOASSERTION 2026-06-10
3D / NeRF GitHub photo-to-mesh
「photo-to-mesh」は、オブジェクトの写真をクリーンでスケーリングされたダウンロード可能な3Dメッシュに変換するツ…
★ 3 MIT 2026-06-09
3D / NeRF GitHub egocentric-3d-reconstruction-demo
この「Egocentric 3D Reconstruction Demo」は、一人称視点ビデオからの3D再構築の基礎を学ぶためのインタラクティブ…
★ 2 MIT 2026-06-09
マルチモーダル HF RMBG-1.4
BRIA Background Removal v1.4は、画像内の前景を高精度に切り出して背景を除去できる画像セグメンテーションモデル…
❤ 2.0k ↓ 304.0k other 2025-07-06
マルチモーダル HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 592 ↓ 711.2k mit 2026-02-04
マルチモーダル HF segformer_b2_clothes
このツールは、Hugging Faceの`mattmdjaga/segformer_b2_clothes`リポジトリで提供されるSegFormer B2モデルであり、…
❤ 501 ↓ 108.3k other 2025-09-19
マルチモーダル HF YOLOv8
Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…
❤ 360 ↓ 7.8k agpl-3.0 2025-01-11
その他 GitHub Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
その他 GitHub my-podcast
「My Podcast Studio」は、AI音声合成とポッドキャストナレーションを提供するオープンソースのSaaSプラットフォーム…
★ 1 ⑂ 1 2026-06-09
その他 GitHub Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
その他 GitHub my-podcast
「My Podcast Studio」は、AI音声合成とポッドキャストナレーションを提供するオープンソースのSaaSプラットフォーム…
★ 1 ⑂ 1 2026-06-09
LLM GitHub Project_Chronos
Project Chronosは、SSDとDRAMを活用したハイブリッド推論に特化した、ストレージ認識型のMoE (Mixture of Experts) …
★ 202 ⑂ 20 Apache-2.0 2026-04-26
その他 GitHub Frequencer
Frequencerは、Go言語で開発されたデスクトップアプリケーションです。集中力と注意力を向上させることを目的とし、…
★ 1 2026-03-21