AIAI Hub

3,596 repos GH 3,481 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

音声生成 / TTS 🔥 今月の話題 #1 GitHub

LA-Studio

LA Studioは、音声認識、テキスト読み上げ、音声クローン、音声デザイン、モデルダウンロード、ランタイム管理を一つのデスクトップアプリで提供するオフラインAIオーディ…

★ 6 GPL-3.0 音声生成 / TTS

ComfyUI ✨ 最新追加 GitHub

midjourney-comfyui

「Midjourney ComfyUI Nodes」は、ComfyUI内でMidjourney V7、V8、Nijiモデルを用いて高品質な画像を生成するためのカスタムノード集です。muapi.aiのAPIを利用し、1回の…

★ 3 MIT ComfyUI

📈今月の話題直近1か月公開 / 人気順

すべて見る →

ASR / 音声認識

GitHub

video-to-brain

「video-to-brain」は、携帯から送信された動画をAIが分析し、スマートなノートを自動生成してObsidianに保存するツ…

#AI/LLM利用 #CLI #Docker対応

★ 0 MIT 2026-07-12

AIエージェント

GitHub

polaris

日本語の要約（200〜400文字、何ができるツールか・特徴・想定ユーザーを含める）

#互換性タグの配列。例: ComfyUI対応 / GPU必須 / 日本語対応 / CLI / Python / Web UI など。3〜6個。なければ空配列

★ 0 AGPL-3.0 2026-07-12

✨新着 repo 公開日順

すべて見る →

ASR / 音声認識

GitHub

video-to-brain

「video-to-brain」は、携帯から送信された動画をAIが分析し、スマートなノートを自動生成してObsidianに保存するツ…

#AI/LLM利用 #CLI #Docker対応

★ 0 MIT 2026-07-12

AIエージェント

GitHub

polaris

日本語の要約（200〜400文字、何ができるツールか・特徴・想定ユーザーを含める）

#互換性タグの配列。例: ComfyUI対応 / GPU必須 / 日本語対応 / CLI / Python / Web UI など。3〜6個。なければ空配列

★ 0 AGPL-3.0 2026-07-12

ASR / 音声認識

GitHub

find-influencer-skill

このスキルは、AIエージェントが小紅書、抖音、Bilibili、YouTubeなどの複数のプラットフォームでインフルエンサーを…

#AIエージェント #CLI #Python

★ 0 2026-06-25

LLM

GitHub

local-rag-llm

このツールは、完全にオフラインで動作するプライバシー重視のRAG（検索拡張生成）アプリケーションです。PDFドキュ…

#LangChain #LLM使用 #PDF対応

★ 1 MIT 2026-07-08

⚖️GitHub vs HuggingFace TOP 両方を一画面で比較

GitHub TOP 10

★ 順

#1 GH everything-claude-code ★ 229.1k Everything Claude Codeは、Claude CodeやCodex、Cursor、OpenCode、Geminiなど複数のAIエージ… #2 GH hermes-agent ★ 214.1k Hermes Agentは、CLIと各種メッセージング基盤を横断して使える自己改善型AIエージェントです。… #3 GH AutoGPT ★ 185.5k AutoGPTは、継続実行型のAIエージェントを構築・配備・運用できるプラットフォームです。低コー… #4 GH ollama ★ 176.0k Ollamaは、GemmaやQwenなどのオープンモデルをローカル環境で手早く実行・管理できるツールです… #5 GH prompts.chat ★ 165.6k prompts.chatは、ChatGPTをはじめClaude、Gemini、Llama、Mistralなど複数のAIチャットモデルで… #6 GH stable-diffusion-webui ★ 164.2k Stable Diffusion web UIは、Gradioライブラリで実装された、画像生成AI「Stable Diffusion」の… #7 GH transformers ★ 162.6k Transformersは、Hugging Faceが提供する機械学習モデル定義フレームワークで、テキスト・画像… #8 GH langflow ★ 151.8k Langflowは、AIエージェントやAIを活用したワークフローを構築・デプロイするための強力なプラ… #9 GH firecrawl ★ 150.2k Firecrawlは、AIエージェント向けにWeb検索・スクレイピング・ページ操作をまとめて提供するオ… #10 GH dify ★ 148.7k Difyは、LLMアプリやエージェント型ワークフローを開発・運用するためのオープンソース基盤です…

HuggingFace TOP 10

❤ 順

#1 HF stable-diffusion-xl-base-1.0 ❤ 7.9k このモデルはStability AIが開発した、テキストプロンプトから画像を生成・修正する拡散ベース… #2 HF Kokoro-82M ❤ 6.5k Kokoroは、わずか8200万パラメータの軽量ながら、大規模なモデルに匹敵する高品質な音声合成（T… #3 HF whisper-large-v3 ❤ 5.9k Whisper large-v3は、OpenAIが開発した最先端の自動音声認識（ASR）および音声翻訳モデルです。… #4 HF Z-Image-Turbo ❤ 5.0k Z-Imageは、60億パラメータを持つ高効率な画像生成モデルファミリーです。特にZ-Image-Turboは… #5 HF XTTS-v2 ❤ 3.7k XTTS-v2は、Coquiが開発した高度な音声生成モデルです。わずか6秒の短い音声クリップを用いるこ… #6 HF gpt2 ❤ 3.3k GPT-2は、大規模な英語コーパスで事前学習されたTransformerベースの言語モデルです。文章の次… #7 HF gemma-4-31B-it ❤ 3.2k Gemma 4 31B itは、Google DeepMindのオープンウェイトな命令調整済みマルチモーダルモデルです… #8 HF whisper-large-v3-turbo ❤ 3.2k Whisper large-v3-turboは、OpenAIが提案する最先端の自動音声認識（ASR）および音声翻訳モデル… #9 HF Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive ❤ 2.7k Qwen3.6-35B-A3Bをベースに、拒否応答を極力外したHauhauCS製のGGUF配布モデルです。テキストに… #10 HF sdxl-turbo ❤ 2.6k SDXL-Turboは、Stability AIが開発した高速な生成テキストから画像へのモデルです。リアルタイ…

画像生成 447 repos

すべて見る →

画像生成

GitHub

stable-diffusion-webui

Stable Diffusion web UIは、Gradioライブラリで実装された、画像生成AI「Stable Diffusion」の多機能なWebインター…

#API #GPU必須 #Python

★ 164.2k ⑂ 30.5k AGPL-3.0 2026-03-02

画像生成

GitHub

LocalAI

LocalAIは、大規模言語モデル（LLMs）、視覚、音声、画像、ビデオなど、様々なAIモデルをどんなハードウェア環境でも…

#CLI #Docker対応 #GPU不要

★ 47.5k ⑂ 4.2k MIT 2026-07-13

画像生成

GitHub

khoj

Khojは、個人の能力を拡張するAIセカンドブレインアプリです。ローカルまたはオンラインのLLM（llama3, GPT, Gemini…

#Emacs対応 #LLM連携 #Obsidian対応

★ 35.7k ⑂ 2.3k AGPL-3.0 2026-06-24

画像生成

GitHub

diffusers

🤗 Diffusersは、画像、音声、分子の3D構造生成のための最先端の拡散モデルを提供するPythonライブラリです。シンプ…

#3Dモデル生成 #GPU必須 #Python

★ 34.1k ⑂ 7.1k Apache-2.0 2026-07-13

動画生成 335 repos

すべて見る →

画像生成

GitHub

OpenMontage

OpenMontageは、世界初となるオープンソースのエージェント型動画制作システムです。AIコーディングアシスタントを本…

#AIコーディングアシスタント連携 #CLI #Python

★ 37.3k ⑂ 4.5k AGPL-3.0 2026-07-11

動画生成

GitHub

Open-Generative-AI

Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…

#GPU必須 #Python #Web UI

★ 23.3k ⑂ 4.0k MIT 2026-07-10

動画生成

GitHub

LivePortrait

LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…

#ComfyUI連携 #GPU必須 #Python

★ 18.7k ⑂ 1.9k NOASSERTION 2026-06-01

動画生成

GitHub

Wan2.2

Wan2.2は、オープンで先進的な大規模ビデオ生成モデルWanの主要なアップグレード版です。専門家混合（MoE）アーキテ…

#GPU必須 #Hugging Face対応 #Image-to-Video

★ 16.7k ⑂ 2.1k Apache-2.0 2026-03-17

ComfyUI 375 repos

すべて見る →

ComfyUI

GitHub

ComfyUI

ComfyUIは、画像、ビデオ、3Dモデル、オーディオなどのコンテンツをAIで生成するための強力かつモジュール式のエンジ…

#API #GPU対応 #Linux対応

★ 120.6k ⑂ 14.2k GPL-3.0 2026-07-13

ComfyUI

GitHub

Pixelle-Video

Pixelle-Videoは、入力されたテーマに基づいて、AIが短尺動画を全自動で生成するエンジンです。動画のスクリプト作成…

#AI動画生成 #ComfyUI対応 #GPU必須

★ 25.3k ⑂ 3.7k Apache-2.0 2026-06-14

ComfyUI

GitHub

StabilityMatrix

Stability Matrixは、Stable Diffusion向けのマルチプラットフォームパッケージマネージャーおよび推論UIです。AUTOM…

#ComfyUI対応 #Stable Diffusion #Web UI

★ 8.5k ⑂ 581 AGPL-3.0 2026-07-14

ComfyUI

GitHub

fast-stable-diffusion

TheLastBen/fast-stable-diffusionは、Google Colab上でStable Diffusion環境を迅速に構築・実行するためのノートブ…

#ComfyUI対応 #DreamBooth対応 #GPU必須

★ 7.9k ⑂ 1.4k MIT 2025-11-29

AIエージェント 389 repos

すべて見る →

AIエージェント

GitHub

langflow

Langflowは、AIエージェントやAIを活用したワークフローを構築・デプロイするための強力なプラットフォームです。視…

#API #CLI #Docker

★ 151.8k ⑂ 9.7k MIT 2026-07-13

AIエージェント

GitHub

Front-End-Checklist

Front-End Checklistは、人間とAIエージェント向けに設計されたオープンソースのフロントエンド品質システムです。フ…

#AIエージェント #CLI #Web UI

★ 73.3k ⑂ 6.7k 2026-06-18

AIエージェント

GitHub

learn-claude-code

本リポジトリ「Learn Claude Code」は、Claudeなどの大規模言語モデル（LLM）を活用したリアルなエージェント製品開…

#Bash #CLI #LLMエージェント

★ 70.9k ⑂ 11.5k MIT 2026-06-26

AIエージェント

GitHub

ruflo

Rufloは、Agenticなワークフローを構築・実行するためのツールです。Web UIを通じて、エージェントベースの目標計画…

#Claude Code #CLI #Python

★ 64.3k ⑂ 7.6k MIT 2026-07-13

LLM 627 repos

すべて見る →

LLM

GitHub

everything-claude-code

Everything Claude Codeは、Claude CodeやCodex、Cursor、OpenCode、Geminiなど複数のAIエージェント実行環境を強化…

#Claude Code対応 #CLI #Codex対応

★ 229.1k ⑂ 35.1k MIT 2026-07-13

LLM

GitHub

hermes-agent

Hermes Agentは、CLIと各種メッセージング基盤を横断して使える自己改善型AIエージェントです。会話履歴検索、永続メ…

#CLI #Linux対応 #macOS対応

★ 214.1k ⑂ 39.7k MIT 2026-07-13

LLM

GitHub

AutoGPT

AutoGPTは、継続実行型のAIエージェントを構築・配備・運用できるプラットフォームです。低コードのAgent Builderで…

#CLI #Docker #Node.js

★ 185.5k ⑂ 46.1k NOASSERTION 2026-07-13

LLM

GitHub

ollama

Ollamaは、GemmaやQwenなどのオープンモデルをローカル環境で手早く実行・管理できるツールです。macOS/Windows/Linu…

#CLI #Docker #JavaScript

★ 176.0k ⑂ 17.0k MIT 2026-07-10

マルチモーダル 296 repos

すべて見る →

マルチモーダル

GitHub

anything-llm

AnythingLLMは、ドキュメントとのチャットやAIエージェントの利用を可能にするオールインワンのAI生産性向上ツールで…

#AIエージェント #Docker #Linux

★ 63.2k ⑂ 6.9k MIT 2026-07-11

マルチモーダル

GitHub

UI-TARS-desktop

UI-TARS-desktopは、マルチモーダルAIエージェントスタックTARSの一部であり、UI-TARSモデルに基づくネイティブGUIエ…

#CLI #GUI Agent #Web UI

★ 38.0k ⑂ 3.8k Apache-2.0 2026-07-01

マルチモーダル

GitHub

LLaVA

LLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ…

#GPU必須 #Hugging Face対応 #llama.cpp互換

★ 24.9k ⑂ 2.8k Apache-2.0 2024-08-12

マルチモーダル

GitHub

unilm

このGitHubリポジトリ「microsoft/unilm」は、Microsoftが提供する、タスク、言語、モダリティ（テキスト、画像、音…

#AI/ML #Foundation Models #Multilingual

★ 22.2k ⑂ 2.7k MIT 2026-01-23

音声生成 / TTS 398 repos

すべて見る →

音声生成 / TTS

GitHub

unsloth

Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…

#CLI #GPU必須 #Python

★ 68.1k ⑂ 6.1k Apache-2.0 2026-07-13

音声生成 / TTS

GitHub

Real-Time-Voice-Cloning

このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TT…

#CLI #GPU対応 #GUI

★ 60.0k ⑂ 9.4k NOASSERTION 2026-03-09

音声生成 / TTS

GitHub

GPT-SoVITS

GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech（TTS）モデルをトレーニングできる強力なFew-s…

#Docker対応 #GPU必須 #Python

★ 59.7k ⑂ 6.5k MIT 2026-07-13

音声生成 / TTS

GitHub

TTS

Coqui.aiの🐸TTSは、深層学習を用いた先進的なテキスト音声合成（Text-to-Speech）ライブラリです。1100以上の言語に…

#CLI #Python #ディープラーニング

★ 45.8k ⑂ 6.2k MPL-2.0 2024-08-16

音楽生成 98 repos

すべて見る →

音楽生成

GitHub

Amphion

Amphionは、音声、音楽、スピーチ生成のためのオープンソースツールキットです。再現可能な研究を支援し、音声生成分…

#CLI #GPU必須 #HuggingFace

★ 9.9k ⑂ 822 MIT 2026-03-25

音楽生成

GitHub

introtodeeplearning

MIT 6.S191「Introduction to Deep Learning」の公式コードとソフトウェアラボ資料を提供するリポジトリです。本コー…

#Colab対応 #GPU推奨 #Jupyter Notebook

★ 8.7k ⑂ 4.6k MIT 2026-01-04

音楽生成

GitHub

YuE

YuEは、歌詞からボーカルと伴奏を含む数分間のフルソングを生成できる、オープンソースの音楽生成基盤モデルです。多…

#Google Colab #Hugging Face #Web UI (Gradio)

★ 6.3k ⑂ 747 Apache-2.0 2025-06-04

音楽生成

GitHub

ace-step-ui

ACE-Step UIは、オープンソースのAI音楽生成モデル「ACE-Step 1.5」のためのプロフェッショナルなユーザーインターフ…

#GPU必須 #Python #React

★ 4.3k ⑂ 662 2026-06-27

ASR / 音声認識 365 repos

すべて見る →

ASR / 音声認識

GitHub

whisper.cpp

whisper.cppは、OpenAIの高性能な音声認識モデルWhisperをC/C++で軽量に実装したライブラリです。依存関係を最小限に…

#C/C++ #CLI #CPU対応

★ 51.8k ⑂ 5.9k MIT 2026-07-11

ASR / 音声認識

GitHub

voicebox

Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。数秒の音声サンプルから…

#AI #API #GPU推奨

★ 41.0k ⑂ 4.9k MIT 2026-07-13

ASR / 音声認識

GitHub

Handy

Handyは、完全にオフラインで動作する無料のオープンソース音声認識デスクトップアプリケーションです。プライバシー…

#OSS #オフライン #デスクトップアプリ

★ 26.5k ⑂ 2.3k MIT 2026-07-13

ASR / 音声認識

GitHub

llamafile

llamafileは、大規模言語モデル（LLM）を単一の実行可能ファイルとして配布・実行できる革新的なツールです。llama.c…

#CLI #LLM #インストール不要

★ 25.4k ⑂ 1.6k NOASSERTION 2026-07-13

3D / NeRF 248 repos

すべて見る →

3D / NeRF

GitHub

instant-ngp

「NVlabs/instant-ngp」は、ニューラル放射輝度フィールド（NeRF）や符号付き距離関数（SDF）などを雷のように高速に…

#Linux #Python #VR

★ 17.5k ⑂ 2.1k NOASSERTION 2026-02-02

3D / NeRF

GitHub

engine

PlayCanvas Engineは、WebGL2とWebGPUをベースにしたオープンソースのゲームエンジンです。Webブラウザ上で動作する…

#JavaScript #TypeScript #Web XR

★ 16.2k ⑂ 1.9k MIT 2026-07-10

3D / NeRF

GitHub

Meshroom

Meshroomは、複雑なデータ処理パイプラインを作成、管理、実行するためのオープンソースのノードベースのビジュアル…

#3D Reconstruction #CLI連携 #Computer Vision

★ 12.8k ⑂ 1.2k NOASSERTION 2026-07-13

3D / NeRF

GitHub

nerfstudio

nerfstudioは、NeRF（Neural Radiance Fields）の作成、学習、テストを簡素化するAPIを提供する、コラボレーションし…

#CLI #GPU必須 #Python

★ 11.8k ⑂ 1.6k Apache-2.0 2025-07-29

その他 11 repos

すべて見る →

マルチモーダル

RMBG-1.4

BRIA Background Removal v1.4は、画像内の前景を高精度に切り出して背景を除去できる画像セグメンテーションモデル…

#背景除去 #非商用ライセンス

❤ 2.0k ↓ 305.6k other 2025-07-06

マルチモーダル

BiRefNet

BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…

#CLI #GPU必須 #Hugging Face対応

❤ 605 ↓ 829.6k mit 2026-02-04

マルチモーダル

segformer_b2_clothes

このツールは、Hugging Faceの`mattmdjaga/segformer_b2_clothes`リポジトリで提供されるSegFormer B2モデルであり、…

#CLI #GPU推奨

❤ 502 ↓ 167.4k other 2025-09-19

マルチモーダル

YOLOv8

Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…

#CLI #Docker対応 #GPU対応

❤ 376 ↓ 10.7k agpl-3.0 2026-06-26

📈今月の話題 直近1か月公開 / 人気順

✨新着 repo 公開日順

⚖️GitHub vs HuggingFace TOP 両方を一画面で比較

GitHub TOP 10

HuggingFace TOP 10

画像生成 447 repos

動画生成 335 repos

ComfyUI 375 repos

AIエージェント 389 repos

LLM 627 repos

マルチモーダル 296 repos

音声生成 / TTS 398 repos

音楽生成 98 repos

ASR / 音声認識 365 repos

3D / NeRF 248 repos

その他 11 repos

📈今月の話題直近1か月公開 / 人気順