1,837 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
AIエージェント 🔥 今月の話題 #1 GitHub
awesome-gpt-image-2
「freestylefly/awesome-gpt-image-2」は、AI画像生成のための「Prompt as Code」を提唱する産業級プロンプトエンジンとテンプレートライブラリです。GPT-Image2によるAI…
★ 6.1k ⑂ 819 MIT AIエージェント
LLM ✨ 最新追加 GitHub
compete-scope-agent
CompeteScope Agentは、製品名を入力するだけで、企業グレードの競合分析レポートを10分で自動生成するツールです。5つのAgent(Planner、Research、Analysis、Writer、Re…
★ 1 MIT LLM

📈今月の話題 直近1か月公開 / 人気順

すべて見る →
LLM
GitHub
how-to-train-your-gpt
このリポジトリは、現代の大規模言語モデル(LLM)をゼロから構築、訓練、実行する方法を学ぶための12章構成のインタ…
★ 1.8k ⑂ 231 MIT 2026-05-21
LLM
GitHub
opensquilla
OpenSquillaは、トークン効率を最大化するマイクロカーネルAIエージェントです。限られた予算で高い知能密度と優れた…
★ 1.6k ⑂ 115 Apache-2.0 2026-05-23
LLM
GitHub
openless
OpenLessは、macOSおよびWindows向けのオープンソース音声入力アプリケーションです。ホットキーを押して話すだけで…
★ 1.6k ⑂ 129 MIT 2026-05-23
動画生成
HF
Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 1.3k ↓ 1.3M 2026-05-22

新着 repo 公開日順

すべて見る →
AIエージェント
GitHub
heya.skill
本ツールは、Bilibiliの動画投稿者「黒鴉」(Heya)の動画タイトルスタイル(長文、感情を煽る表現、複数の出来事を…
★ 6 MIT 2026-05-24
ASR / 音声認識
GitHub
rust-whisper-diarization
rust-whisper-diarizationは、純粋なRustで実装されたストリーミング音声認識と話者分離のライブラリです。whisper.c…
★ 1 2026-05-23
AIエージェント
GitHub
llm-harness
llm-harnessは、プロダクションレベルのAIエージェント開発のための再利用可能なインフラ基盤です。ReActループ、ツ…
★ 1 MIT 2026-05-24
ASR / 音声認識
GitHub
EasyScript
EasyScriptはWhisper AIを搭載したデスクトップアプリケーションで、音声・動画ファイルの文字起こしと翻訳、リアル…
★ 1 2026-05-23

⚖️GitHub vs HuggingFace TOP 両方を一画面で比較

GitHub TOP 10

★ 順
#1 GH everything-claude-code ★ 189.2k Everything Claude Codeは、Claude CodeやCodex、Cursor、OpenCode、Geminiなど複数のAIエージ… #2 GH AutoGPT ★ 184.5k AutoGPTは、継続実行型のAIエージェントを構築・配備・運用できるプラットフォームです。低コー… #3 GH ollama ★ 172.1k Ollamaは、GemmaやQwenなどのオープンモデルをローカル環境で手早く実行・管理できるツールです… #4 GH hermes-agent ★ 164.5k Hermes Agentは、CLIと各種メッセージング基盤を横断して使える自己改善型AIエージェントです。… #5 GH stable-diffusion-webui ★ 163.2k Stable Diffusion web UIは、Gradioライブラリで実装された、画像生成AI「Stable Diffusion」の… #6 GH prompts.chat ★ 162.7k prompts.chatは、ChatGPTをはじめClaude、Gemini、Llama、Mistralなど複数のAIチャットモデルで… #7 GH transformers ★ 160.9k Transformersは、Hugging Faceが提供する機械学習モデル定義フレームワークで、テキスト・画像… #8 GH langflow ★ 148.7k Langflowは、AIエージェントやAIを活用したワークフローを構築・デプロイするための強力なプラ… #9 GH dify ★ 142.4k Difyは、LLMアプリやエージェント型ワークフローを開発・運用するためのオープンソース基盤です… #10 GH open-webui ★ 138.4k Open WebUIは、OllamaやOpenAI互換APIをまとめて扱える、自己ホスト型のAIチャット/運用プラッ…

HuggingFace TOP 10

❤ 順
#1 HF stable-diffusion-xl-base-1.0 ❤ 7.7k このモデルはStability AIが開発した、テキストプロンプトから画像を生成・修正する拡散ベース… #2 HF Kokoro-82M ❤ 6.2k Kokoroは、わずか8200万パラメータの軽量ながら、大規模なモデルに匹敵する高品質な音声合成(T… #3 HF whisper-large-v3 ❤ 5.7k Whisper large-v3は、OpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルです。… #4 HF Z-Image-Turbo ❤ 4.7k Z-Imageは、60億パラメータを持つ高効率な画像生成モデルファミリーです。特にZ-Image-Turboは… #5 HF XTTS-v2 ❤ 3.6k XTTS-v2は、Coquiが開発した高度な音声生成モデルです。わずか6秒の短い音声クリップを用いるこ… #6 HF gpt2 ❤ 3.3k GPT-2は、大規模な英語コーパスで事前学習されたTransformerベースの言語モデルです。文章の次… #7 HF whisper-large-v3-turbo ❤ 3.0k Whisper large-v3-turboは、OpenAIが提案する最先端の自動音声認識(ASR)および音声翻訳モデル… #8 HF gemma-4-31B-it ❤ 2.7k Gemma 4 31B itは、Google DeepMindのオープンウェイトな命令調整済みマルチモーダルモデルです… #9 HF sdxl-turbo ❤ 2.6k SDXL-Turboは、Stability AIが開発した高速な生成テキストから画像へのモデルです。リアルタイ… #10 HF HunyuanVideo ❤ 2.2k HunyuanVideoは、Tencentが公開した大規模な動画生成基盤モデルの実装リポジトリです。PyTorch…

画像生成 209 repos

すべて見る →
画像生成
GitHub
stable-diffusion-webui
Stable Diffusion web UIは、Gradioライブラリで実装された、画像生成AI「Stable Diffusion」の多機能なWebインター…
★ 163.2k ⑂ 30.4k AGPL-3.0 2026-03-02
画像生成
GitHub
LocalAI
LocalAIは、大規模言語モデル(LLMs)、視覚、音声、画像、ビデオなど、様々なAIモデルをどんなハードウェア環境でも…
★ 46.4k ⑂ 4.1k MIT 2026-05-23
画像生成
GitHub
khoj
Khojは、個人の能力を拡張するAIセカンドブレインアプリです。ローカルまたはオンラインのLLM(llama3, GPT, Gemini…
★ 34.7k ⑂ 2.2k AGPL-3.0 2026-03-26
画像生成
GitHub
diffusers
🤗 Diffusersは、画像、音声、分子の3D構造生成のための最先端の拡散モデルを提供するPythonライブラリです。シンプ…
★ 33.7k ⑂ 7.0k Apache-2.0 2026-05-23

動画生成 178 repos

すべて見る →
動画生成
GitHub
LivePortrait
LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…
★ 18.4k ⑂ 1.9k NOASSERTION 2026-03-02
動画生成
GitHub
Open-Generative-AI
Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…
★ 16.7k ⑂ 2.8k 2026-05-23
動画生成
GitHub
Wan2.2
Wan2.2は、オープンで先進的な大規模ビデオ生成モデルWanの主要なアップグレード版です。専門家混合(MoE)アーキテ…
★ 15.9k ⑂ 2.0k Apache-2.0 2026-03-17
動画生成
GitHub
Duix-Avatar
Duix.Avatarは、Duix.comによって開発された、完全にオープンソースのAIアバターツールキットです。本ツールは、ユー…
★ 13.1k ⑂ 2.2k NOASSERTION 2026-04-21

ComfyUI 261 repos

すべて見る →
ComfyUI
GitHub
ComfyUI
ComfyUIは、画像、ビデオ、3Dモデル、オーディオなどのコンテンツをAIで生成するための強力かつモジュール式のエンジ…
★ 114.2k ⑂ 13.4k GPL-3.0 2026-05-24
ComfyUI
GitHub
Pixelle-Video
Pixelle-Videoは、入力されたテーマに基づいて、AIが短尺動画を全自動で生成するエンジンです。動画のスクリプト作成…
★ 19.4k ⑂ 2.8k Apache-2.0 2026-05-18
ComfyUI
GitHub
StabilityMatrix
Stability Matrixは、Stable Diffusion向けのマルチプラットフォームパッケージマネージャーおよび推論UIです。AUTOM…
★ 8.2k ⑂ 560 AGPL-3.0 2026-05-17
ComfyUI
GitHub
fast-stable-diffusion
TheLastBen/fast-stable-diffusionは、Google Colab上でStable Diffusion環境を迅速に構築・実行するためのノートブ…
★ 7.9k ⑂ 1.4k MIT 2025-11-29

AIエージェント 190 repos

すべて見る →
AIエージェント
GitHub
langflow
Langflowは、AIエージェントやAIを活用したワークフローを構築・デプロイするための強力なプラットフォームです。視…
★ 148.7k ⑂ 9.1k MIT 2026-05-24
AIエージェント
GitHub
learn-claude-code
本リポジトリ「Learn Claude Code」は、Claudeなどの大規模言語モデル(LLM)を活用したリアルなエージェント製品開…
★ 62.2k ⑂ 10.2k MIT 2026-05-22
AIエージェント
GitHub
autogen
AutoGenは、自律的に動作したり人間と共同作業したりするマルチエージェントAIアプリケーションを構築するためのフレ…
★ 58.3k ⑂ 8.8k CC-BY-4.0 2026-04-15
AIエージェント
GitHub
mem0
Mem0は、AIエージェントにパーソナライズされたインタラクションを可能にするためのインテリジェントな記憶層を提供…
★ 56.6k ⑂ 6.5k Apache-2.0 2026-05-24

LLM 303 repos

すべて見る →
LLM
GitHub
everything-claude-code
Everything Claude Codeは、Claude CodeやCodex、Cursor、OpenCode、Geminiなど複数のAIエージェント実行環境を強化…
★ 189.2k ⑂ 29.3k MIT 2026-05-20
LLM
GitHub
AutoGPT
AutoGPTは、継続実行型のAIエージェントを構築・配備・運用できるプラットフォームです。低コードのAgent Builderで…
★ 184.5k ⑂ 46.2k NOASSERTION 2026-05-24
LLM
GitHub
ollama
Ollamaは、GemmaやQwenなどのオープンモデルをローカル環境で手早く実行・管理できるツールです。macOS/Windows/Linu…
★ 172.1k ⑂ 16.3k MIT 2026-05-22
LLM
GitHub
hermes-agent
Hermes Agentは、CLIと各種メッセージング基盤を横断して使える自己改善型AIエージェントです。会話履歴検索、永続メ…
★ 164.5k ⑂ 27.0k MIT 2026-05-24

マルチモーダル 165 repos

すべて見る →
マルチモーダル
GitHub
anything-llm
AnythingLLMは、ドキュメントとのチャットやAIエージェントの利用を可能にするオールインワンのAI生産性向上ツールで…
★ 60.5k ⑂ 6.6k MIT 2026-05-24
マルチモーダル
GitHub
UI-TARS-desktop
UI-TARS-desktopは、マルチモーダルAIエージェントスタックTARSの一部であり、UI-TARSモデルに基づくネイティブGUIエ…
★ 35.1k ⑂ 3.5k Apache-2.0 2026-05-18
マルチモーダル
GitHub
LLaVA
LLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ…
★ 24.8k ⑂ 2.8k Apache-2.0 2024-08-12
マルチモーダル
GitHub
unilm
このGitHubリポジトリ「microsoft/unilm」は、Microsoftが提供する、タスク、言語、モダリティ(テキスト、画像、音…
★ 22.1k ⑂ 2.7k MIT 2026-01-23

音声生成 / TTS 176 repos

すべて見る →
音声生成 / TTS
GitHub
unsloth
Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…
★ 65.0k ⑂ 5.8k Apache-2.0 2026-05-23
音声生成 / TTS
GitHub
Real-Time-Voice-Cloning
このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TT…
★ 59.8k ⑂ 9.4k NOASSERTION 2026-03-09
音声生成 / TTS
GitHub
GPT-SoVITS
GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-s…
★ 57.7k ⑂ 6.3k MIT 2026-04-30
音声生成 / TTS
GitHub
TTS
Coqui.aiの🐸TTSは、深層学習を用いた先進的なテキスト音声合成(Text-to-Speech)ライブラリです。1100以上の言語に…
★ 45.4k ⑂ 6.1k MPL-2.0 2024-08-16

音楽生成 53 repos

すべて見る →
音楽生成
GitHub
Amphion
Amphionは、音声、音楽、スピーチ生成のためのオープンソースツールキットです。再現可能な研究を支援し、音声生成分…
★ 9.8k ⑂ 812 MIT 2026-03-25
音楽生成
GitHub
introtodeeplearning
MIT 6.S191「Introduction to Deep Learning」の公式コードとソフトウェアラボ資料を提供するリポジトリです。本コー…
★ 8.7k ⑂ 4.5k MIT 2026-01-04
音楽生成
GitHub
YuE
YuEは、歌詞からボーカルと伴奏を含む数分間のフルソングを生成できる、オープンソースの音楽生成基盤モデルです。多…
★ 6.2k ⑂ 741 Apache-2.0 2025-06-04
音楽生成
GitHub
ace-step-ui
ACE-Step UIは、オープンソースのAI音楽生成モデル「ACE-Step 1.5」のためのプロフェッショナルなユーザーインターフ…
★ 3.9k ⑂ 581 2026-03-02

ASR / 音声認識 164 repos

すべて見る →
ASR / 音声認識
GitHub
whisper.cpp
whisper.cppは、OpenAIの高性能な音声認識モデルWhisperをC/C++で軽量に実装したライブラリです。依存関係を最小限に…
★ 50.0k ⑂ 5.6k MIT 2026-05-22
ASR / 音声認識
GitHub
voicebox
Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。数秒の音声サンプルから…
★ 27.9k ⑂ 3.4k MIT 2026-04-26
ASR / 音声認識
GitHub
llamafile
llamafileは、大規模言語モデル(LLM)を単一の実行可能ファイルとして配布・実行できる革新的なツールです。llama.c…
★ 24.5k ⑂ 1.4k NOASSERTION 2026-05-22
ASR / 音声認識
GitHub
faster-whisper
「SYSTRAN/faster-whisper」は、OpenAIのWhisperモデルをCTranslate2で再実装した高速音声転写ツールです。オリジナ…
★ 23.1k ⑂ 1.9k MIT 2025-11-19

3D / NeRF 124 repos

すべて見る →
3D / NeRF
GitHub
instant-ngp
「NVlabs/instant-ngp」は、ニューラル放射輝度フィールド(NeRF)や符号付き距離関数(SDF)などを雷のように高速に…
★ 17.4k ⑂ 2.1k NOASSERTION 2026-02-02
3D / NeRF
GitHub
engine
PlayCanvas Engineは、WebGL2とWebGPUをベースにしたオープンソースのゲームエンジンです。Webブラウザ上で動作する…
★ 15.9k ⑂ 1.9k MIT 2026-05-23
3D / NeRF
GitHub
Meshroom
Meshroomは、複雑なデータ処理パイプラインを作成、管理、実行するためのオープンソースのノードベースのビジュアル…
★ 12.8k ⑂ 1.2k NOASSERTION 2026-05-22
3D / NeRF
GitHub
nerfstudio
nerfstudioは、NeRF(Neural Radiance Fields)の作成、学習、テストを簡素化するAPIを提供する、コラボレーションし…
★ 11.6k ⑂ 1.6k Apache-2.0 2025-07-29

その他 9 repos

すべて見る →
マルチモーダル
HF
RMBG-1.4
BRIA Background Removal v1.4は、画像内の前景を高精度に切り出して背景を除去できる画像セグメンテーションモデル…
❤ 2.0k ↓ 491.0k other 2025-07-06
マルチモーダル
HF
BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 585 ↓ 983.3k mit 2026-02-04
マルチモーダル
HF
segformer_b2_clothes
SegFormer B2をATRベースの人間パースデータセットで衣服セグメンテーション向けに微調整したモデルです。人物画像か…
❤ 500 ↓ 311.6k other 2025-09-19
マルチモーダル
HF
YOLOv8
Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…
❤ 349 ↓ 6.2k agpl-3.0 2025-01-11