3,680 repos GH 3,565 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Gradio (14 repos)

「Gradio」タグが付いたリポジトリ

← 全リポジトリ

画像生成

GitHub

PromptEnhancer

PromptEnhancerは、Text-to-Image生成およびImage-to-Image編集の両方に対応するプロンプト書き換えツールです。ユー…

#GGUF #Gradio #Image-to-Image

★ 3.7k ⑂ 324 NOASSERTION 2026-06-10

音声生成 / TTS

GitHub

TTS-WebUI

TTS WebUIは、GradioとReactを基盤とする統合型Webユーザーインターフェースで、様々なテキスト読み上げ（TTS）、音…

#Docker対応 #GPU必須 #Gradio

★ 3.2k ⑂ 323 MIT 2026-05-14

画像生成

GitHub

Helios

Heliosは、リアルタイムでの長尺ビデオ生成を可能にする革新的なモデルです。従来のアンチドリフト戦略やアクセラレ…

#Ascend-NPU対応 #GPU必須 #Gradio

★ 1.9k ⑂ 149 Apache-2.0 2026-06-10

音楽生成

GitHub

audio-diffusion

このツールは、Hugging Faceのdiffusersパッケージを使い、画像ではなく音楽を生成する拡散モデルを適用します。オー…

#Google Colab対応 #Gradio #Hugging Face Diffusers

★ 791 ⑂ 78 GPL-3.0 2024-09-25

マルチモーダル

MOSS-Audio-4B-Instruct

MOSS-Audio-4B-Instructは、音声・環境音・音楽を統合的に理解し、テキストで応答するオープンソースの音声理解モデ…

#CLI #GPU推奨 #Gradio

❤ 72 ↓ 4.1k apache-2.0 2026-04-14

マルチモーダル

MOSS-Audio-8B-Instruct

MOSS-Audio-8B-Instructは、音声・環境音・音楽をまとめて理解できるオープンソースの音声理解モデルです。音声認識…

#CLI #Gradio #SGLang

❤ 43 ↓ 1.9k apache-2.0 2026-06-11

マルチモーダル

MOSS-Audio-4B-Thinking

MOSS-Audio-4B-Thinkingは、音声・環境音・音楽をまとめて理解し、文字起こし、話者や感情の分析、音の状況把握、要…

#CLI #GPU推奨 #Gradio

❤ 31 ↓ 756 apache-2.0 2026-04-14

マルチモーダル

GitHub

Qwen3-VL-Video-Grounding

Qwen3-VL-Video-Groundingは、Qwen3-VL多モーダル画像言語モデルを活用したGradioベースのWebアプリケーションです。…

#AIモデル使用 #GPU利用 #Gradio

★ 15 ⑂ 3 Apache-2.0 2026-02-28

LLM

GitHub

SWE-Model-Arena

SWE-Model-Arenaは、ソフトウェアエンジニアリングタスク向けのツール呼び出しモデルをペアで比較評価するためのオー…

#Gradio #Hugging Face Spaces #Python

★ 10 ⑂ 1 2026-04-04

画像生成

GitHub

sd-auto-negative

Auto Negative Promptは、Stable Diffusion WebUI reForgeおよびStable Diffusion Forge NEO向けの拡張機能です。こ…

#Gradio #JSONルール #Stable Diffusion Forge NEO

★ 3 MIT 2026-06-14

動画生成

GitHub

bernini-studio-ui

Bernini Studio UIは、ByteDanceの強力な画像・動画生成AIモデル「Bernini」の推論を、より操作しやすくするために開…

#CLI #GPU必須 #Gradio

★ 3 Apache-2.0 2026-06-14

ASR / 音声認識

GitHub

speech-emotion-recognition-transfer-learning

このプロジェクトは、音声感情認識（SER）におけるテキストのみ（RoBERTa）、音声のみ（wav2vec2/WavLM/HuBERT）、お…

#Gradio #HuggingFace #Python

★ 2 MIT 2026-06-16

ASR / 音声認識

GitHub

IndiVoice-DeepASR

IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA（Low-Rank Adaptation）技術でファインチューニングすることによ…

#GPU必須 #Gradio #LoRA / PEFT

★ 2 MIT 2026-06-22

ASR / 音声認識

GitHub

Elderly-Care-Companion

Elderly Care Companionは、AIを活用した高齢者向けのヘルスアシスタントです。主な機能として、音声による症状記録…

#AI #Gradio #Python

★ 1 2026-06-09