3,680 repos GH 3,565 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Gradio (14 repos)

「Gradio」タグが付いたリポジトリ

← 全リポジトリ

画像生成
GitHub
PromptEnhancer
PromptEnhancerは、Text-to-Image生成およびImage-to-Image編集の両方に対応するプロンプト書き換えツールです。ユー…
★ 3.7k ⑂ 324 NOASSERTION 2026-06-10
音声生成 / TTS
GitHub
TTS-WebUI
TTS WebUIは、GradioとReactを基盤とする統合型Webユーザーインターフェースで、様々なテキスト読み上げ(TTS)、音…
★ 3.2k ⑂ 323 MIT 2026-05-14
画像生成
GitHub
Helios
Heliosは、リアルタイムでの長尺ビデオ生成を可能にする革新的なモデルです。従来のアンチドリフト戦略やアクセラレ…
★ 1.9k ⑂ 149 Apache-2.0 2026-06-10
音楽生成
GitHub
audio-diffusion
このツールは、Hugging Faceのdiffusersパッケージを使い、画像ではなく音楽を生成する拡散モデルを適用します。オー…
★ 791 ⑂ 78 GPL-3.0 2024-09-25
マルチモーダル
HF
MOSS-Audio-4B-Instruct
MOSS-Audio-4B-Instructは、音声・環境音・音楽を統合的に理解し、テキストで応答するオープンソースの音声理解モデ…
❤ 72 ↓ 4.1k apache-2.0 2026-04-14
マルチモーダル
HF
MOSS-Audio-8B-Instruct
MOSS-Audio-8B-Instructは、音声・環境音・音楽をまとめて理解できるオープンソースの音声理解モデルです。音声認識…
❤ 43 ↓ 1.9k apache-2.0 2026-06-11
マルチモーダル
HF
MOSS-Audio-4B-Thinking
MOSS-Audio-4B-Thinkingは、音声・環境音・音楽をまとめて理解し、文字起こし、話者や感情の分析、音の状況把握、要…
❤ 31 ↓ 756 apache-2.0 2026-04-14
マルチモーダル
GitHub
Qwen3-VL-Video-Grounding
Qwen3-VL-Video-Groundingは、Qwen3-VL多モーダル画像言語モデルを活用したGradioベースのWebアプリケーションです。…
★ 15 ⑂ 3 Apache-2.0 2026-02-28
LLM
GitHub
SWE-Model-Arena
SWE-Model-Arenaは、ソフトウェアエンジニアリングタスク向けのツール呼び出しモデルをペアで比較評価するためのオー…
★ 10 ⑂ 1 2026-04-04
動画生成
GitHub
bernini-studio-ui
Bernini Studio UIは、ByteDanceの強力な画像・動画生成AIモデル「Bernini」の推論を、より操作しやすくするために開…
★ 3 Apache-2.0 2026-06-14
ASR / 音声認識
GitHub
speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-16
ASR / 音声認識
GitHub
IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 2 MIT 2026-06-22
ASR / 音声認識
GitHub
Elderly-Care-Companion
Elderly Care Companionは、AIを活用した高齢者向けのヘルスアシスタントです。主な機能として、音声による症状記録…
★ 1 2026-06-09