3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

画像生成
HF
stable-diffusion-xl-base-1.0
このモデルはStability AIが開発した、テキストプロンプトから画像を生成・修正する拡散ベースの画像生成AI「Stable …
❤ 7.9k ↓ 1.3M openrail++ 2023-10-30
音声生成 / TTS
HF
Kokoro-82M
Kokoroは、わずか8200万パラメータの軽量ながら、大規模なモデルに匹敵する高品質な音声合成(TTS)を提供するオープ…
❤ 6.4k ↓ 15.8M apache-2.0 2025-04-10
ASR / 音声認識
HF
whisper-large-v3
Whisper large-v3は、OpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルです。500万時間以上の学習…
❤ 5.9k ↓ 5.7M apache-2.0 2024-08-12
画像生成
HF
Z-Image-Turbo
Z-Imageは、60億パラメータを持つ高効率な画像生成モデルファミリーです。特にZ-Image-Turboは、わずか8NFEsでサブ秒…
❤ 4.9k ↓ 891.8k apache-2.0 2026-01-30
音声生成 / TTS
HF
XTTS-v2
XTTS-v2は、Coquiが開発した高度な音声生成モデルです。わずか6秒の短い音声クリップを用いることで、既存の声を17種…
❤ 3.6k ↓ 9.4M other 2023-12-11
LLM
HF
gpt2
GPT-2は、大規模な英語コーパスで事前学習されたTransformerベースの言語モデルです。文章の次の単語を予測するよう…
❤ 3.3k ↓ 13.0M mit 2024-02-19
ASR / 音声認識
HF
whisper-large-v3-turbo
Whisper large-v3-turboは、OpenAIが提案する最先端の自動音声認識(ASR)および音声翻訳モデルであるWhisper large-…
❤ 3.1k ↓ 7.4M mit 2024-10-04
画像生成
HF
sdxl-turbo
SDXL-Turboは、Stability AIが開発した高速な生成テキストから画像へのモデルです。リアルタイム合成に特化しており…
❤ 2.6k ↓ 632.4k other 2024-07-10
画像生成
HF
stable-diffusion-xl-refiner-1.0
Stability AIが開発した「SD-XL 1.0-refiner」は、テキストプロンプトから画像を生成・変更できる拡散ベースの画像生…
❤ 2.0k ↓ 167.9k openrail++ 2023-09-25
音声生成 / TTS
HF
chatterbox
Chatterboxは、Resemble AIが開発したオープンソースの高品質なテキスト読み上げ(TTS)モデルです。23言語に対応し…
❤ 1.7k ↓ 2.2M mit 2026-06-10
音声生成 / TTS
HF
Qwen3-TTS-12Hz-1.7B-CustomVoice
Qwen3-TTSは、テキストを音声に変換する先進的なモデルで、中国語、英語、日本語を含む10の主要言語と複数の方言プロ…
❤ 1.6k ↓ 2.0M apache-2.0 2026-01-29
マルチモーダル
HF
Kimi-K2.6
Kimi K2.6は、Moonshot AIが公開するネイティブマルチモーダル対応のオープンソース大規模モデルです。長い手順を要…
❤ 1.5k ↓ 2.4M other 2026-05-19
LLM
HF
DeepSeek-V3.2
DeepSeek-V3.2は、高い計算効率と優れた推論能力、エージェント性能を両立させた大規模言語モデルです。DeepSeek Spa…
❤ 1.5k ↓ 2.7M mit 2025-12-01
LLM
HF
Qwen2.5-7B-Instruct
Qwen2.5-7B-Instructは、Qwen大規模言語モデルの最新シリーズであり、特に命令チューニングされた7Bモデルです。コー…
❤ 1.4k ↓ 12.7M apache-2.0 2025-01-12
LLM
HF
Qwen3-0.6B
Qwen3は、推論、指示追従、エージェント機能、多言語サポートに優れた次世代の大規模言語モデルです。複雑な論理的推…
❤ 1.4k ↓ 27.7M apache-2.0 2025-07-26
マルチモーダル
HF
gemma-4-26B-A4B-it
Gemma 4 26B A4B itは、Google DeepMindのオープンウェイトなマルチモーダル指示調整モデルです。テキストと画像を入…
❤ 1.2k ↓ 13.1M apache-2.0 2026-06-03
画像生成
HF
stable-diffusion-v1-5
Stable Diffusion v1-5は、テキスト入力に基づいて写実的な画像を生成できる強力な潜在テキスト-画像拡散モデルです…
❤ 1.2k ↓ 1.8M creativeml-openrail-m 2024-09-07
音声生成 / TTS
HF
OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 1.1k ↓ 1.0M apache-2.0 2026-05-07
画像生成
HF
Qwen-Image-Edit-2511
Qwen-Image-Edit-2511は、Qwen-Image-Edit-2509を強化した画像編集モデルです。画像ドリフトの軽減、キャラクターの…
❤ 1.1k ↓ 176.3k apache-2.0 2025-12-23
画像生成
HF
FLUX.2-klein-4B
FLUX.2 [klein] 4Bは、Black Forest Labsが開発した高速画像生成モデルです。テキストからの画像生成と画像編集機能…
❤ 760 ↓ 503.6k apache-2.0 2026-02-24
LLM
HF
Qwen2.5-1.5B-Instruct
Qwen2.5-1.5B-Instructは、Qwen大規模言語モデルシリーズの最新版であるQwen2.5の、1.5Bパラメータを持つ命令チュー…
❤ 749 ↓ 11.7M apache-2.0 2024-09-25
動画生成
HF
text-to-video-ms-1.7b
本モデルは、テキストの記述に基づいて動画を生成するマルチステージのテキストから動画生成拡散モデルです。約17億…
❤ 666 ↓ 108.4k cc-by-nc-4.0 2023-12-01
マルチモーダル
HF
Qwen2-Audio-7B-Instruct
Qwen2-Audio-7B-Instructは、音声入力を受けて会話や解析を行えるQwen系の音声対応大規模言語モデルです。テキストな…
❤ 540 ↓ 673.6k apache-2.0 2025-01-12
ASR / 音声認識
HF
whisperkit-coreml
WhisperKitは、Apple Siliconデバイス向けに設計されたオンデバイス音声AI SDK「Argmax OSS」の一部として提供される…
❤ 193 ↓ 8.4M 2026-04-24