3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

AIエージェント

GitHub

Upsonic

Upsonicは、Pythonで自律型AIエージェントや従来のAIエージェントを構築するためのフレームワークです。大規模言語モ…

#Agent #Autonomous Agent #CLI

★ 7.9k ⑂ 737 MIT 2026-06-18

音声生成 / TTS

GitHub

vits

VITSは、エンドツーエンドのテキスト読み上げ（Text-to-Speech, TTS）システムであり、条件付き変分オートエンコーダ…

#CLI #Colab対応 #GPU必須

★ 7.9k ⑂ 1.4k MIT 2023-12-06

画像生成

stable-diffusion-xl-base-1.0

このモデルはStability AIが開発した、テキストプロンプトから画像を生成・修正する拡散ベースの画像生成AI「Stable …

#diffusers対応 #GPU必須 #ONNX Runtime対応

❤ 7.9k ↓ 1.3M openrail++ 2023-10-30

画像生成

GitHub

Dreambooth-Stable-Diffusion

本リポジトリは、GoogleのDreamboothのアイデアをStable Diffusionに実装したものです。従来のTextual Inversionが単…

#CLI #GPU必須 #Hugging Face

★ 7.7k ⑂ 799 MIT 2022-12-08

ASR / 音声認識

GitHub

OmniVoice-Studio

OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。リアルタイムディクテーション、3秒の音声クリップ…

#Docker対応 #GPU対応 #Linux対応

★ 7.7k ⑂ 1.2k NOASSERTION 2026-06-28

LLM

GitHub

Horizon

Horizonは、AIを活用して個人のニュースレーダーを構築し、日報形式のブリーフィングを英語と中国語で提供するツール…

#AI #CLI #LLM対応

★ 7.6k ⑂ 1.1k MIT 2026-06-28

画像生成

GitHub

lora

このツールは、拡散モデル（特にStable Diffusion）を効率的にファインチューニングするためのLow-rank adaptation (…

#CLI #GPU必須 #LoRA

★ 7.5k ⑂ 493 Apache-2.0 2024-03-22

音声生成 / TTS

GitHub

MeloTTS

MeloTTSは、MITとMyShell.aiによって開発された、高品質な多言語テキスト読み上げライブラリです。英語（複数アクセ…

#CLI #CPU対応 #Python

★ 7.5k ⑂ 1.1k MIT 2024-12-24

画像生成

GitHub

mmagic

MMagic (OpenMMLab Multimodal Advanced, Generative, and Intelligent Creation Toolbox)は、テキストから画像生成…

#API提供 #CLI #GPU必須

★ 7.4k ⑂ 1.1k Apache-2.0 2024-08-06

ASR / 音声認識

GitHub

mlx-audio

MLX-Audioは、AppleのMLXフレームワークを基盤とし、Apple Silicon (Mシリーズチップ) に最適化された高速で効率的な…

#Apple Silicon対応 #CLI #OpenAI互換API

★ 7.4k ⑂ 650 MIT 2026-06-19

AIエージェント

GitHub

ShortGPT

ShortGPTは、YouTubeショートやTikTokチャンネルの自動化に特化したAIビデオ自動化フレームワークです。LLM指向の編…

#AI #Google Colab #Python

★ 7.4k ⑂ 1.0k MIT 2025-02-10

LLM

GitHub

InternLM

InternLMは、汎用的な利用と高度な推論のために設計された大規模言語モデル（LLM）シリーズです。最新のInternLM3-8B…

#API #HuggingFace対応 #Python

★ 7.2k ⑂ 507 Apache-2.0 2025-10-30

LLM

GitHub

opencompass

OpenCompassは、大規模言語モデル（LLM）の評価を効率的かつ正確に行うための包括的なプラットフォームです。強力な…

#CLI #LLM #Python

★ 7.1k ⑂ 793 Apache-2.0 2026-06-24

AIエージェント

GitHub

text-to-cad

このツールは、コーディングエージェント（Codex、Claude Codeなど）を使用して3Dモデルを生成するためのオープンソ…

#3Dモデル #CAD #CLI

★ 7.0k ⑂ 833 MIT 2026-06-27

AIエージェント

GitHub

Bindu

Binduは、AIエージェントのためのアイデンティティ、通信、決済レイヤーを提供するプラットフォームです。エージェン…

#AIエージェント #CLI #gRPC

★ 7.0k ⑂ 408 NOASSERTION 2026-06-22

ASR / 音声認識

GitHub

wav2letter

wav2letter++は、Facebook AI Researchが開発した自動音声認識（ASR）ツールキットです。現在はFlashlightフレームワ…

#ASR #C++ #CLI

★ 6.4k ⑂ 992 NOASSERTION 2026-01-12

音声生成 / TTS

Kokoro-82M

Kokoroは、わずか8200万パラメータの軽量ながら、大規模なモデルに匹敵する高品質な音声合成（TTS）を提供するオープ…

#Apache License #CLI #Python

❤ 6.4k ↓ 15.8M apache-2.0 2025-04-10

画像生成

GitHub

StyleTTS2

StyleTTS 2は、テキストから人間レベルの自然な音声を合成する最新のText-to-Speech（TTS）モデルです。スタイル拡散…

#CLI #Colab #GPU必須

★ 6.3k ⑂ 690 MIT 2024-08-10

ASR / 音声認識

GitHub

PaddleX

PaddleX 3.0は、飛桨（PaddlePaddle）フレームワークを基盤とした低コード開発ツールです。200以上の開箱即用な事前…

#CLI #GPU対応 #Linux

★ 6.2k ⑂ 1.2k Apache-2.0 2026-06-25

LLM

GitHub

atomic-agents

Atomic Agentsは、AIパイプラインとアプリケーションを構築するための軽量でモジュール式のフレームワークです。LEGO…

#AIエージェント開発 #CLI #PyPI

★ 6.0k ⑂ 514 MIT 2026-06-20

ASR / 音声認識

GitHub

silero-models

Silero Modelsは、事前学習済みのテキスト読み上げ（TTS）モデルを開発者向けに提供するライブラリです。このツール…

#CPU対応 #GPU対応 #Python

★ 6.0k ⑂ 366 NOASSERTION 2026-06-04

ASR / 音声認識

whisper-large-v3

Whisper large-v3は、OpenAIが開発した最先端の自動音声認識（ASR）および音声翻訳モデルです。500万時間以上の学習…

#CLI #GPU必須 #Hugging Face Transformers対応

❤ 5.9k ↓ 5.7M apache-2.0 2024-08-12

ASR / 音声認識

GitHub

FunClip

FunClipは、オープンソースで高精度かつ使いやすい動画クリッピングツールです。Alibaba TONGYIのFunASR Paraformer…

#CLI #LLMベース #Python

★ 5.9k ⑂ 705 MIT 2026-06-25

画像生成

GitHub

LatentSync

LatentSyncは、音声入力に基づいて動画のリップシンクを生成する、エンドツーエンドの革新的な手法です。既存のピク…

#Diffusion Model #GPU必須 #Hugging Face対応

★ 5.8k ⑂ 952 Apache-2.0 2025-06-20