3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

LLM
GitHub
turbovec
turbovecは、Google ResearchのTurboQuantアルゴリズムに基づきRustで開発された、Pythonバインディングを持つ高速か…
★ 12.4k ⑂ 1.1k MIT 2026-06-10
画像生成
GitHub
HunyuanVideo
HunyuanVideoは、Tencentが開発した大規模動画生成モデルのための体系的なフレームワークです。テキストからの動画生…
★ 12.3k ⑂ 1.3k NOASSERTION 2026-06-29
ASR / 音声認識
GitHub
speechbrain
SpeechBrainは、PyTorchを基盤としたオープンソースのツールキットで、会話型AI(音声アシスタント、チャットボット…
★ 11.6k ⑂ 1.7k Apache-2.0 2026-06-15
マルチモーダル
GitHub
rerun
Rerunは、マルチモーダルなロボットデータ(画像、点群、変換、時系列、関節状態、ビデオなど)のロギング、クエリ、…
★ 11.0k ⑂ 774 Apache-2.0 2026-06-24
AIエージェント
GitHub
hive
Hiveは、プロダクションAI向けのマルチエージェントハーネスで、複雑なビジネスワークフローを効率的に実行するため…
★ 10.6k ⑂ 5.6k Apache-2.0 2026-05-29
動画生成
GitHub
ViMax
ViMaxは、単一のコンセプト入力から脚本、絵コンテ、キャラクターデザイン、そして最終的な動画生成まで、動画制作プ…
★ 10.6k ⑂ 1.5k MIT 2026-06-13
画像生成
GitHub
openvino
OpenVINO™は、ディープラーニングモデルの最適化とデプロイメントを目的としたオープンソースのソフトウェアツールキ…
★ 10.4k ⑂ 3.3k Apache-2.0 2026-06-23
音声生成 / TTS
GitHub
KrillinAI
KrillinAIは、AIを活用したビデオの翻訳・吹き替えを可能にする多機能ツールです。ビデオのダウンロード、音声認識、…
★ 10.4k ⑂ 973 GPL-3.0 2026-06-25
ASR / 音声認識
GitHub
RealtimeSTT
RealtimeSTTは、音声アクティビティ検出、高速な文字起こし、リアルタイムテキスト更新、ウェイクワード機能を備えた…
★ 9.9k ⑂ 843 MIT 2026-06-12
マルチモーダル
GitHub
pyod
PyOD 3は、表形式、時系列、グラフ、テキスト、画像といった多様なデータ形式に対応した、包括的なPython異常検知ラ…
★ 9.9k ⑂ 1.5k BSD-2-Clause 2026-06-17
ASR / 音声認識
GitHub
espnet
ESPnetは、音声認識、音声合成、音声翻訳など、様々なエンドツーエンドの音声処理タスクに対応する包括的なツールキ…
★ 9.9k ⑂ 2.4k Apache-2.0 2026-06-24
マルチモーダル
GitHub
X-AnyLabeling
X-AnyLabelingは、Segment Anythingなどの強力なAIモデルを活用し、データラベリングを効率化するツールです。自動ラ…
★ 9.6k ⑂ 1.0k GPL-3.0 2026-06-28
ASR / 音声認識
GitHub
inference
Xorbits Inference (Xinference) は、言語、音声認識、マルチモーダルモデルの提供を容易にする強力で多機能なライブ…
★ 9.4k ⑂ 837 Apache-2.0 2026-06-24
マルチモーダル
GitHub
deeplake
Deep LakeはAIワークロードに特化したデータベースで、深層学習アプリケーション向けのストレージ形式を採用していま…
★ 9.2k ⑂ 717 Apache-2.0 2026-05-21
ASR / 音声認識
GitHub
speech_recognition
このPythonライブラリ「SpeechRecognition」は、多様なオンラインおよびオフラインの音声認識エンジンとAPIに対応し…
★ 9.0k ⑂ 2.4k BSD-3-Clause 2026-06-16
マルチモーダル
GitHub
all-in-rag
このプロジェクト「All-in-RAG」は、大規模言語モデル(LLM)アプリケーション開発者向けのRAG(検索拡張生成)技術…
★ 9.0k ⑂ 4.5k 2026-06-05
マルチモーダル
GitHub
MobileAgent
Mobile-Agentは、Alibaba GroupのTongyi Labが開発した強力なGUIエージェントファミリーです。デスクトップ、モバイ…
★ 8.9k ⑂ 891 MIT 2026-05-14
LLM
GitHub
garden-skills
Garden Skillsは、Claude Code、Cursor、CodexなどのAIコーディングエージェント向けに、Webデザイン、知識検索、画…
★ 8.8k ⑂ 1.2k MIT 2026-06-10
音声生成 / TTS
GitHub
Bert-VITS2
Bert-VITS2は、多言語BERTをVITS2バックボーンに統合したテキスト読み上げ(TTS)システムです。このツールは、高度…
★ 8.8k ⑂ 1.3k AGPL-3.0 2026-06-22
3D / NeRF
GitHub
awesome-3D-gaussian-splatting
「Awesome 3D Gaussian Splatting」は、3D Gaussian Splatting(3DGS)および関連技術に特化した厳選されたリソース…
★ 8.7k ⑂ 538 MIT 2026-06-26
マルチモーダル
GitHub
BentoML
BentoMLは、AIアプリケーションとモデル推論のために最適化されたオンラインサービングシステムを構築するためのPyth…
★ 8.7k ⑂ 978 Apache-2.0 2026-06-22
ASR / 音声認識
GitHub
SenseVoice
SenseVoiceは、自動音声認識(ASR)、話者言語識別、音声感情認識、音声イベント検出、そして最新のアップデートでは…
★ 8.7k ⑂ 787 NOASSERTION 2026-06-22
音声生成 / TTS
GitHub
moonshine
Moonshine Voiceは、開発者向けのオープンソースAIツールキットで、リアルタイムの音声エージェントやアプリケーショ…
★ 8.6k ⑂ 464 NOASSERTION 2026-06-26
動画生成
GitHub
Sana
SANAは、NVIDIAが開発した高解像度画像および動画生成のための効率的なコードベースです。線形拡散トランスフォーマ…
★ 8.4k ⑂ 671 Apache-2.0 2026-06-25