3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
SubForge
SubForgeは、メディアファイルの字幕作成、翻訳、動画への埋め込みを一元的に行うオールインワンツールです。音声や…
★ 10 ⑂ 2 2026-05-22
LLM
GitHub
guia-de-programacion-con-ai
このガイドは、AIを活用したプログラミングとソフトウェア開発を学ぶためのスペイン語で書かれた最も包括的なリソー…
★ 10 MIT 2026-06-15
LLM
GitHub
Auto-Read-Paper
Auto-Read-Paperは、arXivから最新論文を毎日自動で取得し、AIが読解・評価を行うパーソナル論文読解アシスタントで…
★ 10 ⑂ 9 AGPL-3.0 2026-06-03
AIエージェント
GitHub
web-design-enhancer
「Web Design Enhancer」は、AIエージェントが生成するウェブデザインの品質を劇的に向上させるスキルです。一般的な…
★ 10 ⑂ 2 2026-06-24
3D / NeRF
GitHub
Video-to-dataset
このツールは、ブレや重複、露出不足、動く物体によって3Dパイプラインが失敗する問題を解決するため、生の動画から…
★ 10 MIT 2026-03-29
音声生成 / TTS
GitHub
cosyvoice3-lora-finetuning
このリポジトリは、FunAudioLLM/CosyVoice v3 (Fun-CosyVoice3-0.5B) 向けのLoRAファインチューニングツールを提供し…
★ 10 NOASSERTION 2026-03-29
動画生成
GitHub
phyco-sim
PhyCo-Sim(非公式)は、CVPR 2026で発表されたPhyCoの物理シミュレーションデータ生成パイプラインを独自に実装した…
★ 10 NOASSERTION 2026-06-08
LLM
GitHub
vlm4ocr
vlm4ocrは、Vision Language Models (VLMs) を活用して高精度なOCR(光学文字認識)を可能にするPythonパッケージお…
★ 10 ⑂ 1 MIT 2026-05-05
LLM
GitHub
SWE-Model-Arena
SWE-Model-Arenaは、ソフトウェアエンジニアリングタスク向けのツール呼び出しモデルをペアで比較評価するためのオー…
★ 10 ⑂ 1 2026-04-04
画像生成
GitHub
windinet
WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学(CFD)シミュレーション…
★ 10 ⑂ 3 Apache-2.0 2026-04-15
画像生成
GitHub
PromptReinjection
「Prompt Reinjection」は、マルチモーダル拡散トランスフォーマーにおいて発生する「プロンプト忘れ」問題に対処す…
★ 9 MIT 2026-05-20
マルチモーダル
GitHub
SynCLIP
SynCLIPは、セマンティクス的に同等な表現でも空間的注意が異なるという、オープンボキャブラリー高密度知覚(OVDP)…
★ 9 ⑂ 1 Apache-2.0 2026-06-04
LLM
GitHub
rag-forge
「rag-forge」は、Retrieval-Augmented Generation(RAG)タスクに特化してLLM(大規模言語モデル)を効率的にファイ…
★ 9 ⑂ 1 NOASSERTION 2026-05-01
LLM
GitHub
tokdrift
TokDriftは、LLMがサブワードでコードを生成する一方、実際のコードは文法を持つというギャップを研究するためのフレ…
★ 9 ⑂ 1 2026-04-20
ComfyUI
GitHub
video-to-prompt
「Video-to-Prompt WebUI」は、動画からAI画像生成プロンプトを抽出するためのGradioベースのウェブアプリケーション…
★ 9 ⑂ 1 NOASSERTION 2026-05-26
ComfyUI
GitHub
ComfyPanel
ComfyPanelは、Adobe PhotoshopとComfyUIを深く統合するプロフェッショナルなツールです。デザイナー向けに開発され…
★ 9 ⑂ 1 NOASSERTION 2026-06-24
音声生成 / TTS
GitHub
voxlert
Voxlertは、Claude Code、Cursor、OpenAI Codex、pi、OpenClawなどのLLM生成AIコーディングエージェント向けに、ゲー…
★ 9 ⑂ 2 MIT 2026-06-20
マルチモーダル
GitHub
cerul-app
Cerul Appは、ユーザーが視聴する動画や音声コンテンツをセルフホストで管理し、高度な検索を可能にするオープンソー…
★ 9 ⑂ 2 NOASSERTION 2026-06-26
ComfyUI
GitHub
image-fingerprint-remover
このツールは、画像に埋め込まれたEXIF、GPS、C2PA/コンテンツクレデンシャル、AIウォーターマーク、Stable Diffusio…
★ 9 ⑂ 6 MIT 2026-05-21
画像生成
GitHub
ComfyUI-PlagueKind-Nodes
「ComfyUI-PlagueKind-Nodes」は、ComfyUIユーザー向けに画像とマスクのリサイズを統合し、LoRAの高度なスタッキング…
★ 9 ⑂ 2 MIT 2026-05-31
画像生成
GitHub
CVQ
このリポジトリは、革新的な画像トークン化手法「Channel-wise Vector Quantization (CVQ)」とその応用である「Chann…
★ 9 MIT 2026-06-01
ASR / 音声認識
GitHub
afrispeech-selector
AfriSpeech Selectorは、142のアフリカ言語にわたる2200時間以上の音声データに簡単にアクセスできるCLIツールです。…
★ 9 ⑂ 5 2026-06-19
LLM
GitHub
ZErio-Ai
ZErio AIは、Gemini, GPT-4o, Mistralなど5種類の主要LLMを統合したフルスタックAIチャットプラットフォームです。RA…
★ 9 ⑂ 2 MIT 2026-05-23
AIエージェント
GitHub
hero-harness
HERO(Harness for Engineering and Run-time Orchestration)は、基盤モデルを活用した自律型ソフトウェアエンジニ…
★ 9 MIT 2026-06-10