3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

SubForge

SubForgeは、メディアファイルの字幕作成、翻訳、動画への埋め込みを一元的に行うオールインワンツールです。音声や…

#CLI #GUI #Python

★ 10 ⑂ 2 2026-05-22

LLM

GitHub

guia-de-programacion-con-ai

このガイドは、AIを活用したプログラミングとソフトウェア開発を学ぶためのスペイン語で書かれた最も包括的なリソー…

#API連携 #CLI #LLM

★ 10 MIT 2026-06-15

LLM

GitHub

Auto-Read-Paper

Auto-Read-Paperは、arXivから最新論文を毎日自動で取得し、AIが読解・評価を行うパーソナル論文読解アシスタントで…

#AI / LLM #GitHub Actions #Python

★ 10 ⑂ 9 AGPL-3.0 2026-06-03

AIエージェント

GitHub

web-design-enhancer

「Web Design Enhancer」は、AIエージェントが生成するウェブデザインの品質を劇的に向上させるスキルです。一般的な…

#CLI #GSAP #Playwright

★ 10 ⑂ 2 2026-06-24

3D / NeRF

GitHub

Video-to-dataset

このツールは、ブレや重複、露出不足、動く物体によって3Dパイプラインが失敗する問題を解決するため、生の動画から…

#CLI #COLMAP対応 #GPU必須

★ 10 MIT 2026-03-29

音声生成 / TTS

GitHub

cosyvoice3-lora-finetuning

このリポジトリは、FunAudioLLM/CosyVoice v3 (Fun-CosyVoice3-0.5B) 向けのLoRAファインチューニングツールを提供し…

#CLI #GPU必須 #LoRA

★ 10 NOASSERTION 2026-03-29

動画生成

GitHub

phyco-sim

PhyCo-Sim（非公式）は、CVPR 2026で発表されたPhyCoの物理シミュレーションデータ生成パイプラインを独自に実装した…

#CLI #GPU必須 #HuggingFace

★ 10 NOASSERTION 2026-06-08

LLM

GitHub

vlm4ocr

vlm4ocrは、Vision Language Models (VLMs) を活用して高精度なOCR（光学文字認識）を可能にするPythonパッケージお…

#CLI #Python #VLM対応

★ 10 ⑂ 1 MIT 2026-05-05

LLM

GitHub

SWE-Model-Arena

SWE-Model-Arenaは、ソフトウェアエンジニアリングタスク向けのツール呼び出しモデルをペアで比較評価するためのオー…

#Gradio #Hugging Face Spaces #Python

★ 10 ⑂ 1 2026-04-04

画像生成

GitHub

windinet

WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学（CFD）シミュレーション…

#AI/ML #CFDシミュレーション #CLI

★ 10 ⑂ 3 Apache-2.0 2026-04-15

画像生成

GitHub

PromptReinjection

「Prompt Reinjection」は、マルチモーダル拡散トランスフォーマーにおいて発生する「プロンプト忘れ」問題に対処す…

#Diffusion Models #HuggingFace #Multimodal AI

★ 9 MIT 2026-05-20

マルチモーダル

GitHub

SynCLIP

SynCLIPは、セマンティクス的に同等な表現でも空間的注意が異なるという、オープンボキャブラリー高密度知覚（OVDP）…

#CLIPベース #GPU必須 #Python

★ 9 ⑂ 1 Apache-2.0 2026-06-04

LLM

GitHub

rag-forge

「rag-forge」は、Retrieval-Augmented Generation（RAG）タスクに特化してLLM（大規模言語モデル）を効率的にファイ…

#GPU必須 #Hugging Face #LLM

★ 9 ⑂ 1 NOASSERTION 2026-05-01

LLM

GitHub

tokdrift

TokDriftは、LLMがサブワードでコードを生成する一方、実際のコードは文法を持つというギャップを研究するためのフレ…

#CLI #Conda/uv #GPU推奨

★ 9 ⑂ 1 2026-04-20

ComfyUI

GitHub

video-to-prompt

「Video-to-Prompt WebUI」は、動画からAI画像生成プロンプトを抽出するためのGradioベースのウェブアプリケーション…

#CLI #GPU必須 #llama.cpp API

★ 9 ⑂ 1 NOASSERTION 2026-05-26

ComfyUI

GitHub

ComfyPanel

ComfyPanelは、Adobe PhotoshopとComfyUIを深く統合するプロフェッショナルなツールです。デザイナー向けに開発され…

#Adobe Photoshop #AIワークフロー #ComfyUI対応

★ 9 ⑂ 1 NOASSERTION 2026-06-24

音声生成 / TTS

GitHub

voxlert

Voxlertは、Claude Code、Cursor、OpenAI Codex、pi、OpenClawなどのLLM生成AIコーディングエージェント向けに、ゲー…

#CLI #GPU必須 #LLM連携

★ 9 ⑂ 2 MIT 2026-06-20

マルチモーダル

GitHub

cerul-app

Cerul Appは、ユーザーが視聴する動画や音声コンテンツをセルフホストで管理し、高度な検索を可能にするオープンソー…

#Desktop App #Local API #macOS / Linux / Windows

★ 9 ⑂ 2 NOASSERTION 2026-06-26

ComfyUI

GitHub

image-fingerprint-remover

このツールは、画像に埋め込まれたEXIF、GPS、C2PA/コンテンツクレデンシャル、AIウォーターマーク、Stable Diffusio…

#AI生成画像対応 #CLI #Python

★ 9 ⑂ 6 MIT 2026-05-21

画像生成

GitHub

ComfyUI-PlagueKind-Nodes

「ComfyUI-PlagueKind-Nodes」は、ComfyUIユーザー向けに画像とマスクのリサイズを統合し、LoRAの高度なスタッキング…

#AIワークフロー #ComfyUI対応 #Python

★ 9 ⑂ 2 MIT 2026-05-31

画像生成

GitHub

CVQ

このリポジトリは、革新的な画像トークン化手法「Channel-wise Vector Quantization (CVQ)」とその応用である「Chann…

#CLI #GPU必須 #Python

★ 9 MIT 2026-06-01

ASR / 音声認識

GitHub

afrispeech-selector

AfriSpeech Selectorは、142のアフリカ言語にわたる2200時間以上の音声データに簡単にアクセスできるCLIツールです。…

#ASR #CLI #LJSpeech形式

★ 9 ⑂ 5 2026-06-19

LLM

GitHub

ZErio-Ai

ZErio AIは、Gemini, GPT-4o, Mistralなど5種類の主要LLMを統合したフルスタックAIチャットプラットフォームです。RA…

#LLMサポート #Node.js #Python

★ 9 ⑂ 2 MIT 2026-05-23

AIエージェント

GitHub

hero-harness

HERO（Harness for Engineering and Run-time Orchestration）は、基盤モデルを活用した自律型ソフトウェアエンジニ…

#CLI #LLM #Python

★ 9 MIT 2026-06-10