3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
MM-FM
MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…
★ 9 ⑂ 1 MIT 2026-06-12
ASR / 音声認識
GitHub
Premiere-Pro-edit-bibl
Premiere Auto-Editは、話している動画(ロングフォーム・トーク・ライブ)のラフカットを、たった1つのコマンドで自…
★ 9 ⑂ 3 MIT 2026-06-15
ComfyUI
GitHub
comfyui-save-file-extended
ComfyUI向けの拡張ノード集で、画像の保存・読み込みをローカル保存先だけでなく各種クラウドストレージにも直接対応…
★ 9 ⑂ 6 MIT 2025-11-27
ComfyUI
GitHub
ComfyUI-HeartMuLa
ComfyUI-HeartMuLaは、音楽生成と歌詞転写を目的としたComfyUIの拡張機能です。HeartMuLaモデルファミリーとheartlib…
★ 9 ⑂ 4 Apache-2.0 2026-02-14
画像生成
GitHub
mlx-taef
mlx-taefは、Apple Silicon向けに最適化された、拡散ラテントを高速にデコードするTiny AutoEncoderライブラリです。…
★ 9 ⑂ 2 MIT 2026-06-23
ComfyUI
GitHub
ComfyUI-Subworkflow
ComfyUI-Subworkflowは、ComfyUIの既存ワークフローを再利用可能な「サブワークフロー」として活用するための拡張機…
★ 9 ⑂ 2 GPL-3.0 2026-04-28
ASR / 音声認識
GitHub
find-influencer-skill
このスキルは、AIエージェントが小紅書、抖音、Bilibili、YouTubeなどの複数のプラットフォームでインフルエンサーを…
★ 9 2026-05-07
3D / NeRF
GitHub
map-creator
map-creatorは、DJIドローンを用いた3Dマッピングや写真測量ミッションを計画・視覚化するためのデスクトップアプリ…
★ 9 MIT 2026-05-09
AIエージェント
GitHub
web-speed-oss
Web Speedは、AIエージェント向けのWebページ解析ツールです。複雑なWebコンテンツ(HTML、レイアウト、JavaScript)…
★ 9 ⑂ 1 GPL-3.0 2026-05-10
画像生成
GitHub
Animerge
Animergeは、AnimaモデルのチェックポイントやLoRAファイルをデスクトップGUIで統合的に管理・分析・学習するための…
★ 9 Apache-2.0 2026-06-24
マルチモーダル
GitHub
goodq4all
GoodQ4Allは、ローカルファーストのマルチモーダル記憶システムで、長期間のビデオ、オーディオ、テキストからの情報…
★ 9 MIT 2026-06-26
マルチモーダル
GitHub
cppo
CPPO(Contrastive Perception Policy Optimization)は、視覚言語モデル(VLM)エージェントのファインチューニング…
★ 9 2026-05-28
音声生成 / TTS
GitHub
omnivoice-thai-api
nanofatdog/omnivoice-thai-apiは、追加学習不要のタイ語テキスト読み上げ(TTS)APIおよびWeb UIです。Voice Clonin…
★ 9 ⑂ 5 2026-05-22
画像生成
GitHub
PromptReinjection
「Prompt Reinjection」は、マルチモーダル拡散トランスフォーマーにおいて発生する「プロンプト忘れ」問題に対処す…
★ 9 MIT 2026-05-20
マルチモーダル
GitHub
SynCLIP
SynCLIPは、セマンティクス的に同等な表現でも空間的注意が異なるという、オープンボキャブラリー高密度知覚(OVDP)…
★ 9 ⑂ 1 Apache-2.0 2026-06-04
LLM
GitHub
rag-forge
「rag-forge」は、Retrieval-Augmented Generation(RAG)タスクに特化してLLM(大規模言語モデル)を効率的にファイ…
★ 9 ⑂ 1 NOASSERTION 2026-05-01
LLM
GitHub
tokdrift
TokDriftは、LLMがサブワードでコードを生成する一方、実際のコードは文法を持つというギャップを研究するためのフレ…
★ 9 ⑂ 1 2026-04-20
ComfyUI
GitHub
video-to-prompt
「Video-to-Prompt WebUI」は、動画からAI画像生成プロンプトを抽出するためのGradioベースのウェブアプリケーション…
★ 9 ⑂ 1 NOASSERTION 2026-05-26
ComfyUI
GitHub
ComfyPanel
ComfyPanelは、Adobe PhotoshopとComfyUIを深く統合するプロフェッショナルなツールです。デザイナー向けに開発され…
★ 9 ⑂ 1 NOASSERTION 2026-06-24
音声生成 / TTS
GitHub
voxlert
Voxlertは、Claude Code、Cursor、OpenAI Codex、pi、OpenClawなどのLLM生成AIコーディングエージェント向けに、ゲー…
★ 9 ⑂ 2 MIT 2026-06-20
マルチモーダル
GitHub
cerul-app
Cerul Appは、ユーザーが視聴する動画や音声コンテンツをセルフホストで管理し、高度な検索を可能にするオープンソー…
★ 9 ⑂ 2 NOASSERTION 2026-06-26
ComfyUI
GitHub
image-fingerprint-remover
このツールは、画像に埋め込まれたEXIF、GPS、C2PA/コンテンツクレデンシャル、AIウォーターマーク、Stable Diffusio…
★ 9 ⑂ 6 MIT 2026-05-21
画像生成
GitHub
ComfyUI-PlagueKind-Nodes
「ComfyUI-PlagueKind-Nodes」は、ComfyUIユーザー向けに画像とマスクのリサイズを統合し、LoRAの高度なスタッキング…
★ 9 ⑂ 2 MIT 2026-05-31
画像生成
GitHub
CVQ
このリポジトリは、革新的な画像トークン化手法「Channel-wise Vector Quantization (CVQ)」とその応用である「Chann…
★ 9 MIT 2026-06-01