3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub mlx-serve
mlx-serveは、Apple Silicon搭載Mac (M1+以降) 向けのローカル推論サーバーです。このツールは、AppleのネイティブML…
★ 9 ⑂ 1 MIT 2026-06-23
ComfyUI GitHub ac-comfyui-queue-manager
ComfyUI Queue Managerは、ComfyUIのワークフロー実行キューを永続化して管理できる拡張ツールです。再起動後もキュ…
★ 9 ⑂ 2 2025-09-27
画像生成 GitHub diffusion-tutorials-cn
本プロジェクトは、Tsuyoshi Matsuzaki氏による「diffusion-tutorials」の中国語翻訳・理論強化版です。拡散モデル(…
★ 9 MIT 2026-03-28
マルチモーダル GitHub MM-FM
MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…
★ 9 ⑂ 1 MIT 2026-06-12
ASR / 音声認識 GitHub Premiere-Pro-edit-bibl
Premiere Auto-Editは、話している動画(ロングフォーム・トーク・ライブ)のラフカットを、たった1つのコマンドで自…
★ 9 ⑂ 3 MIT 2026-06-15
ComfyUI GitHub comfyui-save-file-extended
ComfyUI向けの拡張ノード集で、画像の保存・読み込みをローカル保存先だけでなく各種クラウドストレージにも直接対応…
★ 9 ⑂ 6 MIT 2025-11-27
ComfyUI GitHub ComfyUI-HeartMuLa
ComfyUI-HeartMuLaは、音楽生成と歌詞転写を目的としたComfyUIの拡張機能です。HeartMuLaモデルファミリーとheartlib…
★ 9 ⑂ 4 Apache-2.0 2026-02-14
画像生成 GitHub mlx-taef
mlx-taefは、Apple Silicon向けに最適化された、拡散ラテントを高速にデコードするTiny AutoEncoderライブラリです。…
★ 9 ⑂ 2 MIT 2026-06-23
ComfyUI GitHub ComfyUI-Subworkflow
ComfyUI-Subworkflowは、ComfyUIの既存ワークフローを再利用可能な「サブワークフロー」として活用するための拡張機…
★ 9 ⑂ 2 GPL-3.0 2026-04-28
ASR / 音声認識 GitHub find-influencer-skill
このスキルは、AIエージェントが小紅書、抖音、Bilibili、YouTubeなどの複数のプラットフォームでインフルエンサーを…
★ 9 2026-05-07
3D / NeRF GitHub map-creator
map-creatorは、DJIドローンを用いた3Dマッピングや写真測量ミッションを計画・視覚化するためのデスクトップアプリ…
★ 9 MIT 2026-05-09
AIエージェント GitHub web-speed-oss
Web Speedは、AIエージェント向けのWebページ解析ツールです。複雑なWebコンテンツ(HTML、レイアウト、JavaScript)…
★ 9 ⑂ 1 GPL-3.0 2026-05-10
画像生成 GitHub Animerge
Animergeは、AnimaモデルのチェックポイントやLoRAファイルをデスクトップGUIで統合的に管理・分析・学習するための…
★ 9 Apache-2.0 2026-06-24
マルチモーダル GitHub goodq4all
GoodQ4Allは、ローカルファーストのマルチモーダル記憶システムで、長期間のビデオ、オーディオ、テキストからの情報…
★ 9 MIT 2026-06-26
マルチモーダル GitHub cppo
CPPO(Contrastive Perception Policy Optimization)は、視覚言語モデル(VLM)エージェントのファインチューニング…
★ 9 2026-05-28
音声生成 / TTS GitHub omnivoice-thai-api
nanofatdog/omnivoice-thai-apiは、追加学習不要のタイ語テキスト読み上げ(TTS)APIおよびWeb UIです。Voice Clonin…
★ 9 ⑂ 5 2026-05-22
AIエージェント GitHub career-forges
CareerForgesは、AIエージェントをローカルで実行することで、求職活動を自動化・最適化するためのオープンソースの…
★ 8 ⑂ 1 MIT 2026-06-11
ASR / 音声認識 GitHub cream-typer
Cream Typerは、Apple Siliconデバイス上で動作するローカル音声翻訳・テキスト化ツールです。Caps Lockをタップして…
★ 8 ⑂ 1 MIT 2026-05-02
マルチモーダル GitHub GDB
GDB (GraphicDesignBench) は、グラフィックデザインタスクにおけるビジョン言語モデルの性能を評価するためのリアル…
★ 8 ⑂ 1 NOASSERTION 2026-05-05
ComfyUI GitHub J-AI-Studio
J AI Studioは、複雑なグラフエディタを必要とせずに、ローカルで画像や動画を生成するためのComfyUI用シンプルUIで…
★ 8 MIT 2026-05-03
LLM GitHub Local-LLM-Discord-Bot
このツールは、ローカルで動作するLLM(OllamaやLM Studio)をDiscordボットとして利用可能にします。これにより、ユ…
★ 8 ⑂ 2 MIT 2026-05-28
動画生成 GitHub KIVI
KIVIは、テキストから動画を生成するAIモデルの評価に特化したツールです。従来の「動画の見栄え」ではなく、「動画…
★ 8 MIT 2026-06-05
ASR / 音声認識 GitHub florilegium
このツールは「Florilegium(フロリレギウム)・他山之石」と名付けられ、YouTubeやBilibiliなどの動画リンク、また…
★ 8 ⑂ 1 MIT 2026-06-06
画像生成 GitHub DisPOSE
この「DisPOSE」は、自己教師ありマルチビュー3D人体ポーズ推定のための実装です。離散的なクロスビュー人物割り当て…
★ 8 MIT 2026-06-15