3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

SpeakSlow

「聲聲慢 SpeakSlow」は、中国語に特化した最速のローカル音声入力ツールです。無料かつオープンソースで、100%ロー…

#AI連携 #GUI #Node.js

★ 61 ⑂ 9 NOASSERTION 2026-06-22

LLM

GitHub

Cortex

Cortexは、Claude CodeなどのAIコーディングアシスタントのセッション間で失われる文脈を保持するための、永続的な記…

#AI #CLI #PostgreSQL

★ 61 ⑂ 11 NOASSERTION 2026-06-19

マルチモーダル

GitHub

doubao2api

このプロジェクト「doubao2api」は、Doubao（豆包）クライアントAPIをリバースエンジニアリングしたもので、AIエージ…

#CLI #Docker #OpenAI互換

★ 61 ⑂ 20 Apache-2.0 2026-05-24

ASR / 音声認識

GitHub

AmicoScript

AmicoScriptは、OpenAIのWhisperモデルをベースにした、プライバシー重視のローカルオーディオ転写ツールです。ユー…

#Docker対応 #LLM連携 #Python

★ 61 ⑂ 2 MIT 2026-06-21

LLM

GitHub

Zikkaron

Zikkaronは、AIが過去の対話や決定を記憶し、必要に応じて適切な文脈を再構築するための永続的なメモリエンジンです…

#Claude Code対応 #CLI #Python

★ 60 ⑂ 7 MIT 2026-04-01

画像生成

GitHub

W-Flow

W-Flowは、「Wasserstein Gradient Flowsを介したワンステップ生成モデリング」の公式PyTorchコードベースです。この…

#Colab対応 #Hugging Face対応 #Python

★ 60 ⑂ 4 MIT 2026-06-09

ComfyUI

GitHub

ComfyUI-Rodin

ComfyUI-Rodinは、Hyper3DのRodin APIをComfyUIから利用できる3D生成向けカスタムノード拡張です。画像から3D、テキ…

#3D生成 #API連携 #ComfyUI対応

★ 59 ⑂ 13 GPL-3.0 2026-05-19

マルチモーダル

acestep-transcriber

ACE-Step Transcriberは、ACE-Step v1.5の学習データ注釈に使われる多言語音声転写モデルです。話し声だけでなく歌声…

#CLI #Python #transformers

❤ 59 ↓ 9.7k mit 2026-02-03

画像生成

GitHub

MirrorMetrics

MirrorMetricsは、Stable DiffusionのFace LoRA（ファインチューニングモデル）の評価に特化した科学的ベンチマーキ…

#CLI #GPU推奨 #Python

★ 58 ⑂ 8 MIT 2026-02-21

3D / NeRF

GitHub

Robo3R

Robo3Rは、RGBフレームからリアルタイムで操作可能な3D再構築を可能にするツールです。深度センサーやキャリブレーシ…

#3D Reconstruction #CLI #Computer Vision

★ 58 Apache-2.0 2026-06-21

3D / NeRF

GitHub

LATO

LATOは、3Dメッシュのトポロジーを保持したまま圧縮し、効率的に生成する新しい手法を提案しています。これは、Verte…

#3Dメッシュ処理 #CLI #GPU必須

★ 58 ⑂ 1 MIT 2026-05-14

ASR / 音声認識

GitHub

ArcSub

ArcSubは、クラウドサービスとローカルのOpenVINOモデルの両方を活用するエンドツーエンドの字幕翻訳ワークステーシ…

#OpenVINO対応 #Python #Web UI

★ 58 ⑂ 12 MIT 2026-05-23

ComfyUI

GitHub

ComfyUI-Layers

ComfyUI-Layersは、ComfyUI用のカスタムノード「LayersSaver」を提供するツールです。このノードを使用すると、画像…

#ComfyUI対応 #PSD出力 #Python

★ 58 ⑂ 8 GPL-3.0 2024-07-31

LLM

GitHub

nvim-mcp

nvim-mcpは、AIエージェントが実行中のNeovimセッションに直接アクセスできるようにするMCP（Model Context Protocol…

#CLI #Linux #MCP互換クライアント

★ 58 ⑂ 5 MIT 2026-05-19

3D / NeRF

GitHub

diff-surfel-tracing

このツールは、2D Gaussian Splatting（2DGS）とNVIDIA OptiXを基盤とした、差分可能な2Dガウスレイトレーサーです。…

#CLI #GPU必須 #NVIDIA OptiX

★ 57 ⑂ 4 NOASSERTION 2025-10-14

音声生成 / TTS

GitHub

become-ceo

「Become CEO」は、Discord上でAIエグゼクティブチームを構築するツールです。エンジニアリング、財務、マーケティン…

#AI Agents #CLI #Discord

★ 57 ⑂ 8 MIT 2026-03-13

マルチモーダル

GitHub

GEditBench_v2

GEditBench v2は、汎用画像編集モデルの性能を人間が調整した基準で評価するための包括的なベンチマークです。1,200…

#AI/ML #CLI #GPU必須

★ 57 ⑂ 1 2026-06-18

マルチモーダル

audio-flamingo-next-hf

Audio Flamingo Nextは、音声・環境音・音楽をまとめて理解できるNVIDIAの大規模音声言語モデルです。音声Q&A、文字…

#CLI #GPU推奨 #Python

❤ 56 ↓ 8.0k other 2026-05-13

AIエージェント

GitHub

Threatswarm

ThreatSwarmは、27のAIエージェントを活用し、偵察からエクスプロイト、ポストエクスプロイト、DFIR、CVSSスコア付き…

#AI #Claude Code Plugin #CLI

★ 55 ⑂ 13 MIT 2026-04-29

マルチモーダル

GitHub

OmniVideo-100K

「OmniVideo-100K」は、音声・視覚推論能力の向上を目指す大規模データセットと、そのための自動データ合成エンジン…

#CLI #Linux #MLLM

★ 54 ⑂ 2 Apache-2.0 2026-06-19

LLM

GitHub

deepcloak

DeepCloakは、Cloudflare、Datadome、Turnstile、reCAPTCHAなどのボットウォールによってブロックされるウェブページ…

#AIエージェント連携 #CLI #Python

★ 54 ⑂ 8 MIT 2026-06-05

ComfyUI

GitHub

ComfyUI-StableAudioX

ComfyUI上でAudioXモデルを使い、テキストや動画を入力として高品質な音声・音楽を生成できる拡張機能です。テキスト…

#ComfyUI対応 #GPU推奨 #Python

★ 53 ⑂ 9 NOASSERTION 2025-06-24

動画生成

GitHub

muapi-comfyui

「MuAPI ComfyUI Nodes」は、muapi.aiを通じて100以上の最先端AIモデル（Seedance、Kling、Veo3、Flux、HiDream、GPT…

#AIモデル連携 #API連携 #ComfyUI対応

★ 53 ⑂ 13 MIT 2026-06-02

画像生成

GitHub

LeapAlign_Code

LeapAlignは、フローマッチングモデルを人間の好みに合わせて微調整するための学習後手法です。完全なサンプリング軌…

#CLI #GPU必須 #Hugging Face対応

★ 53 ⑂ 1 Apache-2.0 2026-06-13