3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub SpeakSlow
「聲聲慢 SpeakSlow」は、中国語に特化した最速のローカル音声入力ツールです。無料かつオープンソースで、100%ロー…
★ 61 ⑂ 9 NOASSERTION 2026-06-22
LLM GitHub Cortex
Cortexは、Claude CodeなどのAIコーディングアシスタントのセッション間で失われる文脈を保持するための、永続的な記…
★ 61 ⑂ 11 NOASSERTION 2026-06-19
マルチモーダル GitHub doubao2api
このプロジェクト「doubao2api」は、Doubao(豆包)クライアントAPIをリバースエンジニアリングしたもので、AIエージ…
★ 61 ⑂ 20 Apache-2.0 2026-05-24
ASR / 音声認識 GitHub AmicoScript
AmicoScriptは、OpenAIのWhisperモデルをベースにした、プライバシー重視のローカルオーディオ転写ツールです。ユー…
★ 61 ⑂ 2 MIT 2026-06-21
LLM GitHub Zikkaron
Zikkaronは、AIが過去の対話や決定を記憶し、必要に応じて適切な文脈を再構築するための永続的なメモリエンジンです…
★ 60 ⑂ 7 MIT 2026-04-01
画像生成 GitHub W-Flow
W-Flowは、「Wasserstein Gradient Flowsを介したワンステップ生成モデリング」の公式PyTorchコードベースです。この…
★ 60 ⑂ 4 MIT 2026-06-09
ComfyUI GitHub ComfyUI-Rodin
ComfyUI-Rodinは、Hyper3DのRodin APIをComfyUIから利用できる3D生成向けカスタムノード拡張です。画像から3D、テキ…
★ 59 ⑂ 13 GPL-3.0 2026-05-19
マルチモーダル HF acestep-transcriber
ACE-Step Transcriberは、ACE-Step v1.5の学習データ注釈に使われる多言語音声転写モデルです。話し声だけでなく歌声…
❤ 59 ↓ 9.7k mit 2026-02-03
画像生成 GitHub MirrorMetrics
MirrorMetricsは、Stable DiffusionのFace LoRA(ファインチューニングモデル)の評価に特化した科学的ベンチマーキ…
★ 58 ⑂ 8 MIT 2026-02-21
3D / NeRF GitHub Robo3R
Robo3Rは、RGBフレームからリアルタイムで操作可能な3D再構築を可能にするツールです。深度センサーやキャリブレーシ…
★ 58 Apache-2.0 2026-06-21
3D / NeRF GitHub LATO
LATOは、3Dメッシュのトポロジーを保持したまま圧縮し、効率的に生成する新しい手法を提案しています。これは、Verte…
★ 58 ⑂ 1 MIT 2026-05-14
ASR / 音声認識 GitHub ArcSub
ArcSubは、クラウドサービスとローカルのOpenVINOモデルの両方を活用するエンドツーエンドの字幕翻訳ワークステーシ…
★ 58 ⑂ 12 MIT 2026-05-23
ComfyUI GitHub ComfyUI-Layers
ComfyUI-Layersは、ComfyUI用のカスタムノード「LayersSaver」を提供するツールです。このノードを使用すると、画像…
★ 58 ⑂ 8 GPL-3.0 2024-07-31
LLM GitHub nvim-mcp
nvim-mcpは、AIエージェントが実行中のNeovimセッションに直接アクセスできるようにするMCP(Model Context Protocol…
★ 58 ⑂ 5 MIT 2026-05-19
3D / NeRF GitHub diff-surfel-tracing
このツールは、2D Gaussian Splatting(2DGS)とNVIDIA OptiXを基盤とした、差分可能な2Dガウスレイトレーサーです。…
★ 57 ⑂ 4 NOASSERTION 2025-10-14
音声生成 / TTS GitHub become-ceo
「Become CEO」は、Discord上でAIエグゼクティブチームを構築するツールです。エンジニアリング、財務、マーケティン…
★ 57 ⑂ 8 MIT 2026-03-13
マルチモーダル GitHub GEditBench_v2
GEditBench v2は、汎用画像編集モデルの性能を人間が調整した基準で評価するための包括的なベンチマークです。1,200…
★ 57 ⑂ 1 2026-06-18
マルチモーダル HF audio-flamingo-next-hf
Audio Flamingo Nextは、音声・環境音・音楽をまとめて理解できるNVIDIAの大規模音声言語モデルです。音声Q&A、文字…
❤ 56 ↓ 8.0k other 2026-05-13
AIエージェント GitHub Threatswarm
ThreatSwarmは、27のAIエージェントを活用し、偵察からエクスプロイト、ポストエクスプロイト、DFIR、CVSSスコア付き…
★ 55 ⑂ 13 MIT 2026-04-29
マルチモーダル GitHub OmniVideo-100K
「OmniVideo-100K」は、音声・視覚推論能力の向上を目指す大規模データセットと、そのための自動データ合成エンジン…
★ 54 ⑂ 2 Apache-2.0 2026-06-19
LLM GitHub deepcloak
DeepCloakは、Cloudflare、Datadome、Turnstile、reCAPTCHAなどのボットウォールによってブロックされるウェブページ…
★ 54 ⑂ 8 MIT 2026-06-05
ComfyUI GitHub ComfyUI-StableAudioX
ComfyUI上でAudioXモデルを使い、テキストや動画を入力として高品質な音声・音楽を生成できる拡張機能です。テキスト…
★ 53 ⑂ 9 NOASSERTION 2025-06-24
動画生成 GitHub muapi-comfyui
「MuAPI ComfyUI Nodes」は、muapi.aiを通じて100以上の最先端AIモデル(Seedance、Kling、Veo3、Flux、HiDream、GPT…
★ 53 ⑂ 13 MIT 2026-06-02
画像生成 GitHub LeapAlign_Code
LeapAlignは、フローマッチングモデルを人間の好みに合わせて微調整するための学習後手法です。完全なサンプリング軌…
★ 53 ⑂ 1 Apache-2.0 2026-06-13