3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#AI/ML (74 repos)

「AI/ML」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

erm

このツールは、英語音声の録音から「um」「uh」といった言い淀みを自動で除去するローカルCLIツールです。`faster-wh…

#AI/ML #Audio Processing #CLI

★ 108 ⑂ 2 MIT 2026-06-14

ComfyUI

GitHub

ComfyUI-Forbidden-Vision

「ComfyUI Forbidden Vision」は、ComfyUIユーザー向けの革新的な顔検出、セグメンテーション、画像エンハンスメント…

#AI/ML #ComfyUI対応 #カスタムモデル

★ 93 ⑂ 5 AGPL-3.0 2026-06-14

3D / NeRF

GitHub

guidance-for-open-source-3d-reconstruction-toolbox-for-gaussian-splats-on-aws

AWS向けオープンソース3D再構築ツールボックスは、画像や動画入力から3Dシーンやオブジェクトを再構築するためのエン…

#3D Reconstruction #AI/ML #AWS

★ 84 ⑂ 5 MIT-0 2026-06-25

ComfyUI

GitHub

ComfyUI-FlexTools

「ostris/ComfyUI-FlexTools」は、画像生成AIのFlex.1-alphaおよびFlex.2-previewモデルをComfyUI上でより効率的に利…

#AI/ML #ComfyUI対応 #LoRA対応

★ 79 ⑂ 3 MIT 2025-08-05

AIエージェント

GitHub

uv-scripts-for-ai

このツールは、OCR、画像処理、音声処理など、データおよび機械学習タスク向けの自己完結型UVスクリプト集です。各ス…

#AI/ML #CLI #GPU必須

★ 76 ⑂ 4 Apache-2.0 2026-06-23

ASR / 音声認識

GitHub

docker-whisper

hwdsl2/docker-whisperは、Docker上で動作する自己ホスト型Whisper音声認識サーバーを提供します。高速なfaster-whis…

#AI/ML #Docker #GPU対応

★ 62 ⑂ 10 NOASSERTION 2026-06-29

LLM

GitHub

llm-flashcards

「LLM Flashcards」は、大規模言語モデル（LLM）の概念とアーキテクチャを視覚的に解説する300枚以上のフラッシュカ…

#AI/ML #LLM #図解資料

★ 59 ⑂ 5 NOASSERTION 2026-06-08

マルチモーダル

GitHub

GEditBench_v2

GEditBench v2は、汎用画像編集モデルの性能を人間が調整した基準で評価するための包括的なベンチマークです。1,200…

#AI/ML #CLI #GPU必須

★ 57 ⑂ 1 2026-06-18

LLM

GitHub

ATM-Bench

ATM-Benchは、画像、動画、メールなどのマルチモーダルデータに対し、約4年間にわたる長期的なパーソナライズされた…

#AI/ML #CLI #Multimodal

★ 48 ⑂ 2 MIT 2026-06-28

3D / NeRF

GitHub

wanderland

Wanderlandは、オープンワールドの具現化されたAI向けに、幾何学的に根拠のあるシミュレーションを提供する包括的な…

#3Dシミュレーション #AI/ML #CLI

★ 47 Apache-2.0 2026-06-24

ComfyUI

GitHub

comfyui-floodgate

ComfyUI Floodgateは、ComfyUIのワークフローにおけるロジックフローを簡単に制御できるカスタムノードです。処理時…

#AI/ML #ComfyUI対応 #Python

★ 36 ⑂ 10 MIT 2025-08-12

ASR / 音声認識

GitHub

arkiv

arkivは、AIセマンティック検索機能を備えたオープンソースのローカルファーストメディアアセットマネージャーです。…

#AI/ML #DaVinci Resolve #Python

★ 36 ⑂ 4 MIT 2026-06-24

動画生成

GitHub

MaxVideoAi

MaxVideoAIは、Sora、Veo、Kling、Seedance、LTXといった複数のAIビデオモデルを比較・生成できるマルチエンジンAIビ…

#AI/ML #CLI #Docker

★ 33 ⑂ 13 NOASSERTION 2026-06-25

ComfyUI

GitHub

Comfyui-anima-sampler

ComfyUI Anima Flow Corrective Samplerは、ComfyUI用のカスタムサンプラーノードで、AnimaおよびCosmosスタイルの画…

#AI/ML #ComfyUI対応 #Python

★ 32 ⑂ 2 MIT 2026-06-10

音声生成 / TTS

GitHub

supertonic3-voice-clone

Supertone/supertonic-3モデル向けに、音声スタイル（.jsonファイル）を学習させるためのツールです。低GPU使用量（…

#AI/ML #Colab対応 #GPU必須

★ 29 ⑂ 8 MIT 2026-05-25

画像生成

GitHub

comfyui-ReferenceLatentPlus

このツールはComfyUIの標準`ReferenceLatent`ノードを強化したドロップイン代替品です。画像ごとに参照強度、タイム…

#AI/ML #ComfyUI対応 #GPU必須

★ 28 ⑂ 4 2026-06-07

マルチモーダル

GitHub

braviadev

このリポジトリは、修士号を持つコンピュータサイエンスの専門家であり、フルスタックエンジニア、そして博士課程の…

#AI/ML #Next.js #Node.js

★ 20 2026-06-28

ComfyUI

GitHub

comfyui-refocus

EricRollei/comfyui-refocusは、ComfyUI用のカスタムノード集で、生成型リフォーカシングパイプラインを実装していま…

#AI/ML #ComfyUI対応 #Python

★ 17 ⑂ 1 Apache-2.0 2026-05-04

マルチモーダル

GitHub

GalamseyWatch

このツールは、Sentinel-2衛星画像から違法な小規模金採掘（ガラッセイ）を検出するエージェント型地球観測システム…

#AI/ML #Hugging Face #Python

★ 15 ⑂ 6 MIT 2026-05-05

音楽生成

GitHub

midi-drums

このツールは、Pythonで開発された、プロ品質のMIDIドラムトラック生成システムです。モジュール式プラグインアーキ…

#AI/ML #CLI #DAW連携

★ 14 ⑂ 2 2026-03-14

画像生成

GitHub

windinet

WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学（CFD）シミュレーション…

#AI/ML #CFDシミュレーション #CLI

★ 10 ⑂ 3 Apache-2.0 2026-04-15

画像生成

GitHub

pytorch-memory-fix

このツールは、PyTorch/Python環境で大規模な機械学習モデル（LLM、Diffusionモデルなど）を繰り返しロード・アンロ…

#AI/ML #CLI #Linux

★ 10 ⑂ 2 MIT 2026-03-24

LLM

GitHub

SocialSim

本リポジトリは、AAAI 2025論文「SocialSim: Towards Socialized Simulation of Emotional Support Conversation」に…

#AI/ML #Python #データセット

★ 5 ⑂ 1 NOASSERTION 2026-05-20

音声生成 / TTS

GitHub

openvoice-cloning

OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…

#AI/ML #Python #多言語対応

★ 5 MIT 2026-06-13