3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#AI/ML (74 repos)

「AI/ML」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
erm
このツールは、英語音声の録音から「um」「uh」といった言い淀みを自動で除去するローカルCLIツールです。`faster-wh…
★ 108 ⑂ 2 MIT 2026-06-14
ComfyUI
GitHub
ComfyUI-Forbidden-Vision
「ComfyUI Forbidden Vision」は、ComfyUIユーザー向けの革新的な顔検出、セグメンテーション、画像エンハンスメント…
★ 93 ⑂ 5 AGPL-3.0 2026-06-14
3D / NeRF
GitHub
guidance-for-open-source-3d-reconstruction-toolbox-for-gaussian-splats-on-aws
AWS向けオープンソース3D再構築ツールボックスは、画像や動画入力から3Dシーンやオブジェクトを再構築するためのエン…
★ 84 ⑂ 5 MIT-0 2026-06-25
ComfyUI
GitHub
ComfyUI-FlexTools
「ostris/ComfyUI-FlexTools」は、画像生成AIのFlex.1-alphaおよびFlex.2-previewモデルをComfyUI上でより効率的に利…
★ 79 ⑂ 3 MIT 2025-08-05
AIエージェント
GitHub
uv-scripts-for-ai
このツールは、OCR、画像処理、音声処理など、データおよび機械学習タスク向けの自己完結型UVスクリプト集です。各ス…
★ 76 ⑂ 4 Apache-2.0 2026-06-23
ASR / 音声認識
GitHub
docker-whisper
hwdsl2/docker-whisperは、Docker上で動作する自己ホスト型Whisper音声認識サーバーを提供します。高速なfaster-whis…
★ 62 ⑂ 10 NOASSERTION 2026-06-29
LLM
GitHub
llm-flashcards
「LLM Flashcards」は、大規模言語モデル(LLM)の概念とアーキテクチャを視覚的に解説する300枚以上のフラッシュカ…
★ 59 ⑂ 5 NOASSERTION 2026-06-08
マルチモーダル
GitHub
GEditBench_v2
GEditBench v2は、汎用画像編集モデルの性能を人間が調整した基準で評価するための包括的なベンチマークです。1,200…
★ 57 ⑂ 1 2026-06-18
LLM
GitHub
ATM-Bench
ATM-Benchは、画像、動画、メールなどのマルチモーダルデータに対し、約4年間にわたる長期的なパーソナライズされた…
★ 48 ⑂ 2 MIT 2026-06-28
3D / NeRF
GitHub
wanderland
Wanderlandは、オープンワールドの具現化されたAI向けに、幾何学的に根拠のあるシミュレーションを提供する包括的な…
★ 47 Apache-2.0 2026-06-24
ComfyUI
GitHub
comfyui-floodgate
ComfyUI Floodgateは、ComfyUIのワークフローにおけるロジックフローを簡単に制御できるカスタムノードです。処理時…
★ 36 ⑂ 10 MIT 2025-08-12
ASR / 音声認識
GitHub
arkiv
arkivは、AIセマンティック検索機能を備えたオープンソースのローカルファーストメディアアセットマネージャーです。…
★ 36 ⑂ 4 MIT 2026-06-24
動画生成
GitHub
MaxVideoAi
MaxVideoAIは、Sora、Veo、Kling、Seedance、LTXといった複数のAIビデオモデルを比較・生成できるマルチエンジンAIビ…
★ 33 ⑂ 13 NOASSERTION 2026-06-25
ComfyUI
GitHub
Comfyui-anima-sampler
ComfyUI Anima Flow Corrective Samplerは、ComfyUI用のカスタムサンプラーノードで、AnimaおよびCosmosスタイルの画…
★ 32 ⑂ 2 MIT 2026-06-10
音声生成 / TTS
GitHub
supertonic3-voice-clone
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。低GPU使用量(…
★ 29 ⑂ 8 MIT 2026-05-25
画像生成
GitHub
comfyui-ReferenceLatentPlus
このツールはComfyUIの標準`ReferenceLatent`ノードを強化したドロップイン代替品です。画像ごとに参照強度、タイム…
★ 28 ⑂ 4 2026-06-07
マルチモーダル
GitHub
braviadev
このリポジトリは、修士号を持つコンピュータサイエンスの専門家であり、フルスタックエンジニア、そして博士課程の…
★ 20 2026-06-28
ComfyUI
GitHub
comfyui-refocus
EricRollei/comfyui-refocusは、ComfyUI用のカスタムノード集で、生成型リフォーカシングパイプラインを実装していま…
★ 17 ⑂ 1 Apache-2.0 2026-05-04
マルチモーダル
GitHub
GalamseyWatch
このツールは、Sentinel-2衛星画像から違法な小規模金採掘(ガラッセイ)を検出するエージェント型地球観測システム…
★ 15 ⑂ 6 MIT 2026-05-05
音楽生成
GitHub
midi-drums
このツールは、Pythonで開発された、プロ品質のMIDIドラムトラック生成システムです。モジュール式プラグインアーキ…
★ 14 ⑂ 2 2026-03-14
画像生成
GitHub
windinet
WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学(CFD)シミュレーション…
★ 10 ⑂ 3 Apache-2.0 2026-04-15
画像生成
GitHub
pytorch-memory-fix
このツールは、PyTorch/Python環境で大規模な機械学習モデル(LLM、Diffusionモデルなど)を繰り返しロード・アンロ…
★ 10 ⑂ 2 MIT 2026-03-24
LLM
GitHub
SocialSim
本リポジトリは、AAAI 2025論文「SocialSim: Towards Socialized Simulation of Emotional Support Conversation」に…
★ 5 ⑂ 1 NOASSERTION 2026-05-20
音声生成 / TTS
GitHub
openvoice-cloning
OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…
★ 5 MIT 2026-06-13