3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#AI/機械学習 (29 repos)

「AI/機械学習」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
MAGI-1
MAGI-1は、大規模な自己回帰型動画生成を実現する革新的なツールです。Sand AIによって開発され、学術論文(arXiv)…
★ 3.7k ⑂ 238 Apache-2.0 2026-06-17
ComfyUI
GitHub
ComfyUI-nunchaku
Nunchaku ComfyUI Pluginは、SVDQuantで量子化された4-bitニューラルネットワーク向けの効率的な推論エンジン「Nunch…
★ 2.9k ⑂ 166 Apache-2.0 2026-02-19
音楽生成
GitHub
musegan
MuseGANは、複数トラック(楽器)のポリフォニック音楽を生成するAIプロジェクトです。ゼロからの音楽生成や、ユーザ…
★ 2.0k ⑂ 394 MIT 2024-06-07
動画生成
GitHub
TokenFlow
TokenFlowは、事前学習済みのテキストから画像への拡散モデルを利用し、追加のトレーニングやファインチューニングな…
★ 1.7k ⑂ 140 MIT 2025-02-03
音声生成 / TTS
GitHub
soundstorm-pytorch
このツールは、Google Deepmindが開発した効率的な並列オーディオ生成モデル「SoundStorm」をPyTorchで実装したもの…
★ 1.5k ⑂ 94 MIT 2025-04-24
動画生成
GitHub
Phantom
Phantomは、テキスト、画像、動画の複数モーダルな入力を元に、被写体の一貫性を高く保ちながら動画を生成する統合的…
★ 1.5k ⑂ 99 Apache-2.0 2025-09-11
ASR / 音声認識
GitHub
nightingale
Nightingaleは、AIを活用したカラオケアプリで、ユーザーの音楽ライブラリ内のあらゆる曲をカラオケとして楽しめます…
★ 1.2k ⑂ 83 GPL-3.0 2026-06-08
音楽生成
GitHub
ai-audio-datasets
AI Audio Datasets (AI-ADS)は、スピーチ、音楽、効果音といった多様な音声データセットを網羅した包括的なリストで…
★ 949 ⑂ 95 MIT 2025-07-08
ComfyUI
GitHub
ComfyUI-ADMotionDirector
ComfyUI-ADMotionDirectorは、ComfyUIのカスタムノードとして機能し、AnimateDiff-MotionDirectorを利用してモーショ…
★ 188 ⑂ 14 Apache-2.0 2024-11-07
ComfyUI
GitHub
ComfyUI-DDColor
このツールは、人気の画像生成UIであるComfyUI内でDDColorをカラー化ノードとして利用するためのものです。白黒画像…
★ 162 ⑂ 15 Apache-2.0 2024-05-21
AIエージェント
GitHub
ghostwork
Ghostworkは、ユーザーの画面操作を常時監視し、作業パターンを自動的に学習することで、反復的なタスクを自動化する…
★ 148 ⑂ 6 NOASSERTION 2026-06-13
画像生成
GitHub
Evolving-Visual-Generation
このGitHubリポジトリは、現代のビジュアル生成技術を「視覚的知能」の進化という視点から体系的に整理した「生きて…
★ 121 ⑂ 5 2026-06-09
動画生成
GitHub
LiveWorld
LiveWorldは、生成型ビデオワールドモデルにおいて、視界外のダイナミクスをシミュレートする画期的なフレームワーク…
★ 63 ⑂ 3 Apache-2.0 2026-06-23
ASR / 音声認識
GitHub
voicetag
voicetagは、Pythonで書かれた話者分離および話者識別ライブラリです。pyannote.audioとresemblyzerを組み合わせて「…
★ 51 ⑂ 5 MIT 2026-03-16
ComfyUI
GitHub
ComfyUI-Img2Img-Turbo
このツールは、人気の画像生成UIであるComfyUIのImg2Img機能を高速化するための拡張機能です。GaParmar氏のImg2Img-T…
★ 39 ⑂ 7 MIT 2024-05-22
LLM
GitHub
spark-evals
このリポジトリは、DGX Sparkという特定のハードウェア環境で動作する、小規模な言語モデルや量子化モデルのベンチマ…
★ 36 ⑂ 1 2026-06-21
音楽生成
GitHub
Steerable-music-transformer
このプロジェクトは、論文「Steerable Rhythmic Complexity in Autoregressive Music Generation」の公式PyTorch実装…
★ 21 ⑂ 5 MIT 2026-05-27
画像生成
GitHub
IDLM
IDLM(Inverse-distilled Diffusion Language Models)は、ICML 2026で発表された画期的な技術です。本技術は、高品…
★ 16 MIT 2026-06-08
画像生成
GitHub
kimodo-houdini-bridge
このツールは、NVIDIA Kimodo(テキスト駆動の3D人体モーション生成AIモデル)をSideFX Houdiniに連携させるブリッジ…
★ 6 ⑂ 1 2026-06-10
動画生成
GitHub
video-distillation
video-distillationは、動画、キーフレーム、スクリーンショット、ナレーションスクリプト、プロット概要などを、動…
★ 3 ⑂ 1 MIT 2026-06-24
マルチモーダル
GitHub
MagikaDocumentFromPixel
このツールは、Magikaに触発された軽量な画像品質ゲートで、画像を「シャープ」、「ぼやけ」、「不確実」のいずれか…
★ 2 MIT 2026-04-27
画像生成
GitHub
diffusion
本リポジトリは、Stable Diffusion 3に着想を得た、DiTベースの条件付きフローモデルを実装しています。主な機能は、…
★ 2 2026-06-10