3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識

GitHub

voxrt-asr-android

このツールは、Androidデバイス向けに設計されたストリーミング音声認識ライブラリです。VoxRT独自のオンデバイス推…

#Android #Kotlin #Rust

★ 10 Apache-2.0 2026-06-04

画像生成

Qwen_Image_Edit-Remix-v2_0_GGUF

Qwen Image Edit Remix v2.0 を GGUF 量子化形式で配布するための軽量モデルリポジトリです。README上では元モデルへ…

#GGUF #image-text-to-image #量子化モデル

❤ 10 ↓ 767 2026-04-05

画像生成

GitHub

tmpd-public

Topological Motion Planning Diffusion（TMPD）は、障害物が多い環境で係留型ロボットが絡まない経路を生成するため…

#CLI #GPU必須 #Python

★ 10 MIT 2026-04-09

画像生成

GitHub

windinet

WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学（CFD）シミュレーション…

#AI/ML #CFDシミュレーション #CLI

★ 10 ⑂ 3 Apache-2.0 2026-04-15

LLM

GitHub

astro-slop

astro-slopは、AstroプロジェクトでLLM（大規模言語モデル）向けにウェブコンテンツを最適化し、Markdown形式で出力…

#Astro #LLM #Markdown

★ 10 ⑂ 1 MIT 2026-05-11

LLM

GitHub

SWE-Model-Arena

SWE-Model-Arenaは、ソフトウェアエンジニアリングタスク向けのツール呼び出しモデルをペアで比較評価するためのオー…

#Gradio #Hugging Face Spaces #Python

★ 10 ⑂ 1 2026-04-04

動画生成

GitHub

ltx-video-mlx

ltx-video-mlxは、Apple Silicon（M1以降のMac）上でMLXを活用し、PyTorchなしでLTX-2.3モデル（22B）による高性能な…

#Apple Silicon #CLI #LoRAファインチューニング

★ 10 ⑂ 3 2026-04-11

画像生成

GitHub

openai-compatible-imagegen

このリポジトリは、OpenAI互換の画像APIを通じてエージェントクライアントが画像生成、編集、バッチ処理を行うための…

#Agent Skill #CLI #OpenAI互換API

★ 10 ⑂ 2 MIT 2026-06-22

動画生成

GitHub

phyco-sim

PhyCo-Sim（非公式）は、CVPR 2026で発表されたPhyCoの物理シミュレーションデータ生成パイプラインを独自に実装した…

#CLI #GPU必須 #HuggingFace

★ 10 NOASSERTION 2026-06-08

3D / NeRF

GitHub

3D-RGBX

「3D-RGBX」は、CVPR 2026で注目された研究プロジェクトであり、キャリブレーションや深度情報なしで3Dの一貫性を保…

#3D Gaussian Splatting #GPU必須 #OSSフレームワーク対応

★ 10 ⑂ 2 MIT 2026-06-06

ASR / 音声認識

GitHub

AtomVoice

AtomVoiceは、Mac向けに設計された、プライバシーを最優先する軽量な音声テキスト化ツールです。ユーザーはキーを押…

#macOS 14+ #Macアプリ #オフライン対応

★ 10 NOASSERTION 2026-06-17

画像生成

GitHub

Cross-Modality-Conditional-Diffusion-Model

このプロジェクトは、T1加重MRI画像とT2加重MRIスキャン間の医療画像モダリティ変換を行う、条件付き拡散モデルの実…

#CLI #GPU必須 #Python

★ 10 MIT 2026-05-13

マルチモーダル

GitHub

MM-FM

MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…

#CLI #GPU必須 #Hugging Face

★ 9 ⑂ 1 MIT 2026-06-12

LLM

GitHub

agent-ready-component

このツールは、Convexバックエンドを利用して、AIエージェントがアプリケーションを効率的に認識・発見できるように…

#CLI #Convex #Node.js

★ 9 NOASSERTION 2026-05-03

音声生成 / TTS

GitHub

vecslide

VecSlideは、SVGスライドとOpusオーディオを同期させた、ベクトルプレゼンテーションフォーマットです。ZIP形式の`.v…

#CLI #HTML #SVG

★ 9 NOASSERTION 2026-04-20

音声生成 / TTS

GitHub

voxlert

Voxlertは、Claude Code、Cursor、OpenAI Codex、pi、OpenClawなどのLLM生成AIコーディングエージェント向けに、ゲー…

#CLI #GPU必須 #LLM連携

★ 9 ⑂ 2 MIT 2026-06-20

画像生成

GitHub

CVQ

このリポジトリは、革新的な画像トークン化手法「Channel-wise Vector Quantization (CVQ)」とその応用である「Chann…

#CLI #GPU必須 #Python

★ 9 MIT 2026-06-01

ASR / 音声認識

GitHub

Premiere-Pro-edit-bibl

Premiere Auto-Editは、話している動画（ロングフォーム・トーク・ライブ）のラフカットを、たった1つのコマンドで自…

#Apple Silicon #CLI #macOS

★ 9 ⑂ 3 MIT 2026-06-15

ASR / 音声認識

GitHub

afrispeech-selector

AfriSpeech Selectorは、142のアフリカ言語にわたる2200時間以上の音声データに簡単にアクセスできるCLIツールです。…

#ASR #CLI #LJSpeech形式

★ 9 ⑂ 5 2026-06-19

画像生成

GitHub

ComfyUI-PlagueKind-Nodes

「ComfyUI-PlagueKind-Nodes」は、ComfyUIユーザー向けに画像とマスクのリサイズを統合し、LoRAの高度なスタッキング…

#AIワークフロー #ComfyUI対応 #Python

★ 9 ⑂ 2 MIT 2026-05-31

マルチモーダル

GitHub

SynCLIP

SynCLIPは、セマンティクス的に同等な表現でも空間的注意が異なるという、オープンボキャブラリー高密度知覚（OVDP）…

#CLIPベース #GPU必須 #Python

★ 9 ⑂ 1 Apache-2.0 2026-06-04

ComfyUI

GitHub

ComfyUI-Subworkflow

ComfyUI-Subworkflowは、ComfyUIの既存ワークフローを再利用可能な「サブワークフロー」として活用するための拡張機…

#ComfyUI対応 #Python #カスタムノード

★ 9 ⑂ 2 GPL-3.0 2026-04-28

ASR / 音声認識

GitHub

find-influencer-skill

このスキルは、AIエージェントが小紅書、抖音、Bilibili、YouTubeなどの複数のプラットフォームでインフルエンサーを…

#AIエージェント #CLI #Python

★ 9 2026-05-07

マルチモーダル

GitHub

mlx-serve

mlx-serveは、Apple Silicon搭載Mac (M1+以降) 向けのローカル推論サーバーです。このツールは、AppleのネイティブML…

#Apple Silicon対応 #CLI #GPU必須

★ 9 ⑂ 1 MIT 2026-06-23