3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識

GitHub

perihelion

Perihelionは、VRChat向けに設計された音声認識（ASR）アプリケーションです。VRChatとOSCを介して連携し、ユーザー…

#GPU対応 #OSC対応 #VRChat連携

★ 1 2026-06-15

動画生成

GitHub

LTX-2-Audio-to-Video-Local-XPU

このプロジェクトは、LTX-2 19B AIモデルを利用して、画像と音声トラックからビデオをローカルで生成するツールです…

#AIモデル #CLI #GPU必須

★ 1 2026-03-20

LLM

GitHub

tesm

TESM（Token-Entangled State Machine）は、状態空間モデルと局所的なエンタングルメントメカニズムを組み合わせた革…

#CLI #CUDA #GPU必須

★ 1 MIT 2026-06-08

ComfyUI

GitHub

mefaihomevideoai-worker

本リポジトリは、MEFAI画像から動画へのパイプラインにおけるホーム側のGPUワーカーです。クラウド上で画像から動画…

#ComfyUI対応 #Docker #GPU必須

★ 1 Apache-2.0 2026-06-12

音楽生成

GitHub

anvil-audio

Anvil Audioは、AIオーディオ生成のためのプラグ可能なスタジオツールであり、Stability AIの`stable-audio-tools`を…

#CLI #GPU対応 #macOS対応

★ 1 MIT 2026-05-13

画像生成

GitHub

tome-ai

Tome.aiは、生成AIワークフローを活用し、著者が構想から完成原稿までを作成するのを支援する、プロダクションレベル…

#AI活用 #Firebase #Gemini

★ 1 2026-05-23

3D / NeRF

GitHub

gsplat-mlx

gsplat-mlxは、Apple Silicon環境で3D Gaussian Splattingを高速に実行・開発するためのコアライブラリです。mlxのC+…

#Apple Silicon #C++ #CLI

★ 1 MIT 2026-06-25

ASR / 音声認識

GitHub

AI-Voice-Receptionist

AI Voice Receptionistは、Pythonで構築された完全なリアルタイム、フルデュプレックスのAI音声受付システムです。ロ…

#CLI #LLM連携 #Python

★ 1 2026-06-04

マルチモーダル

GitHub

Open-AutoGLM

AIを活用して電話でのモバイルタスクを自動化するスマートアシスタントフレームワークです。AutoGLMを基盤とし、直感…

#AI/ML #GUI #macOS対応

★ 1 ⑂ 1 Apache-2.0 2026-06-26

3D / NeRF

GitHub

sam-3d-spark

sam-3d-sparkは、MetaのSAM 3D（BodyおよびObjects）モデルをNVIDIA DGX Spark環境（aarch64/CUDA 13）でローカル実…

#ComfyUI対応 #Docker #FastAPI

★ 1 NOASSERTION 2026-05-03

LLM

GitHub

CareerScan

CareerScanは、AIを活用した履歴書分析ツールです。PDF形式の履歴書と職務記述書をアップロードすると、LLaMA 3.3-70…

#AIモデル #PDF対応 #Python

★ 1 2026-05-13

マルチモーダル

GitHub

fal-ai

fal (fal-ai) は、画像、動画、音声、マルチモーダルな生成AIモデルを超高速で実行できるAPIを提供する生成メディア…

#AI #GPU必須 #Python

★ 1 2026-06-20

音声生成 / TTS

GitHub

kokoro-tts-ultimate

「Kokoro TTS - Ultimate Edition」は、NVIDIA GPUアクセラレーションを活用した「Kokoro-82M」モデルを特徴とするプ…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-01-09

音声生成 / TTS

GitHub

global-translation

このツールは、Googleの翻訳エンジンとMicrosoft Edge TTSを活用した、AI駆動型のリアルタイム言語翻訳アプリケーシ…

#AI駆動 #Python #Web UI

★ 1 2026-06-20

ASR / 音声認識

GitHub

VoiceOfIU

VoiceOfIUは、macOS上で動作するプライベートなローカル音声アシスタントです。ウェイクワード検出、Whisper STTによ…

#APIキー不要 #Apple Silicon対応 #macOS

★ 1 Apache-2.0 2026-06-18

ComfyUI

GitHub

ComfyUI-Image-Compress

ComfyUI用のカスタムノードで、JPEGまたはPNG形式での画像圧縮を可能にします。エンコード品質と出力スケールを独立…

#ComfyUI対応 #JPEG #PNG

★ 1 ⑂ 1 MIT 2026-04-07

ASR / 音声認識

GitHub

easy-transcriber-stt

easy-transcriber-sttは、Windows向けのローカル音声文字起こしアプリケーションです。スピーチを自身のPC上でテキス…

#GPU推奨 #GUI #OpenAI Whisper対応

★ 1 MIT 2026-06-29

音声生成 / TTS

GitHub

KuRL

KuRL AIは、インド系言語に特化した超高速Text-to-Speechエンジンで、ゼロショット音声クローン機能を搭載しています…

#API #CLI #Docker

★ 1 MIT 2026-02-13

動画生成

GitHub

ComfyUI-AceStep_SFT

ComfyUI-AceStep_SFTは、ComfyUI内でAceStep 1.5 SFTの音楽生成を可能にする単一ノードです。テキストプロンプトから…

#ComfyUI対応 #GPU推奨 #Python

★ 1 MIT 2026-06-22

ComfyUI

GitHub

ai-without-fear

「AIWF Research Atlas」は、AI Without Fearプロジェクト向けに設計された、GitHub対応の研究および検索コーパスで…

#AI/RAGシステム向け #CLI #ComfyUI対応

★ 1 NOASSERTION 2026-06-14

3D / NeRF

GitHub

Painterly-2DGS-For-Unity

「Painterly 2D Gaussian Splatting for Unity」は、Unityエンジン向けに最適化された高速な2D Gaussian Splattingシ…

#.ply #2Dグラフィックス #C#

★ 1 Unlicense 2026-05-25

ASR / 音声認識

GitHub

resilient-stt

Resilient STTは、OpenAI互換のASR（自動音声認識）エンドポイントと連携し、音声ファイルを高精度にテキスト変換す…

#CLI #LLM連携 #OpenAI互換ASR

★ 1 ⑂ 1 GPL-3.0 2026-05-25

LLM

GitHub

TOKEN_BANK-manage-your-token-usage

TOKENBANKは、AIコーディングアシスタントのトークン使用量と費用を詳細に統計・管理するためのデスクトップアプリケ…

#Python #Web UI #Windows

★ 1 2026-06-01

3D / NeRF

GitHub

3DGS-Runpod

3DGS-Runpodは、RunPod GPUインフラストラクチャを活用し、画像セットから3D Gaussian Splatting（.ply形式）を生成…

#3D Gaussian Splatting #API #CLI

★ 1 Apache-2.0 2026-03-11