3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
perihelion
Perihelionは、VRChat向けに設計された音声認識(ASR)アプリケーションです。VRChatとOSCを介して連携し、ユーザー…
★ 1 2026-06-15
動画生成
GitHub
LTX-2-Audio-to-Video-Local-XPU
このプロジェクトは、LTX-2 19B AIモデルを利用して、画像と音声トラックからビデオをローカルで生成するツールです…
★ 1 2026-03-20
LLM
GitHub
tesm
TESM(Token-Entangled State Machine)は、状態空間モデルと局所的なエンタングルメントメカニズムを組み合わせた革…
★ 1 MIT 2026-06-08
ComfyUI
GitHub
mefaihomevideoai-worker
本リポジトリは、MEFAI画像から動画へのパイプラインにおけるホーム側のGPUワーカーです。クラウド上で画像から動画…
★ 1 Apache-2.0 2026-06-12
音楽生成
GitHub
anvil-audio
Anvil Audioは、AIオーディオ生成のためのプラグ可能なスタジオツールであり、Stability AIの`stable-audio-tools`を…
★ 1 MIT 2026-05-13
画像生成
GitHub
tome-ai
Tome.aiは、生成AIワークフローを活用し、著者が構想から完成原稿までを作成するのを支援する、プロダクションレベル…
★ 1 2026-05-23
3D / NeRF
GitHub
gsplat-mlx
gsplat-mlxは、Apple Silicon環境で3D Gaussian Splattingを高速に実行・開発するためのコアライブラリです。mlxのC+…
★ 1 MIT 2026-06-25
ASR / 音声認識
GitHub
AI-Voice-Receptionist
AI Voice Receptionistは、Pythonで構築された完全なリアルタイム、フルデュプレックスのAI音声受付システムです。ロ…
★ 1 2026-06-04
マルチモーダル
GitHub
Open-AutoGLM
AIを活用して電話でのモバイルタスクを自動化するスマートアシスタントフレームワークです。AutoGLMを基盤とし、直感…
★ 1 ⑂ 1 Apache-2.0 2026-06-26
3D / NeRF
GitHub
sam-3d-spark
sam-3d-sparkは、MetaのSAM 3D(BodyおよびObjects)モデルをNVIDIA DGX Spark環境(aarch64/CUDA 13)でローカル実…
★ 1 NOASSERTION 2026-05-03
LLM
GitHub
CareerScan
CareerScanは、AIを活用した履歴書分析ツールです。PDF形式の履歴書と職務記述書をアップロードすると、LLaMA 3.3-70…
★ 1 2026-05-13
マルチモーダル
GitHub
fal-ai
fal (fal-ai) は、画像、動画、音声、マルチモーダルな生成AIモデルを超高速で実行できるAPIを提供する生成メディア…
★ 1 2026-06-20
音声生成 / TTS
GitHub
kokoro-tts-ultimate
「Kokoro TTS - Ultimate Edition」は、NVIDIA GPUアクセラレーションを活用した「Kokoro-82M」モデルを特徴とするプ…
★ 1 Apache-2.0 2026-01-09
音声生成 / TTS
GitHub
global-translation
このツールは、Googleの翻訳エンジンとMicrosoft Edge TTSを活用した、AI駆動型のリアルタイム言語翻訳アプリケーシ…
★ 1 2026-06-20
ASR / 音声認識
GitHub
VoiceOfIU
VoiceOfIUは、macOS上で動作するプライベートなローカル音声アシスタントです。ウェイクワード検出、Whisper STTによ…
★ 1 Apache-2.0 2026-06-18
ComfyUI
GitHub
ComfyUI-Image-Compress
ComfyUI用のカスタムノードで、JPEGまたはPNG形式での画像圧縮を可能にします。エンコード品質と出力スケールを独立…
★ 1 ⑂ 1 MIT 2026-04-07
ASR / 音声認識
GitHub
easy-transcriber-stt
easy-transcriber-sttは、Windows向けのローカル音声文字起こしアプリケーションです。スピーチを自身のPC上でテキス…
★ 1 MIT 2026-06-29
音声生成 / TTS
GitHub
KuRL
KuRL AIは、インド系言語に特化した超高速Text-to-Speechエンジンで、ゼロショット音声クローン機能を搭載しています…
★ 1 MIT 2026-02-13
動画生成
GitHub
ComfyUI-AceStep_SFT
ComfyUI-AceStep_SFTは、ComfyUI内でAceStep 1.5 SFTの音楽生成を可能にする単一ノードです。テキストプロンプトから…
★ 1 MIT 2026-06-22
ComfyUI
GitHub
ai-without-fear
「AIWF Research Atlas」は、AI Without Fearプロジェクト向けに設計された、GitHub対応の研究および検索コーパスで…
★ 1 NOASSERTION 2026-06-14
3D / NeRF
GitHub
Painterly-2DGS-For-Unity
「Painterly 2D Gaussian Splatting for Unity」は、Unityエンジン向けに最適化された高速な2D Gaussian Splattingシ…
★ 1 Unlicense 2026-05-25
ASR / 音声認識
GitHub
resilient-stt
Resilient STTは、OpenAI互換のASR(自動音声認識)エンドポイントと連携し、音声ファイルを高精度にテキスト変換す…
★ 1 ⑂ 1 GPL-3.0 2026-05-25
LLM
GitHub
TOKEN_BANK-manage-your-token-usage
TOKENBANKは、AIコーディングアシスタントのトークン使用量と費用を詳細に統計・管理するためのデスクトップアプリケ…
★ 1 2026-06-01
3D / NeRF
GitHub
3DGS-Runpod
3DGS-Runpodは、RunPod GPUインフラストラクチャを活用し、画像セットから3D Gaussian Splatting(.ply形式)を生成…
★ 1 Apache-2.0 2026-03-11