3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub perihelion
Perihelionは、VRChat向けに設計された音声認識(ASR)アプリケーションです。VRChatとOSCを介して連携し、ユーザー…
★ 1 2026-06-15
動画生成 GitHub LTX-2-Audio-to-Video-Local-XPU
このプロジェクトは、LTX-2 19B AIモデルを利用して、画像と音声トラックからビデオをローカルで生成するツールです…
★ 1 2026-03-20
LLM GitHub tesm
TESM(Token-Entangled State Machine)は、状態空間モデルと局所的なエンタングルメントメカニズムを組み合わせた革…
★ 1 MIT 2026-06-08
ComfyUI GitHub mefaihomevideoai-worker
本リポジトリは、MEFAI画像から動画へのパイプラインにおけるホーム側のGPUワーカーです。クラウド上で画像から動画…
★ 1 Apache-2.0 2026-06-12
音楽生成 GitHub anvil-audio
Anvil Audioは、AIオーディオ生成のためのプラグ可能なスタジオツールであり、Stability AIの`stable-audio-tools`を…
★ 1 MIT 2026-05-13
画像生成 GitHub tome-ai
Tome.aiは、生成AIワークフローを活用し、著者が構想から完成原稿までを作成するのを支援する、プロダクションレベル…
★ 1 2026-05-23
3D / NeRF GitHub gsplat-mlx
gsplat-mlxは、Apple Silicon環境で3D Gaussian Splattingを高速に実行・開発するためのコアライブラリです。mlxのC+…
★ 1 MIT 2026-06-25
ASR / 音声認識 GitHub AI-Voice-Receptionist
AI Voice Receptionistは、Pythonで構築された完全なリアルタイム、フルデュプレックスのAI音声受付システムです。ロ…
★ 1 2026-06-04
マルチモーダル GitHub Open-AutoGLM
AIを活用して電話でのモバイルタスクを自動化するスマートアシスタントフレームワークです。AutoGLMを基盤とし、直感…
★ 1 ⑂ 1 Apache-2.0 2026-06-26
3D / NeRF GitHub sam-3d-spark
sam-3d-sparkは、MetaのSAM 3D(BodyおよびObjects)モデルをNVIDIA DGX Spark環境(aarch64/CUDA 13)でローカル実…
★ 1 NOASSERTION 2026-05-03
LLM GitHub CareerScan
CareerScanは、AIを活用した履歴書分析ツールです。PDF形式の履歴書と職務記述書をアップロードすると、LLaMA 3.3-70…
★ 1 2026-05-13
マルチモーダル GitHub fal-ai
fal (fal-ai) は、画像、動画、音声、マルチモーダルな生成AIモデルを超高速で実行できるAPIを提供する生成メディア…
★ 1 2026-06-20
音声生成 / TTS GitHub kokoro-tts-ultimate
「Kokoro TTS - Ultimate Edition」は、NVIDIA GPUアクセラレーションを活用した「Kokoro-82M」モデルを特徴とするプ…
★ 1 Apache-2.0 2026-01-09
音声生成 / TTS GitHub global-translation
このツールは、Googleの翻訳エンジンとMicrosoft Edge TTSを活用した、AI駆動型のリアルタイム言語翻訳アプリケーシ…
★ 1 2026-06-20
ASR / 音声認識 GitHub VoiceOfIU
VoiceOfIUは、macOS上で動作するプライベートなローカル音声アシスタントです。ウェイクワード検出、Whisper STTによ…
★ 1 Apache-2.0 2026-06-18
ComfyUI GitHub ComfyUI-Image-Compress
ComfyUI用のカスタムノードで、JPEGまたはPNG形式での画像圧縮を可能にします。エンコード品質と出力スケールを独立…
★ 1 ⑂ 1 MIT 2026-04-07
ASR / 音声認識 GitHub easy-transcriber-stt
easy-transcriber-sttは、Windows向けのローカル音声文字起こしアプリケーションです。スピーチを自身のPC上でテキス…
★ 1 MIT 2026-06-29
音声生成 / TTS GitHub KuRL
KuRL AIは、インド系言語に特化した超高速Text-to-Speechエンジンで、ゼロショット音声クローン機能を搭載しています…
★ 1 MIT 2026-02-13
動画生成 GitHub ComfyUI-AceStep_SFT
ComfyUI-AceStep_SFTは、ComfyUI内でAceStep 1.5 SFTの音楽生成を可能にする単一ノードです。テキストプロンプトから…
★ 1 MIT 2026-06-22
ComfyUI GitHub ai-without-fear
「AIWF Research Atlas」は、AI Without Fearプロジェクト向けに設計された、GitHub対応の研究および検索コーパスで…
★ 1 NOASSERTION 2026-06-14
3D / NeRF GitHub Painterly-2DGS-For-Unity
「Painterly 2D Gaussian Splatting for Unity」は、Unityエンジン向けに最適化された高速な2D Gaussian Splattingシ…
★ 1 Unlicense 2026-05-25
ASR / 音声認識 GitHub resilient-stt
Resilient STTは、OpenAI互換のASR(自動音声認識)エンドポイントと連携し、音声ファイルを高精度にテキスト変換す…
★ 1 ⑂ 1 GPL-3.0 2026-05-25
LLM GitHub TOKEN_BANK-manage-your-token-usage
TOKENBANKは、AIコーディングアシスタントのトークン使用量と費用を詳細に統計・管理するためのデスクトップアプリケ…
★ 1 2026-06-01
3D / NeRF GitHub 3DGS-Runpod
3DGS-Runpodは、RunPod GPUインフラストラクチャを活用し、画像セットから3D Gaussian Splatting(.ply形式)を生成…
★ 1 Apache-2.0 2026-03-11