ComfyUI GitHub ComfyUI
ComfyUIは、画像、ビデオ、3Dモデル、オーディオなどのコンテンツをAIで生成するための強力かつモジュール式のエンジ…
★ 118.6k ⑂ 13.9k GPL-3.0 2026-06-28
LLM GitHub PaddleOCR
PaddleOCRは、PDFや画像ドキュメントを構造化されたデータ(JSON/Markdown)に変換し、大規模言語モデル(LLM)で活…
★ 84.1k ⑂ 10.9k Apache-2.0 2026-06-26
ASR / 音声認識 GitHub whisper.cpp
whisper.cppは、OpenAIの高性能な音声認識モデルWhisperをC/C++で軽量に実装したライブラリです。依存関係を最小限に…
★ 51.1k ⑂ 5.7k MIT 2026-06-26
ASR / 音声認識 GitHub buzz
Buzzは、OpenAIのWhisperを搭載し、個人用コンピューター上で音声の文字起こしと翻訳をオフラインで実行できる高機能…
★ 19.9k ⑂ 1.5k MIT 2026-06-27
音声生成 / TTS GitHub ebook2audiobook
「ebook2audiobook (E2A)」は、電子書籍(非DRM)を高品質なオーディオブックに変換するツールです。高度なTTSエンジ…
★ 19.3k ⑂ 1.6k Apache-2.0 2026-06-26
マルチモーダル GitHub ms-swift
ms-swiftは、ModelScopeコミュニティが提供する、大規模言語モデル(LLM)およびマルチモーダル大規模言語モデル(ML…
★ 14.6k ⑂ 1.5k Apache-2.0 2026-06-24
画像生成 GitHub openvino
OpenVINO™は、ディープラーニングモデルの最適化とデプロイメントを目的としたオープンソースのソフトウェアツールキ…
★ 10.4k ⑂ 3.3k Apache-2.0 2026-06-23
マルチモーダル GitHub BentoML
BentoMLは、AIアプリケーションとモデル推論のために最適化されたオンラインサービングシステムを構築するためのPyth…
★ 8.7k ⑂ 978 Apache-2.0 2026-06-22
画像生成 GitHub nexa-sdk
NexaSDKは、AIモデルをデバイス上で最小限のエネルギーで高速かつスマートに実行するための高性能ローカル推論フレー…
★ 8.1k ⑂ 1.0k Apache-2.0 2026-06-25
ASR / 音声認識 GitHub OmniVoice-Studio
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。リアルタイムディクテーション、3秒の音声クリップ…
★ 7.7k ⑂ 1.2k NOASSERTION 2026-06-28
ASR / 音声認識 GitHub vibe
Vibeは、OpenAI Whisper技術を利用してオーディオやビデオをオフラインで高精度に文字起こしするツールです。データ…
★ 6.6k ⑂ 427 MIT 2026-05-01
画像生成 GitHub stable-diffusion.cpp
stable-diffusion.cppは、Diffusionモデル(SD、Flux、Wanなど)の推論を純粋なC/C++で実行するための超軽量ライブラ…
★ 6.4k ⑂ 679 MIT 2026-06-26
ASR / 音声認識 GitHub PaddleX
PaddleX 3.0は、飛桨(PaddlePaddle)フレームワークを基盤とした低コード開発ツールです。200以上の開箱即用な事前…
★ 6.2k ⑂ 1.2k Apache-2.0 2026-06-25
ASR / 音声認識 GitHub silero-models
Silero Modelsは、事前学習済みのテキスト読み上げ(TTS)モデルを開発者向けに提供するライブラリです。このツール…
★ 6.0k ⑂ 366 NOASSERTION 2026-06-04
LLM GitHub whichllm
「whichllm」は、ユーザーのコンピューターハードウェア(GPU/CPU/RAM)を自動検出し、その環境で最も性能を発揮する…
★ 5.2k ⑂ 279 MIT 2026-06-24
3D / NeRF GitHub brush
Brushは、Gaussian splattingを活用した3D再構築エンジンです。macOS、Windows、Linux、Android、Webブラウザなど、…
★ 4.8k ⑂ 273 Apache-2.0 2026-06-24
AIエージェント GitHub awesome-opensource-ai
このリポジトリは、オープンソースのAIプロジェクト、モデル、ツール、インフラストラクチャを厳選したリストです。P…
★ 4.0k ⑂ 466 CC0-1.0 2026-06-28
音声生成 / TTS GitHub Chatterbox-TTS-Server
Chatterbox TTS Serverは、オープンソースのChatterbox TTSモデル(オリジナル、多言語、高速なTurbo版)をセルフホ…
★ 1.3k ⑂ 315 MIT 2026-05-26
マルチモーダル HF YOLOv8
Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…
❤ 370 ↓ 9.3k agpl-3.0 2026-06-26
音声生成 / TTS GitHub kokoclone
KokoCloneは、Kokoro-ONNXを基盤とする高速な多言語音声クローンシステムです。短い音声サンプルからリアルタイムで…
★ 151 ⑂ 23 Apache-2.0 2026-04-19
ComfyUI GitHub ComfyUI-FFmpeg
ComfyUI-FFmpegは、FFmpegの一般的な機能をComfyUIのカスタムノードとして提供し、ユーザーがComfyUI上で様々な動画…
★ 146 ⑂ 21 Apache-2.0 2026-05-02
音楽生成 GitHub VODER
VODERは、ローカルで動作し、無料で利用できるプロフェッショナルグレードの音声処理ツールです。音声認識、テキスト…
★ 119 ⑂ 11 AGPL-3.0 2026-06-20
ASR / 音声認識 GitHub subforge
SubForgeは、動画字幕制作を再現性のあるAIパイプラインに変えるために設計されたRust製のコマンドラインインターフ…
★ 93 ⑂ 10 MIT 2026-06-01
AIエージェント GitHub aithy
Aithyは、ユーザーのローカルマシン上で安全に動作し、有用なコンテキストを記憶し、データをユーザーの管理下に置く…
★ 91 ⑂ 4 Apache-2.0 2026-05-26