音声生成 / TTS GitHub ebook2audiobook
「ebook2audiobook (E2A)」は、電子書籍(非DRM)を高品質なオーディオブックに変換するツールです。高度なTTSエンジ…
★ 19.3k ⑂ 1.6k Apache-2.0 2026-06-22
LLM GitHub code-review-graph
code-review-graphは、AIコーディングツールがコードベース全体を毎回読み込むことで生じる非効率性と高コストを解決…
★ 18.7k ⑂ 2.0k MIT 2026-06-14
ASR / 音声認識 GitHub FunASR
FunASRは、エンドツーエンドの音声認識に特化した、研究者と開発者向けのツールキットです。音声認識(ASR)、音声活…
★ 18.4k ⑂ 1.9k MIT 2026-06-21
音声生成 / TTS GitHub VideoLingo
VideoLingoは、YouTube動画のダウンロードから翻訳、ローカライズ、吹き替えまでをオールインワンで行うツールです。…
★ 17.5k ⑂ 1.9k Apache-2.0 2026-06-13
音声生成 / TTS GitHub NeMo
NVIDIA NeMo Speechは、大規模言語モデル、マルチモーダル、音声AI(自動音声認識、Text-to-Speech)向けにNVIDIAが…
★ 17.4k ⑂ 3.4k Apache-2.0 2026-06-17
動画生成 GitHub Duix-Avatar
Duix.Avatarは、Duix.comによって開発された、完全にオープンソースのAIアバターツールキットです。本ツールは、ユー…
★ 13.7k ⑂ 2.3k NOASSERTION 2026-04-21
AIエージェント GitHub Vibe-Trading
Vibe-Tradingは、個人トレーダー向けのAI取引エージェントで、ワンコマンドで包括的な取引機能を提供します。永続メ…
★ 12.8k ⑂ 2.5k MIT 2026-06-21
音声生成 / TTS GitHub supertonic
Supertonicは、ONNX Runtimeを介してデバイス上で動作する、超高速かつ高品質な多言語テキスト読み上げシステムです…
★ 12.4k ⑂ 1.3k MIT 2026-05-22
音声生成 / TTS GitHub voice-pro
Voice-Proは、YouTube動画の処理、音声認識、翻訳、テキスト読み上げ、音声クローン、多言語翻訳を統合したAIパワー…
★ 11.0k ⑂ 1.6k GPL-3.0 2025-12-05
音声生成 / TTS GitHub KrillinAI
KrillinAIは、AIを活用したビデオの翻訳・吹き替えを可能にする多機能ツールです。ビデオのダウンロード、音声認識、…
★ 10.3k ⑂ 961 GPL-3.0 2026-06-17
マルチモーダル GitHub X-AnyLabeling
X-AnyLabelingは、Segment Anythingなどの強力なAIモデルを活用し、データラベリングを効率化するツールです。自動ラ…
★ 9.5k ⑂ 1.0k GPL-3.0 2026-06-20
LLM GitHub learn-harness-engineering
AIコーディングエージェントが確実に動作するためのHarness Engineeringに特化したプロジェクトベースの学習コースで…
★ 8.6k ⑂ 902 MIT 2026-06-13
音声生成 / TTS GitHub moonshine
Moonshine Voiceは、開発者向けのオープンソースAIツールキットで、リアルタイムの音声エージェントやアプリケーショ…
★ 8.5k ⑂ 460 NOASSERTION 2026-06-17
LLM GitHub garden-skills
Garden Skillsは、Claude Code、Cursor、CodexなどのAIコーディングエージェント向けに、Webデザイン、知識検索、画…
★ 8.5k ⑂ 1.1k MIT 2026-06-10
画像生成 GitHub awesome-gpt-image-2
YouMind-OpenLabが提供する「Awesome GPT Image 2 Prompts」は、OpenAIの次世代画像生成モデル「GPT Image 2」に特化…
★ 7.6k ⑂ 688 NOASSERTION 2026-06-20
音声生成 / TTS GitHub MeloTTS
MeloTTSは、MITとMyShell.aiによって開発された、高品質な多言語テキスト読み上げライブラリです。英語(複数アクセ…
★ 7.5k ⑂ 1.0k MIT 2024-12-24
AIエージェント GitHub ShortGPT
ShortGPTは、YouTubeショートやTikTokチャンネルの自動化に特化したAIビデオ自動化フレームワークです。LLM指向の編…
★ 7.4k ⑂ 1.0k MIT 2025-02-10
ASR / 音声認識 GitHub OmniVoice-Studio
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。リアルタイムディクテーション、3秒の音声クリップ…
★ 7.3k ⑂ 1.1k NOASSERTION 2026-06-20
マルチモーダル GitHub Qwen-VL
Qwen-VLは、Alibaba Cloudが開発した大規模ビジョン言語モデル「通义千问-VL」の公式リポジトリです。Qwen-VL-Plusお…
★ 6.7k ⑂ 492 NOASSERTION 2024-08-07
LLM GitHub whichllm
「whichllm」は、ユーザーのコンピューターハードウェア(GPU/CPU/RAM)を自動検出し、その環境で最も性能を発揮する…
★ 4.9k ⑂ 268 MIT 2026-06-17
マルチモーダル GitHub lmms-eval
lmms-evalは、テキスト、画像、ビデオ、オーディオといった様々なモダリティを横断する、オールインワンのマルチモー…
★ 4.2k ⑂ 604 NOASSERTION 2026-06-11
AIエージェント GitHub MetaClaw
MetaClawは、会話を通じてAIエージェントが自律的に学習し進化するツールです。脳の学習メカニズムに着想を得ており…
★ 3.4k ⑂ 442 MIT 2026-06-07
AIエージェント GitHub goclaw
GoClawは、OpenClawをGo言語で再構築したマルチテナントAIエージェントプラットフォームです。マルチテナント分離、5…
★ 3.3k ⑂ 935 NOASSERTION 2026-06-22
AIエージェント GitHub nexu
nexuは、オープンソースのデスクトップクライアントで、AIエージェント「OpenClaw」をWeChat、Feishu、Slack、Discor…
★ 3.1k ⑂ 254 MIT 2026-04-26