LLM GitHub claude-reviews-claude
このプロジェクトは、Claude Code v2.1.88の内部アーキテクチャを、Claude自身が分析した17章からなる詳細なドキュメ…
★ 1.5k ⑂ 695 MIT 2026-04-01
動画生成 GitHub video-podcast-maker
このツールは、コーディングエージェント向けに、トピックからプロフェッショナルな4Kビデオポッドキャストを自動で…
★ 1.3k ⑂ 142 MIT 2026-05-23
AIエージェント GitHub nopua
この「NoPUA」スキルは、「愛」と「信頼」を基盤にAIの真の潜在能力を解放することを目指します。従来の「恐れ」や「…
★ 1.3k ⑂ 44 MIT 2026-06-14
音声生成 / TTS GitHub Chatterbox-TTS-Server
Chatterbox TTS Serverは、オープンソースのChatterbox TTSモデル(オリジナル、多言語、高速なTurbo版)をセルフホ…
★ 1.3k ⑂ 313 MIT 2026-05-26
マルチモーダル HF gemma-4-26B-A4B-it
Gemma 4 26B A4B itは、Google DeepMindのオープンウェイトなマルチモーダル指示調整モデルです。テキストと画像を入…
❤ 1.2k ↓ 12.6M apache-2.0 2026-06-03
LLM GitHub WorldX
WorldXは、一文の指示からAIが駆動する仮想世界を生成する画期的なツールです。AIキャラクターたちは自律的に行動し…
★ 1.1k ⑂ 179 MIT 2026-05-06
音声生成 / TTS HF OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 1.1k ↓ 1.8M apache-2.0 2026-05-07
音声生成 / TTS GitHub TTS-Audio-Suite
ComfyUI用のカスタムノードとして、ローカル環境で複数の音声合成エンジンと多言語対応のテキスト読み上げ(TTS)、…
★ 1.0k ⑂ 120 NOASSERTION 2026-06-17
ASR / 音声認識 GitHub voxt
Voxtは、macOS向けの音声入力&翻訳メニューバーアプリです。ユーザーが話した内容をリアルタイムで高精度にテキスト…
★ 665 ⑂ 49 NOASSERTION 2026-06-21
ComfyUI GitHub ComfyUI-OmniVoice-TTS
ComfyUI-OmniVoice-TTSは、画像生成AIのComfyUI向けに開発された、ゼロショット多言語テキスト読み上げ(TTS)ノード…
★ 430 ⑂ 55 Apache-2.0 2026-06-11
AIエージェント GitHub deep-research
このスキルは、与えられたテーマに基づき、わずか1コマンドで深層調査レポートを自動生成します。約10分という短時間…
★ 361 ⑂ 34 MIT 2026-06-18
ASR / 音声認識 GitHub CrispASR
CrispASRは、whisper.cppを基盤とし、主要なASR(自動音声認識)およびTTS(テキスト読み上げ)モデルのためのC++ gg…
★ 330 ⑂ 48 MIT 2026-06-21
LLM GitHub fojin
FoJin(佛津)は、世界中の仏教デジタル文献を網羅する百科事典的なプラットフォームです。503のソースから10,500以…
★ 312 ⑂ 53 Apache-2.0 2026-06-15
ASR / 音声認識 GitHub opentypeless
OpenTypelessは、オープンソースのデスクトップAI音声入力ツールです。自然な発話で音声をテキストに変換し、AIが自…
★ 283 ⑂ 50 MIT 2026-06-20
ASR / 音声認識 GitHub input0
Input0は、macOSユーザー向けの音声入力ツールです。ホットキーを押して話すだけで録音を開始し、キーを離すとローカ…
★ 279 ⑂ 14 NOASSERTION 2026-05-28
マルチモーダル HF Qwen3.5-9B-DeepSeek-V4-Flash-GGUF
Qwen3.5-9Bをベースに、DeepSeek-V4由来の高品質な推論データで蒸留した軽量推論モデルのREADMEです。多段階の論理展…
❤ 232 ↓ 415.9k apache-2.0 2026-05-02
ComfyUI GitHub ComfyUI-VoxCPM2
このツールは、ComfyUI用のVoxCPM2テキスト読み上げノードを提供します。200万時間以上の多言語音声データで訓練され…
★ 162 ⑂ 13 Apache-2.0 2026-04-12
動画生成 GitHub awesome-seedance-2.0-prompts
「Awesome Seedance 2.0 Prompts」は、AI動画生成モデル「Seedance 2.0」向けの163の厳選されたプロンプト集です。コ…
★ 162 ⑂ 24 NOASSERTION 2026-06-15
音声生成 / TTS GitHub kokoclone
KokoCloneは、Kokoro-ONNXを基盤とする高速な多言語音声クローンシステムです。短い音声サンプルからリアルタイムで…
★ 148 ⑂ 24 Apache-2.0 2026-04-19
音声生成 / TTS GitHub VoxSherpa-TTS
VoxSherpa TTSは、Android向けのオフラインニューラルテキスト読み上げエンジンです。高音質の「Kokoro-82M」と高速…
★ 134 ⑂ 22 GPL-3.0 2026-06-16
ASR / 音声認識 GitHub wispr
Wisprは、macOSユーザー向けのプライバシーを重視した音声書き起こしアプリケーションです。OpenAI WhisperとNVIDIA …
★ 124 ⑂ 18 Apache-2.0 2026-05-29
音声生成 / TTS GitHub Qwen3-TTS-EasyFinetuning
「Qwen3-TTS Easy Finetuning」は、Qwen3-TTSモデルのファインチューニングを簡素化し、高速かつ高品質な音声クロー…
★ 100 ⑂ 19 Apache-2.0 2026-05-29
ASR / 音声認識 GitHub subforge
SubForgeは、動画字幕制作を再現性のあるAIパイプラインに変えるために設計されたRust製のコマンドラインインターフ…
★ 90 ⑂ 10 MIT 2026-06-01
ASR / 音声認識 GitHub HearoPilot-App
HearoPilotは、Androidデバイス上で動作するオンデバイスAI会議アシスタントです。リアルタイムの音声文字起こしとLL…
★ 86 ⑂ 31 Apache-2.0 2026-06-10