LLM GitHub hermes-agent
Hermes Agentは、CLIと各種メッセージング基盤を横断して使える自己改善型AIエージェントです。会話履歴検索、永続メ…
★ 198.0k ⑂ 35.1k MIT 2026-06-20
ComfyUI GitHub ComfyUI
ComfyUIは、画像、ビデオ、3Dモデル、オーディオなどのコンテンツをAIで生成するための強力かつモジュール式のエンジ…
★ 118.6k ⑂ 13.9k GPL-3.0 2026-06-28
音声生成 / TTS GitHub Real-Time-Voice-Cloning
このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TT…
★ 60.0k ⑂ 9.4k NOASSERTION 2026-03-09
画像生成 GitHub CycleGAN
CycleGANは、ペアになっていない画像データセット間で画像変換を行うためのソフトウェアです。具体的には、絵画を写…
★ 12.9k ⑂ 2.0k NOASSERTION 2023-09-12
画像生成 GitHub paper2gui
Paper2GUIは、一般ユーザー向けのAIデスクトップアプリケーションツールボックスです。AIペインティング、音声合成、…
★ 10.7k ⑂ 880 MIT 2024-09-20
画像生成 GitHub nexa-sdk
NexaSDKは、AIモデルをデバイス上で最小限のエネルギーで高速かつスマートに実行するための高性能ローカル推論フレー…
★ 8.1k ⑂ 1.0k Apache-2.0 2026-06-25
ASR / 音声認識 GitHub OmniVoice-Studio
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。リアルタイムディクテーション、3秒の音声クリップ…
★ 7.7k ⑂ 1.2k NOASSERTION 2026-06-28
AIエージェント GitHub omnigent
Omnigentは、Claude Code、Codex、Pi、およびユーザーが作成したカスタムエージェントを含む、あらゆるAIエージェン…
★ 5.1k ⑂ 622 Apache-2.0 2026-06-27
動画生成 GitHub FastVideo
FastVideoは、ビデオ生成を高速化するための統合された推論および後処理フレームワークです。最先端のビデオ生成モデ…
★ 3.8k ⑂ 370 Apache-2.0 2026-06-26
AIエージェント GitHub Cairn
Cairnは、起点と目標が与えられた未知の状態空間で経路を探索する汎用的な問題解決エンジンです。AIペネトレーション…
★ 1.8k ⑂ 256 AGPL-3.0 2026-06-02
AIエージェント GitHub open-codex-computer-use
「open-computer-use」は、AIエージェントやMCPクライアントがmacOS、Linux、Windowsといった多様なOS上でコンピュー…
★ 1.2k ⑂ 123 MIT 2026-06-26
AIエージェント GitHub re_gent
re_gentは、AIエージェントの活動をバージョン管理するためのツールです。エージェントが実行した操作、各コード行が…
★ 758 ⑂ 54 Apache-2.0 2026-06-27
LLM GitHub DeepSeek-Code-Whale
Whaleは、DeepSeekに特化したターミナルベースのAIコーディングエージェントです。コードの読み込み、ファイルの編集…
★ 667 ⑂ 48 MIT 2026-06-22
ASR / 音声認識 GitHub freestyle
Freestyleは、音声を瞬時にテキストへ変換するディクテーションアプリです。ホットキーを押しながら話すだけで、カー…
★ 391 ⑂ 51 MIT 2026-06-23
LLM GitHub TurboOCR
TurboOCRは、C++、CUDA、TensorRT技術を活用した高速GPU OCRサーバーです。FUNSDデータセットで270 img/s、疎な画像…
★ 301 ⑂ 36 MIT 2026-06-11
ASR / 音声認識 GitHub kesha-voice-kit
「Kesha Voice Kit」は、ローカル環境で動作する高速な音声処理CLIツールです。LLMエージェントや既存のツールに音声…
★ 58 ⑂ 7 MIT 2026-06-25
画像生成 GitHub Fizgig
Fizgigは、Flux 2 Klein 9B LoRAに特化した統合スタジオです。LoRAのトレーニング、プロファイリング、修復、抽出を…
★ 46 ⑂ 3 Apache-2.0 2026-06-07
音声生成 / TTS GitHub XyvaClaw
xyvaClawは、自己進化するAIアシスタントプラットフォームであり、OpenClawランタイムを深度強化したものです。ユー…
★ 19 ⑂ 2 MIT 2026-04-14
LLM GitHub agent-lens
agent-lensは、Claude Code、Codex CLI、Gemini CLI、Cursor、GitHub Copilotなど複数のAIコーディングエージェント…
★ 18 ⑂ 7 2026-05-13
ASR / 音声認識 GitHub sososo
sososoは、Windows、macOS、Linuxに対応したリアルタイム会議・オーディオ文字起こしアプリケーションです。システム…
★ 18 ⑂ 1 AGPL-3.0 2026-06-17
ASR / 音声認識 GitHub voice-input
本ツールは、Linux/X11を主な対象としたプッシュツートーク方式のグローバル音声入力アプリケーションです。ショート…
★ 7 MIT 2026-06-15
音声生成 / TTS GitHub okay-hermes-voice
「Okay Hermes Voice」は、既存の「Hermes Agent」に「Okay Hermes」というウェイクフレーズを追加し、常に音声で操…
★ 7 NOASSERTION 2026-06-29
ASR / 音声認識 GitHub hobnob
Hobnobは、クラウドやインターネット接続を必要としない、プライバシーを重視したデスクトップ会議メモアプリです。…
★ 7 NOASSERTION 2026-06-12
ASR / 音声認識 GitHub video-podcast-clipper
「Video Podcast Clipper」は、長尺動画からTikTokやYouTube Shorts向けのバイラルな縦型ショートクリップを自動生成…
★ 5 MIT 2026-05-28