音声生成 / TTS GitHub Chatterbox-TTS-Server
Chatterbox TTS Serverは、オープンソースのChatterbox TTSモデル(オリジナル、多言語、高速なTurbo版)をセルフホ…
★ 1.3k ⑂ 315 MIT 2026-05-26
ASR / 音声認識 GitHub minutes
Minutesは、会議やボイスメモといった人間の会話を記録し、AIが検索・活用できるオープンソースのプライバシー重視ツ…
★ 1.3k ⑂ 136 MIT 2026-06-28
LLM GitHub fim-one
FIM Oneは、グローバル企業が運用する世界中のSaaSサービスと中国独自のシステム(Feishu、WeComなど)を、単一のAI…
★ 1.3k ⑂ 146 NOASSERTION 2026-06-24
画像生成 GitHub FireRed-Image-Edit
FireRed-Image-Editは、高精度な指示追従、高忠実度な画像生成、優れたアイデンティティの一貫性、シームレスな多要…
★ 1.3k ⑂ 74 Apache-2.0 2026-04-03
ComfyUI GitHub ComfyUI-ReActor
ComfyUI向けの高速・簡単な顔交換ノード集で、画像内の顔を別の顔へ差し替えるワークフローをWeb UI上で構築できます…
★ 1.3k ⑂ 231 GPL-3.0 2026-05-12
AIエージェント GitHub CoreCoder
CoreCoderは、約1,400行のPythonコードで実装された最小限のAIコーディングエージェントです。Claude Codeの主要なア…
★ 1.3k ⑂ 295 MIT 2026-06-23
AIエージェント GitHub evo
evoは、コードベースの自動研究オーケストレーターです。既存のコードを解析し、最適化目標を特定してベンチマークを…
★ 1.3k ⑂ 95 Apache-2.0 2026-06-29
音声生成 / TTS GitHub Twocast
Twocastは、AIを活用して2人対話形式のポッドキャストエピソードを生成するツールです。バイリンガルエピソードや多…
★ 1.3k ⑂ 125 2025-07-01
LLM GitHub future-agi
Future AGIは、LLMやAIエージェントアプリケーションの評価、監視、改善をエンドツーエンドで実現するオープンソース…
★ 1.2k ⑂ 289 Apache-2.0 2026-06-28
音声生成 / TTS GitHub tango
Tangoは、LLM(Flan-T5)によってガイドされる潜在拡散モデル(LDM)を用いた、テキストからオーディオを生成するツ…
★ 1.2k ⑂ 105 NOASSERTION 2025-07-29
LLM GitHub llmwiki
LLM Wikiは、KarpathyのLLM Wikiをオープンソースで実装した情報整理ツールです。ユーザーが持つ研究資料(PDF、ノー…
★ 1.2k ⑂ 198 Apache-2.0 2026-06-29
画像生成 GitHub Lance
LanceはByteDanceが開発した30億パラメータのマルチモーダルAIモデルです。単一フレームワーク内で画像および動画の…
★ 1.2k ⑂ 87 Apache-2.0 2026-06-17
音声生成 / TTS GitHub BigVGAN
BigVGANは、NVIDIAが開発したユニバーサルなニューラルボコーダーであり、ICLR 2023で発表されました。大規模なデー…
★ 1.2k ⑂ 145 MIT 2024-09-05
動画生成 GitHub HunyuanCustom
HunyuanCustomは、画像、音声、ビデオ、テキストといった多様な入力モダリティを活用し、特定の被写体が登場するカス…
★ 1.2k ⑂ 110 NOASSERTION 2025-10-15
AIエージェント GitHub auto-deep-researcher-24×7
「Deep Researcher Agent」は、深層学習の実験を24時間365日自律的に実行するAIエージェントです。ゼロコスト監視、…
★ 1.2k ⑂ 100 Apache-2.0 2026-06-03
ASR / 音声認識 GitHub nightingale
Nightingaleは、AIを活用したカラオケアプリで、ユーザーの音楽ライブラリ内のあらゆる曲をカラオケとして楽しめます…
★ 1.2k ⑂ 83 GPL-3.0 2026-06-08
AIエージェント GitHub cq
cqは、AIエージェントが同じ過ちを繰り返すことを防ぐためのオープンな知識共有標準です。エージェントは学習した知…
★ 1.2k ⑂ 62 Apache-2.0 2026-06-29
ComfyUI GitHub comfyui-inpaint-nodes
ComfyUI向けに高品質なインペイント機能を提供するノード集です。Fooocusインペイントモデル(SDXL対応)、LaMa、MAT…
★ 1.2k ⑂ 74 GPL-3.0 2026-05-31
ComfyUI GitHub ComfyUI-segment-anything-2
このツールは、ComfyUIでSegment Anything 2モデルを使用するためのノードを提供します。現在開発中のPointsEditor機…
★ 1.2k ⑂ 83 Apache-2.0 2025-09-28
AIエージェント GitHub open-codex-computer-use
「open-computer-use」は、AIエージェントやMCPクライアントがmacOS、Linux、Windowsといった多様なOS上でコンピュー…
★ 1.2k ⑂ 123 MIT 2026-06-26
AIエージェント GitHub wuphf
WUPHF(ウーフ)は、AI従業員が協力して作業するための共有オフィス環境を提供します。AI従業員は自身の知識ベースを…
★ 1.2k ⑂ 87 NOASSERTION 2026-06-21
LLM GitHub memory-os
Memory OSは、Hermes Agentに永続的な長期記憶機能を提供する7層構造のメモリオペレーティングシステムです。エージ…
★ 1.2k ⑂ 113 MIT 2026-06-10
音声生成 / TTS GitHub my-translator
「My Translator」は、macOSおよびWindowsに対応したリアルタイム音声翻訳デスクトップアプリケーションです。システ…
★ 1.2k ⑂ 386 MIT 2026-06-17
ComfyUI GitHub RES4LYF
RES4LYFは、ComfyUI向けの先進的な画像生成サンプラーとユーティリティのコレクションです。独自のノイズスケーリン…
★ 1.2k ⑂ 113 NOASSERTION 2026-06-15