マルチモーダル GitHub anything-llm
AnythingLLMは、ドキュメントとのチャットやAIエージェントの利用を可能にするオールインワンのAI生産性向上ツールで…
★ 62.2k ⑂ 6.8k MIT 2026-06-27
ASR / 音声認識 GitHub PaddleSpeech
PaddleSpeechは、PaddlePaddleプラットフォーム上で動作するオープンソースの音声処理ツールキットです。自己教師あ…
★ 12.6k ⑂ 2.0k Apache-2.0 2026-06-21
3D / NeRF GitHub LiveTalking
LiveTalkingは、リアルタイムでインタラクティブなストリーミングデジタルヒューマンを作成・操作するためのツールで…
★ 8.0k ⑂ 1.3k Apache-2.0 2026-06-20
音声生成 / TTS GitHub espeak-ng
eSpeak NGは、Linux、Windows、Androidなど多様なOSに対応するオープンソースのコンパクトなテキスト読み上げシンセ…
★ 6.6k ⑂ 1.2k GPL-3.0 2026-06-22
ASR / 音声認識 GitHub PaddleX
PaddleX 3.0は、飛桨(PaddlePaddle)フレームワークを基盤とした低コード開発ツールです。200以上の開箱即用な事前…
★ 6.2k ⑂ 1.2k Apache-2.0 2026-06-25
3D / NeRF GitHub meshlab
MeshLabは、3Dスキャンで得られる大規模で非構造化な3D三角メッシュの処理と編集に特化したオープンソースシステムで…
★ 5.7k ⑂ 904 GPL-3.0 2026-06-08
マルチモーダル GitHub MineContext
MineContextは、スクリーンショットやコンテンツ理解を活用し、将来的に多種多様なマルチモーダル情報を統合する、能…
★ 5.4k ⑂ 403 Apache-2.0 2026-05-07
3D / NeRF GitHub LichtFeld-Studio
LichtFeld Studioは、3D Gaussian Splattingシーンの学習、検査、編集、自動化、エクスポートを単一のネイティブアプ…
★ 3.3k ⑂ 368 GPL-3.0 2026-06-26
AIエージェント GitHub opencove
OpenCoveは、AIコーディングエージェント(Claude Code、Codexなど)を使用する開発者向けの空間型開発ワークスペー…
★ 1.5k ⑂ 121 MIT 2026-06-19
音声生成 / TTS GitHub my-translator
「My Translator」は、macOSおよびWindowsに対応したリアルタイム音声翻訳デスクトップアプリケーションです。システ…
★ 1.2k ⑂ 386 MIT 2026-06-17
ComfyUI GitHub RES4LYF
RES4LYFは、ComfyUI向けの先進的な画像生成サンプラーとユーティリティのコレクションです。独自のノイズスケーリン…
★ 1.2k ⑂ 113 NOASSERTION 2026-06-15
AIエージェント GitHub harness-anything
このツール群「cli-anything-wps」は、AIエージェントが複数の主要なアプリケーションをCLI経由で制御するためのハー…
★ 872 ⑂ 49 MIT 2026-06-12
画像生成 GitHub Bonsai-Image-Demo
Bonsai Image Demoは、Apple Silicon (macOS) またはNVIDIA GPU (Linux/Windows) を利用して、ローカルで画像を生成…
★ 444 ⑂ 58 Apache-2.0 2026-06-14
AIエージェント GitHub aiden
Aidenは、プロンプトに基づいてコンピュータを操作する自律型AIエージェントです。ブラウザ制御、ターミナル実行、ワ…
★ 406 ⑂ 78 AGPL-3.0 2026-05-27
ASR / 音声認識 GitHub LiveTranslate
LiveTranslateは、Windows向けのリアルタイム音声翻訳ツールです。システムオーディオとマイク入力をキャプチャし、A…
★ 392 ⑂ 36 MIT 2026-06-20
3D / NeRF GitHub MLSLabsGaussianSplattingRenderer-UE
MLSLabsRenderer-Liteは、MaLanShan Audio & Video Laboratoryが開発したUnreal Engine 5(UE5)向け高性能プラグイ…
★ 221 ⑂ 25 Apache-2.0 2026-06-01
AIエージェント GitHub oysterworkflow
OysterWorkflowは、macOSおよびWindows向けの自律型エージェントに「作業体験」を提供するツールです。人間がコンピ…
★ 200 ⑂ 10 NOASSERTION 2026-06-05
AIエージェント GitHub facts
av/factsは、AIエージェントを活用した事実駆動開発のためのツールキットです。プロジェクトの仕様を検証可能な「事…
★ 197 ⑂ 8 2026-06-03
音楽生成 GitHub portable-hermes-agent
Portable Hermes Agentは、Windows向けのポータブルAIエージェントデスクトップアプリケーションです。インストール…
★ 178 ⑂ 35 MIT 2026-05-22
ASR / 音声認識 GitHub ChordVox
ChordVox IMEは、あなたの声を最速のキーボードに変える、完全にローカルで動作するAI音声入力ツールです。アイデア…
★ 171 ⑂ 9 MIT 2026-06-26
音声生成 / TTS GitHub Artemis
「Shiki Natsume」は、四季夏目をキャラクターとする、完全オフライン動作のAIガールフレンドプロジェクトです。Open…
★ 144 ⑂ 8 NOASSERTION 2026-06-26
ASR / 音声認識 GitHub awesome-voice-typing
このプロジェクトは、オープンソースの音声テキスト化ツールと音声入力ツールの厳選されたリストです。Linux、macOS…
★ 136 ⑂ 20 MIT 2026-05-17
ASR / 音声認識 GitHub MioVRC_Translator
VRChat向けデスクトップリアルタイム翻訳ツール「Mio RealTime Translator」は、VRChatでの国際交流を支援します。主…
★ 127 ⑂ 1 NOASSERTION 2026-06-18
マルチモーダル GitHub cc-VisionRouter
cc-VisionRouterは、Claude Code環境で画像非対応のLLMを利用する際に、画像を含むリクエストを自動的にマルチモーダ…
★ 102 MIT 2026-06-07