マルチモーダル GitHub anything-llm
AnythingLLMは、ドキュメントとのチャットやAIエージェントの利用を可能にするオールインワンのAI生産性向上ツールで…
★ 61.8k ⑂ 6.7k MIT 2026-06-19
ASR / 音声認識 GitHub PaddleSpeech
PaddleSpeechは、PaddlePaddleプラットフォーム上で動作するオープンソースの音声処理ツールキットです。自己教師あ…
★ 12.6k ⑂ 2.0k Apache-2.0 2026-06-21
3D / NeRF GitHub LiveTalking
LiveTalkingは、リアルタイムでインタラクティブなストリーミングデジタルヒューマンを作成・操作するためのツールで…
★ 8.0k ⑂ 1.3k Apache-2.0 2026-06-20
音声生成 / TTS GitHub espeak-ng
eSpeak NGは、Linux、Windows、Androidなど多様なOSに対応するオープンソースのコンパクトなテキスト読み上げシンセ…
★ 6.6k ⑂ 1.2k GPL-3.0 2026-04-27
AIエージェント GitHub CubeSandbox
Cube Sandboxは、AIエージェント向けに設計された高性能で安全なサンドボックスサービスです。RustVMMとKVMに基づい…
★ 6.4k ⑂ 515 NOASSERTION 2026-06-18
ASR / 音声認識 GitHub PaddleX
PaddleX 3.0は、飛桨(PaddlePaddle)フレームワークを基盤とした低コード開発ツールです。200以上の開箱即用な事前…
★ 6.2k ⑂ 1.2k Apache-2.0 2026-06-12
3D / NeRF GitHub meshlab
MeshLabは、3Dスキャンで得られる大規模で非構造化な3D三角メッシュの処理と編集に特化したオープンソースシステムで…
★ 5.7k ⑂ 904 GPL-3.0 2026-06-08
AIエージェント GitHub opencove
OpenCoveは、AIコーディングエージェント(Claude Code、Codexなど)を使用する開発者向けの空間型開発ワークスペー…
★ 1.5k ⑂ 120 MIT 2026-06-19
ComfyUI GitHub RES4LYF
RES4LYFは、ComfyUI向けの先進的な画像生成サンプラーとユーティリティのコレクションです。独自のノイズスケーリン…
★ 1.2k ⑂ 110 NOASSERTION 2026-06-15
音楽生成 GitHub linuxwave
linuxwaveは、Linuxの乱数ジェネレーター`/dev/urandom`から得られるエントロピー(乱数)を基に音楽を生成するCLIツ…
★ 653 ⑂ 22 MIT 2026-06-18
LLM GitHub smfs
smfsは、エージェント向けに設計された高性能なファイルシステムです。ファイル、画像、動画などあらゆるデータを格…
★ 451 ⑂ 34 MIT 2026-06-12
画像生成 GitHub Bonsai-Image-Demo
Bonsai Image Demoは、Apple Silicon (macOS) またはNVIDIA GPU (Linux/Windows) を利用して、ローカルで画像を生成…
★ 444 ⑂ 58 Apache-2.0 2026-06-14
AIエージェント GitHub aiden
Aidenは、プロンプトに基づいてコンピュータを操作する自律型AIエージェントです。ブラウザ制御、ターミナル実行、ワ…
★ 405 ⑂ 77 AGPL-3.0 2026-05-27
ASR / 音声認識 GitHub fcitx5-vinput
fcitx5-vinputは、LinuxのインプットメソッドであるFcitx5向けの多機能な音声入力ツールです。ローカルのオフライン…
★ 276 ⑂ 25 GPL-3.0 2026-06-16
マルチモーダル HF nemotron-ocr-v2
Nemotron OCR v2は、複雑な実写画像や文書画像から文字を高精度かつ高速に抽出する、NVIDIAの商用利用可能な多言語OC…
❤ 206 ↓ 15.1k other 2026-05-22
AIエージェント GitHub facts
av/factsは、AIエージェントを活用した事実駆動開発のためのツールキットです。プロジェクトの仕様を検証可能な「事…
★ 190 ⑂ 8 2026-06-03
ASR / 音声認識 GitHub ChordVox
ChordVox IMEは、あなたの声を最速のキーボードに変える、完全にローカルで動作するAI音声入力ツールです。アイデア…
★ 166 ⑂ 8 MIT 2026-06-13
ASR / 音声認識 GitHub awesome-voice-typing
このプロジェクトは、オープンソースの音声テキスト化ツールと音声入力ツールの厳選されたリストです。Linux、macOS…
★ 136 ⑂ 20 MIT 2026-05-17
マルチモーダル GitHub cc-VisionRouter
cc-VisionRouterは、Claude Code環境で画像非対応のLLMを利用する際に、画像を含むリクエストを自動的にマルチモーダ…
★ 103 MIT 2026-06-07
AIエージェント GitHub aithy
Aithyは、ユーザーのローカルマシン上で安全に動作し、有用なコンテキストを記憶し、データをユーザーの管理下に置く…
★ 88 ⑂ 4 Apache-2.0 2026-05-26
AIエージェント GitHub opendesk
Opendeskは、AIエージェントが人間のようにコンピュータを操作できるようにするためのフレームワークです。スクリー…
★ 80 ⑂ 15 MIT 2026-06-02
AIエージェント GitHub reevesagents
reevesagentsは、AI CLIターミナルとAIエージェントチームを効率的に管理するためのローカルなtmuxベースのワークス…
★ 78 ⑂ 10 NOASSERTION 2026-06-17
LLM GitHub nvim-mcp
nvim-mcpは、AIエージェントが実行中のNeovimセッションに直接アクセスできるようにするMCP(Model Context Protocol…
★ 58 ⑂ 5 MIT 2026-05-19
AIエージェント GitHub agent-workspace-linux
このツールは、AIエージェントがユーザーの物理デスクトップに影響を与えることなく、完全に隔離された隠れたLinuxデ…
★ 55 ⑂ 6 MIT 2026-06-16