AIエージェント GitHub Photo-agents
Photo Agentsは、視覚情報に基づいてPCを操作する自律進化型エージェントです。画面上の情報を認識し、推論し、行動…
★ 845 ⑂ 23 MIT 2026-05-18
マルチモーダル GitHub claude-video-vision
このツールは、AnthropicのAIであるClaudeに動画の視聴と理解能力を付与するClaude Codeプラグインです。ffmpegを用…
★ 836 ⑂ 96 MIT 2026-05-18
AIエージェント GitHub get-it
「Get It.」は、PDFを「測定可能な理解度マップ」へと変換する革新的な学習支援ツールです。デジタルテキストベース…
★ 830 ⑂ 97 Apache-2.0 2026-06-12
ComfyUI GitHub locally-uncensored
「Locally Uncensored」は、テキスト、画像、動画の生成をすべてローカル環境で実行できるデスクトップAIアプリケー…
★ 824 ⑂ 118 NOASSERTION 2026-06-22
3D / NeRF GitHub OpenWorldLib
OpenWorldLibは、高度なワールドモデル開発のための統合コードベースです。知覚、相互作用、長期記憶機能を核とし、…
★ 824 ⑂ 43 Apache-2.0 2026-06-11
マルチモーダル HF Qwen3.6-27B-GGUF
Qwen3.6-27B-GGUFは、Qwen3.6-27Bをもとにしたオープンウェイトの大規模言語・視覚対応モデルで、コード生成、リポジ…
❤ 823 ↓ 555.2k apache-2.0 2026-04-22
AIエージェント GitHub swapper-toolkit
Swapper AI Agent Toolkitは、AIエージェントやコーディングアシスタント向けの決済レイヤーです。資金の入金、トー…
★ 817 ⑂ 33 MIT 2026-04-07
AIエージェント GitHub codex-autoresearch
Codex Autoresearchは、Codexの「より良くする」という指示を測定可能な改善ループに変換するためのCodexプラグイン…
★ 815 ⑂ 59 Apache-2.0 2026-06-22
AIエージェント GitHub OpenSwarm
OpenSwarmは、Claude、GPT、Codex、そしてOllamaやLMStudio、llama.cppといったローカルモデルを含む複数のAIエージ…
★ 814 ⑂ 140 MIT 2026-06-29
AIエージェント GitHub Fusion
Fusionは、自然言語でのタスク記述からプロダクションコード生成までを自動化するマルチノードエージェントオーケス…
★ 805 ⑂ 94 MIT 2026-06-27
動画生成 GitHub Causal-Forcing
「Causal Forcing」およびその改良版「Causal Forcing++」は、因果ODEや因果Consistency Distillationを活用し、高品…
★ 803 ⑂ 46 Apache-2.0 2026-06-17
音楽生成 GitHub genmusic_demo_list
このGitHubリポジトリは、自動音楽生成の研究領域における最新のデモウェブサイトを集めたリンク集です。歌詞からボ…
★ 790 ⑂ 59 2026-05-20
音声生成 / TTS GitHub Patter
Patterは、AIエージェントに電話番号を与え、電話通話機能を統合するためのオープンソースSDKです。PythonおよびType…
★ 784 ⑂ 82 MIT 2026-06-23
AIエージェント GitHub CORAL
CORALは、自律的なAIエージェント組織のための堅牢で軽量なインフラストラクチャです。実験実行、知識共有、ソリュー…
★ 764 ⑂ 99 Apache-2.0 2026-06-29
動画生成 GitHub Text-To-Video-AI
この「Text To Video AI」ツールは、AIを活用してテキストプロンプトから高品質な動画を自動生成します。YouTube Sho…
★ 759 ⑂ 294 MIT 2026-06-16
AIエージェント GitHub re_gent
re_gentは、AIエージェントの活動をバージョン管理するためのツールです。エージェントが実行した操作、各コード行が…
★ 758 ⑂ 54 Apache-2.0 2026-06-27
音楽生成 GitHub open-webui-tools
Open WebUI Toolsは、Open WebUIインスタンスを強力なAIワークステーションへと進化させるモジュラーツールキットで…
★ 754 ⑂ 69 MIT 2026-06-02
AIエージェント GitHub claude-replay
AIコーディングエージェント(Claude Code、Cursor、Codex CLI、Gemini CLI、OpenCode)のセッションログを、インタ…
★ 736 ⑂ 45 MIT 2026-06-02
LLM GitHub OPD
このツールは、大規模言語モデル(LLM)のオンポリシー蒸留(OPD)のメカニズムとダイナミクスを系統的に調査する研…
★ 736 ⑂ 47 2026-06-29
AIエージェント GitHub OpenOSINT
OpenOSINTは、AIを搭載したOSINT(オープンソースインテリジェンス)エージェントです。対話型REPL(Read-Eval-Print…
★ 734 ⑂ 115 MIT 2026-06-21
AIエージェント GitHub kanwas
Kanwasは、AI作業に特化したマルチプレイヤーワークスペースです。チームとAIエージェントが共同でドキュメント、証…
★ 733 ⑂ 99 NOASSERTION 2026-05-06
音声生成 / TTS GitHub CloneTTS
CloneTTSは、Androidデバイス上で動作する軽量でオフライン対応のテキスト読み上げ(TTS)エンジンです。1〜3秒の音…
★ 719 ⑂ 20 2026-06-17
LLM GitHub wesight
WeSightは、ローカルのAIエージェント向けのオープンソースデスクトップ制御コンソールです。Claude Code、Codex、Op…
★ 712 ⑂ 176 MIT 2026-06-24
音声生成 / TTS GitHub vui
Vuiは、WebRTCストリーミング、faster-whisper ASR、ローカルLLM、Vui Nano TTSを組み合わせたリアルタイム音声アシ…
★ 707 ⑂ 73 NOASSERTION 2026-06-12