音声生成 / TTS GitHub agentcall
このツールは、AIエージェントがGoogle Meet、Zoom、Microsoft Teamsなどのビデオ会議に音声、ビデオ、画面共有を通…
★ 103 ⑂ 10 MIT 2026-07-01
マルチモーダル GitHub WebDroid-Agent
WebDroid Agentは、ブラウザベースのAndroidスマートフォンエージェント実験プロジェクトです。WebUSB/WebADBを介し…
★ 103 ⑂ 21 MIT 2026-05-28
AIエージェント GitHub omegacode
omegacodeは、Claude Codeのワークフローをエージェント非依存で実装したツールです。JavaScriptで記述されたワーク…
★ 102 ⑂ 8 MIT 2026-06-12
ComfyUI GitHub XB_ToolBox
XB_ToolBoxは、ComfyUIのAI初心者が効率的にワークフローを構築し、ローカルでAIモデルを実行できるように設計された…
★ 102 ⑂ 5 Apache-2.0 2026-06-26
ComfyUI GitHub ComfyUI-ProportionChanger
ComfyUI向けのカスタムノード集で、DWPose系のKeyPointデータを使って人物やマスコットの体型バランスを柔軟に調整で…
★ 102 ⑂ 6 GPL-3.0 2026-05-29
AIエージェント GitHub cybersentry
CyberSentryは、NVIDIA NIMとLlama 3.1 70Bを搭載した自律型AIセキュリティ監査エージェントです。倫理的なウェブサ…
★ 102 ⑂ 16 MIT 2026-05-03
LLM GitHub Awesome-Item-ID-Gen-RecSys
HKBU-LAGAS/Awesome-Item-ID-Gen-RecSysは、生成型推薦システムにおけるアイテム識別子とアイテムトークン化に関する…
★ 102 ⑂ 2 MIT 2026-06-09
音声生成 / TTS GitHub Qwen3-TTS-EasyFinetuning
「Qwen3-TTS Easy Finetuning」は、Qwen3-TTSモデルのファインチューニングを簡素化し、高速かつ高品質な音声クロー…
★ 102 ⑂ 19 Apache-2.0 2026-05-29
マルチモーダル GitHub cc-VisionRouter
cc-VisionRouterは、Claude Code環境で画像非対応のLLMを利用する際に、画像を含むリクエストを自動的にマルチモーダ…
★ 102 MIT 2026-06-07
ASR / 音声認識 GitHub murmur
Murmurは、macOS向けの無料オフライン音声テキスト変換ツールです。ホットキーを押している間だけ音声を録音し、離す…
★ 101 ⑂ 10 MIT 2026-04-11
画像生成 GitHub HiFi-Inpaint
HiFi-Inpaintは、CVPR 2026で発表された、人間と商品を組み合わせた高品質な画像を生成するための参照ベースのインペ…
★ 101 ⑂ 5 Apache-2.0 2026-06-07
音声生成 / TTS GitHub office-zoo
「OFFICE ZOO」は、9体のAIキャラクターが職場の軋轢や人間関係をシミュレートするゲームです。プレイヤーは人事担当…
★ 101 ⑂ 8 MIT 2026-06-25
LLM GitHub llm-wiki-memory
LLM Wiki Memoryは、AIコーディングエージェントのための永続的なローカルメモリシステムです。エージェントが各セッ…
★ 101 MIT 2026-06-14
ASR / 音声認識 GitHub subarr
subarrは、BazarrやSubgenなどの*arrサブタイトルスタックを連携・管理する品質レイヤーです。メディアライブラリ全…
★ 100 MIT 2026-06-25
ASR / 音声認識 GitHub AirControl
AirControlは、Windows 10/11向けに設計された革新的な空中コントローラーです。MediaPipeを用いたジェスチャー認識…
★ 100 ⑂ 2 Apache-2.0 2026-06-15
音声生成 / TTS GitHub QTranslate
QTranslateは、開発が停止したデスクトップ翻訳ツールをKotlinで再構築した、高速で拡張性の高い翻訳スイートです。…
★ 100 ⑂ 11 MIT 2026-06-22
音声生成 / TTS GitHub feros
Feros Voice Agent OSは、オープンソースでエンタープライズ級の音声AIエージェント開発・運用インフラを提供するプ…
★ 99 ⑂ 17 Apache-2.0 2026-05-25
マルチモーダル HF music-flamingo-hf
Music Flamingoは、楽曲やインストゥルメンタル音源を対象に、ジャンル・テンポ・キー・楽器構成・雰囲気・歌詞や文…
❤ 99 ↓ 16.8k other 2026-04-04
ASR / 音声認識 GitHub claude-code-auto-video-edit
「claude-code-auto-video-edit」は、Claude Codeのコマンドとして機能し、口播やチュートリアル動画のAロール粗編集…
★ 98 ⑂ 11 MIT 2026-04-06
AIエージェント GitHub anansi
Anansiは、敵対的で不安定なウェブ環境に対応するために設計された自己修復型ウェブスクレイパーです。サイトのレイ…
★ 97 ⑂ 17 Apache-2.0 2026-06-21
マルチモーダル HF MOSS-VL-Instruct-0408
MOSS-VL-Instruct-0408は、OpenMOSS系の視覚言語モデルを教師あり微調整したマルチモーダル推論用チェックポイントで…
❤ 97 ↓ 331 apache-2.0 2026-04-22
AIエージェント GitHub oh-my-kimi
oh-my-kimi (OMK)は、Kimi Code専用に開発された検証済みエージェント実行基盤です。Kimi Code CLIを、独立したワー…
★ 97 ⑂ 12 MIT 2026-06-28
LLM GitHub kyros-ai
Kyrosは、AIエージェントに永続的で自己修正能力を持つ記憶を提供するオープンソースのメモリOSです。エピソード、意…
★ 96 ⑂ 2 Apache-2.0 2026-06-24
画像生成 GitHub FlowInOne
FlowInOneは、画像を入力として画像を出力する、ビジョン中心のマルチモーダル画像生成モデルです。Image-in, Image-…
★ 96 ⑂ 5 MIT 2026-06-18