3,513 repos GH 3,398 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

マルチモーダル (291 repos)

カテゴリ「マルチモーダル」のリポジトリ一覧

← 全カテゴリ

マルチモーダル
GitHub
kaggle-llm-server
このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。無料のKaggle …
★ 3 ⑂ 4 2026-05-24
マルチモーダル
GitHub
SmolVLM2-Edge-Vision-Agent
SmolVLM2-2.2Bを搭載したエッジ展開可能なビジョンエージェントで、CPUのみのハードウェア(16GB RAM)で動作します…
★ 3 2026-04-27
マルチモーダル
GitHub
browserground
browsergroundは、ハイブリッドAIエージェント向けのローカルUIグラウンディングツールです。スクリーンショットとテ…
★ 3 2026-05-21
マルチモーダル
GitHub
tenderness
tendernessは、テキストと画像から合成かつ決定的なドキュメントを高速でレンダリングするためのPythonライブラリで…
★ 3 Apache-2.0 2026-06-06
マルチモーダル
GitHub
Page-agent-UI
Page-agent-UIは、ウェブページの見た目と操作性を向上させるChrome拡張機能です。UI(ユーザーインターフェース)と…
★ 2 MIT 2026-06-09
マルチモーダル
GitHub
awesome-awesome
本リポジトリは、AI研究の各分野を対象に、「awesome list」、サーベイリポジトリ、学会論文リスト、特定モデルのコ…
★ 2 CC0-1.0 2026-06-08
マルチモーダル
GitHub
gemma-chat-windows
「gemma-chat-windows」は、Electronアプリを通じてGemma 4モデルを利用し、ローカル環境で動作するプライベートなAI…
★ 2 MIT 2026-06-13
マルチモーダル
GitHub
Qwen3.6-27B-AEON-Ultimate-Uncensored-DFlash
このソフトウェアは、高性能なQwen3.6-27B AIモデルをWindows上でローカル実行するためのツールです。最適化されたハ…
★ 2 Apache-2.0 2026-06-14
マルチモーダル
GitHub
aiyeah
AIyeahは、AIアプリケーション開発を簡素化するモジュール型AIプラットフォームです。複数のAIツールやプロバイダー…
★ 2 MIT 2026-05-26
マルチモーダル
GitHub
Awesome-TTT-in-Vision
「Awesome-TTT-in-Vision」は、コンピュータビジョン分野におけるTest-Time Training (TTT)に関する厳選された論文と…
★ 2 Apache-2.0 2026-06-13
マルチモーダル
GitHub
Viz2Speech
Viz2Speechは、インドネシアの視覚障害者のアクセシビリティを向上させるために開発された、画像から音声への変換エ…
★ 2 ⑂ 1 MIT 2026-05-16
マルチモーダル
GitHub
mimo-code
MiMo-Codeは、MiMoモデルファミリー専用のネイティブデスクトップコーディングエージェントです。WindowsおよびmacOS…
★ 2 MIT 2026-06-11
マルチモーダル
GitHub
OpenEMMA-UI
OpenEMMA-UIは、Windowsデスクトップ向けに設計された、リアルタイムCARLA環境での自律走行テスト用アプリケーション…
★ 2 Apache-2.0 2026-06-09
マルチモーダル
GitHub
TimeMachine
AI Time Machineは、テキスト、画像、音声、Webリンクなど多種多様な個人的な記憶をキャプチャし、マルチモーダルAI…
★ 2 MIT 2026-06-05
マルチモーダル
GitHub
multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 2 MIT 2026-05-13
マルチモーダル
GitHub
kmetbench-release
K-MetBenchは、気象学における専門家の推論、地域性、マルチモダリティを詳細に評価するための多次元ベンチマークで…
★ 2 MIT 2026-05-24
マルチモーダル
GitHub
sentra-rag-failure-modes
このリポジトリは、Googleの最新マルチモーダル埋め込みモデル`gemini-embedding-2`の経験的失敗モードと幾何学的特…
★ 2 MIT 2026-05-08
マルチモーダル
GitHub
CaptionEvalKit-for-VLMs
CaptionEvalKit-for-VLMsは、VLM(Visual Language Model)向け画像キャプション評価を再現性高く、オールインワンで…
★ 2 BSD-3-Clause-Clear 2026-06-13
マルチモーダル
GitHub
omni-retrieval
omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…
★ 2 Apache-2.0 2026-06-08
マルチモーダル
GitHub
ORION
ORIONは、低軌道衛星向けの自律型トリアージシステムです。Raspberry Pi 5に最適化されたVision-Language Model (VLM…
★ 2 ⑂ 1 2026-05-19
マルチモーダル
GitHub
Crucible
Crucibleは、ロボットのデモンストレーションデータを評価・キュレーションするための多軸VLM(Vision-Language Mode…
★ 2 MIT 2026-05-10
マルチモーダル
GitHub
deep-video-watcher
Deep Video Watcherは、AIを活用したマルチモーダルな動画分析・編集インテリジェンスエンジンです。多数の動画コン…
★ 2 2026-05-12
マルチモーダル
GitHub
alpamayo-trace
この「alpamayo-trace」は、NVIDIA Alpamayo R1(Vision-Language-Actionモデル)とQwen2.5-VL(Vision-Languageモデ…
★ 2 Apache-2.0 2026-05-08
マルチモーダル
GitHub
MagikaDocumentFromPixel
このツールは、Magikaに触発された軽量な画像品質ゲートで、画像を「シャープ」、「ぼやけ」、「不確実」のいずれか…
★ 2 MIT 2026-04-27