1,826 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
マルチモーダル (165 repos)
カテゴリ「マルチモーダル」のリポジトリ一覧
← 全カテゴリ
マルチモーダル
GitHub VL-Calibration
VL-Calibrationは、大規模視覚言語モデル(LVLMs)の推論における信頼性キャリブレーションを向上させるためのフレー…
★ 20 Apache-2.0 2026-04-13
マルチモーダル
GitHub cognitive-companion
「Cognitive Companion」は、多世代同居家庭の高齢者介護を支援する、プライバシーを最優先したオンプレミスAIシステ…
★ 19 ⑂ 11 AGPL-3.0 2026-05-23
マルチモーダル
GitHub agent-notch
macOSのMシリーズMacBookのノッチ部分に常駐するAIエージェントです。ユーザーは音声で指示を出し、Claude Sonnetが…
★ 18 MIT 2026-05-23
マルチモーダル
GitHub sattxt
SATtxtは、衛星画像を解析するための最先端のビジョン・言語基盤モデルです。DINOv3のビジョンエンコーダとLLM2Vecの…
★ 16 2026-03-21
マルチモーダル GitHub braviadev
このリポジトリは、修士号を持つコンピュータサイエンスの専門家であり、フルスタックエンジニア、そして博士課程の…
★ 15 2026-04-25
マルチモーダル GitHub WikiSeeker
WikiSeekerは、知識ベースの視覚的質問応答(KB-VQA)のために開発された革新的なマルチモーダルRAGフレームワークで…
★ 14 Apache-2.0 2026-04-18
マルチモーダル GitHub Qwen3-VL-Video-Grounding
Qwen3-VL-Video-Groundingは、Qwen3-VL多モーダル画像言語モデルを活用したGradioベースのWebアプリケーションです。…
★ 14 ⑂ 3 Apache-2.0 2026-02-28
マルチモーダル GitHub ScreenMind
ScreenMindは、PCの画面活動をAIでキャプチャ、分析し、検索可能なプライベートAIメモリを構築するツールです。Gemma…
★ 14 ⑂ 1 MIT 2026-05-23
マルチモーダル GitHub WebDroid-Agent
WebDroid Agentは、ブラウザベースのAndroidスマートフォンエージェント実験プロジェクトです。WebUSB/WebADBを介し…
★ 13 ⑂ 4 MIT 2026-05-22
マルチモーダル
GitHub Lumen
Lumenは、チャット、ビジョンQA、テキストから画像生成、画像から画像生成、長文会話圧縮、画像共有、Telegramボット…
★ 11 NOASSERTION 2026-05-22
マルチモーダル GitHub Ka1zen
Ka1zenは、Apple Silicon搭載Mac専用のローカルAIチャットアプリケーションです。アカウント登録やクラウド接続が不…
★ 10 NOASSERTION 2026-05-21
マルチモーダル
GitHub genblaze
Genblazeは、生成AIによるビデオ、画像、オーディオのメディアパイプラインを構築・オーケストレーションするためのP…
★ 10 MIT 2026-05-21
マルチモーダル GitHub JibarOS
JibarOSは、Android 16をベースにAIをプラットフォームの基盤機能として統合したOSのフォークです。テキスト補完や画…
★ 9 Apache-2.0 2026-05-06
マルチモーダル
GitHub VLM-wiki
VLM Wikiは、Karpathy LLM Wikiの概念に基づいた、マルチモーダル対応の個人知識ベースです。画像、動画、音声、テキ…
★ 9 MIT 2026-05-04
マルチモーダル GitHub GalamseyWatch
このツールは、Sentinel-2衛星画像から違法な小規模金採掘(ガラッセイ)を検出するエージェント型地球観測システム…
★ 8 ⑂ 5 MIT 2026-05-05
マルチモーダル
GitHub modalformer-lowlight
このプロジェクト「modalformer-lowlight」は、低照度環境で撮影された画像のノイズ、色の歪み、細部喪失を改善する…
★ 8 ⑂ 2 MIT 2026-05-01
マルチモーダル GitHub Awesome-Efficient-dLLMs
このリポジトリは、「効率的な拡散言語モデル (Efficient Diffusion Language Models)」に関する厳選された優れた論…
★ 8 NOASSERTION 2026-04-24
マルチモーダル GitHub paper-viewer-local-llm
「論文ビューア with Local LLM」は、研究会や学会で発表内容を素早く理解し、質疑応答の準備を支援するWebアプリで…
★ 7 MIT 2026-05-17
マルチモーダル
GitHub DGX_Spark_Unsloth_Lossless_Speedup
本プロジェクトは、NVIDIA DGX Spark上でQwen3.5 (0.8B~27B) モデルのLoRAおよびFull Fine-Tuningを劇的に高速化す…
★ 6 ⑂ 1 MIT 2026-05-19
マルチモーダル GitHub Multimodal-Edge-Node
Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…
★ 5 Apache-2.0 2026-05-01
マルチモーダル GitHub LiteRTLM-Swift-SDK
LiteRTLM Swift SDKは、GoogleのLiteRT-LM(オンデバイス推論エンジン)の非公式Swift SDKです。このツールはGemma 4…
★ 4 ⑂ 2 MIT 2026-05-02
マルチモーダル
GitHub SmolVLM2-Edge-Vision-Agent
SmolVLM2-2.2Bを搭載したエッジ展開可能なビジョンエージェントで、CPUのみのハードウェア(16GB RAM)で動作します…
★ 3 2026-04-27
マルチモーダル GitHub AI-Book-Discovery-App
Perspicuaは、図書館や書店での「選択のパラドックス」を解決するために設計された、高性能なAI駆動型セマンティック…
★ 3 GPL-3.0 2026-05-10
マルチモーダル GitHub goodq4all
GoodQ4Allは、ローカルファーストのマルチモーダル記憶システムで、長期間のビデオ、オーディオ、テキストからの情報…
★ 3 MIT 2026-05-23