3,353 repos GH 3,238 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
マルチモーダル (276 repos)
カテゴリ「マルチモーダル」のリポジトリ一覧
← 全カテゴリ
マルチモーダル GitHub clopinette-ai
ClopinetteAIは、Cloudflare環境で動作するAIエージェントで、永続的なメモリ、多機能なスキルハブ、マルチモーダル…
★ 24 ⑂ 6 2026-05-09
マルチモーダル GitHub proctorai
ProctorAIは、AIを活用したリモート試験監視システムです。顔認証、ウェブカメラ、ブラウザ、音声チェックを通じて試…
★ 23 2026-04-26
マルチモーダル GitHub doubao2api
このプロジェクト「doubao2api」は、Doubao(豆包)クライアントAPIをリバースエンジニアリングしたもので、AIエージ…
★ 22 ⑂ 6 Apache-2.0 2026-05-24
マルチモーダル GitHub ScreenMind
ScreenMindは、PCの画面活動をAIでキャプチャ、分析し、検索可能なプライベートAIメモリを構築するツールです。Gemma…
★ 22 ⑂ 2 MIT 2026-06-02
マルチモーダル GitHub ETCHR
ETCHR (Editing To Clarify and Harness Reasoning)は、質問条件に基づいて推論を意識した画像エディタです。マルチ…
★ 20 NOASSERTION 2026-05-25
マルチモーダル GitHub cognitive-companion
「Cognitive Companion」は、多世代同居家庭の高齢者介護を支援する、プライバシーを最優先したオンプレミスAIシステ…
★ 20 ⑂ 11 AGPL-3.0 2026-05-31
マルチモーダル GitHub agent-notch
macOSのMシリーズMacBookのノッチ部分に常駐するAIエージェントです。ユーザーは音声で指示を出し、Claude Sonnetが…
★ 18 MIT 2026-05-23
マルチモーダル GitHub awesome-gemini-omni
このリポジトリは、Googleの次世代マルチモーダルAIモデル「Gemini Omni」に関する厳選されたリソース集です。テキス…
★ 18 CC0-1.0 2026-05-31
マルチモーダル GitHub sattxt
SATtxtは、衛星画像を解析するための最先端のビジョン・言語基盤モデルです。DINOv3のビジョンエンコーダとLLM2Vecの…
★ 16 2026-03-21
マルチモーダル GitHub lightcone
Lightconeは、Tzafonが開発した視覚言語モデル「Northstar」のためのSDKおよびAPIです。NorthstarはGUI強化学習によ…
★ 16 Apache-2.0 2026-06-01
マルチモーダル GitHub WikiSeeker
WikiSeekerは、知識ベースの視覚的質問応答(KB-VQA)のために開発された革新的なマルチモーダルRAGフレームワークで…
★ 15 Apache-2.0 2026-04-18
マルチモーダル GitHub braviadev
このリポジトリは、修士号を持つコンピュータサイエンスの専門家であり、フルスタックエンジニア、そして博士課程の…
★ 15 2026-04-25
マルチモーダル GitHub gemma-4-abliterated
「gemma-4-abliterated」は、GoogleのGemma 4 31Bモデルから、品質を損なうことなくガードレール(倫理的な制限)を…
★ 14 ⑂ 5 NOASSERTION 2026-04-03
マルチモーダル GitHub GalamseyWatch
このツールは、Sentinel-2衛星画像から違法な小規模金採掘(ガラッセイ)を検出するエージェント型地球観測システム…
★ 13 ⑂ 5 MIT 2026-05-05
マルチモーダル GitHub Lumen
Lumenは、チャット、ビジョンQA、テキストから画像生成、画像から画像生成、長文会話圧縮、画像共有、Telegramボット…
★ 11 NOASSERTION 2026-05-30
マルチモーダル GitHub VLM-wiki
VLM Wikiは、Karpathy LLM Wikiの概念に基づいた、マルチモーダル対応の個人知識ベースです。画像、動画、音声、テキ…
★ 11 MIT 2026-05-04
マルチモーダル GitHub genblaze
Genblazeは、生成AIによるビデオ、画像、オーディオのメディアパイプラインを構築・オーケストレーションするためのP…
★ 10 MIT 2026-05-26
マルチモーダル GitHub JibarOS
JibarOSは、Android 16をベースにAIをプラットフォームの基盤機能として統合したOSのフォークです。テキスト補完や画…
★ 10 Apache-2.0 2026-05-06
マルチモーダル GitHub Ka1zen
Ka1zenは、Apple Silicon搭載Mac専用のローカルAIチャットアプリケーションです。アカウント登録やクラウド接続が不…
★ 10 NOASSERTION 2026-05-26
マルチモーダル GitHub paddleocr-pdf-api
このツールは、PDFをOCR処理し、結果をMarkdown形式で返す自己ホスト型APIです。PaddleOCRとPaddleOCR-VLモデルを搭…
★ 9 ⑂ 2 2026-05-28
マルチモーダル GitHub cppo
CPPO(Contrastive Perception Policy Optimization)は、視覚言語モデル(VLM)エージェントのファインチューニング…
★ 9 2026-05-28
マルチモーダル GitHub DGX_Spark_Unsloth_Lossless_Speedup
本プロジェクトは、NVIDIA DGX Spark上でQwen3.5 (0.8B~27B) モデルのLoRAおよびFull Fine-Tuningを劇的に高速化す…
★ 8 ⑂ 1 MIT 2026-05-19
マルチモーダル GitHub SynCLIP
SynCLIPは、セマンティクス的に同等な表現でも空間的注意が異なるという、オープンボキャブラリー高密度知覚(OVDP)…
★ 8 Apache-2.0 2026-06-04
マルチモーダル GitHub MM-FM
MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…
★ 8 ⑂ 1 MIT 2026-06-12