1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
マルチモーダル (159 repos)
カテゴリ「マルチモーダル」のリポジトリ一覧
← 全カテゴリ
マルチモーダル
GitHub xhs-note-reader
このツールは、中国のソーシャルメディア「小紅書」の図文ノート(画像とテキスト投稿)を、タイトル、本文、全画像…
★ 1 MIT 2026-05-19
マルチモーダル GitHub control-sci
ControlMindは、MinerUを活用した科学文書インテリジェンスシステムです。生PDFから直接情報を抽出し、科学論文の理…
★ 1 NOASSERTION 2026-05-22
マルチモーダル
GitHub local-asset-gen-mcp
このプロジェクトは、テキストから画像、音楽/音声、音声、さらに画像やテキストから3Dモデルを生成できるローカルAI…
★ 1 GPL-3.0 2026-03-28
マルチモーダル GitHub corpus-mill
「corpus-mill」は、ローカルGPUのみで動作するマルチモーダル動画アノテーションパイプラインです。長尺動画(人物…
★ 1 Apache-2.0 2026-05-06
マルチモーダル
GitHub molmoweb
molmowebは、自然言語で指示することでウェブブラウザを操作し、様々なタスクを自動で実行するデスクトップアプリケ…
★ 1 Apache-2.0 2026-05-23
マルチモーダル GitHub clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
マルチモーダル
GitHub multimodal-clinical-ai
「Multimodal Clinical AI」は、胸部X線画像、臨床メモ、バイタルサインデータを統合的に分析し、14種類のCheXpert分…
★ 1 NOASSERTION 2026-05-20
マルチモーダル
GitHub doubao2api
doubao2apiは、中国のDoubao(豆包)APIをリバースエンジニアリングし、OpenAI互換のRESTサービスとして提供するツー…
★ 1 Apache-2.0 2026-05-22
マルチモーダル GitHub vlm-from-scratch-v4
Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…
★ 1 MIT 2026-05-19
マルチモーダル
GitHub gemma-chat-windows
「gemma-chat-windows」は、Electronアプリを通じてGemma 4モデルを利用し、ローカル環境で動作するプライベートなAI…
★ 1 MIT 2026-05-14
マルチモーダル
GitHub miru
Miru(見る)は、画像やドキュメントに対する質問に対し、モデルがどのように「見ている」かを視覚的に追跡するマル…
★ 1 2026-05-19
マルチモーダル
GitHub XAISDK
xAI Swift SDKは、xAIのGrokやImagineなどのAPIとSwift言語で直接対話するためのgRPCベースの高性能ライブラリです。…
★ 1 Apache-2.0 2026-04-14
マルチモーダル
GitHub PROSOPO
PROSOPOは、公平性とバイアス軽減に重点を置いた包括的な顔認識パイプラインです。最先端の顔検出・認識モデルと高度…
★ 1 2026-05-21
マルチモーダル
GitHub zero-shot-video-classifier
このツールは、ビジョン言語基盤モデル(CLIP、SigLIP 2、X-CLIP)を用いたゼロショット動画分類器です。タスク固有…
★ 1 2026-05-07
マルチモーダル
GitHub swift-lm
Swift LMは、AppleのMLX Swiftを基盤とした大規模言語モデル(LLM)とビジョン言語モデル(VLM)の推論エンジンであ…
★ 1 MIT 2026-05-14