kaggle-llm-server

概要

このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。

無料のKaggle GPUを利用し、ローカルGPUや有料プランなしで、どのマシンからでもアクセスできるOpenAI互換のAPIを提供します。

llama.cppをバックエンドとしてQwen3.6-35B-A3Bモデルを使用し、Cloudflare Tunnel経由で公開されます。

OpenAI互換のAPIのため、LangChainやOpen WebUIなどの既存のクライアントから簡単に接続でき、AIモデルの推論環境を構築したい開発者や研究者に適しています。

GitHub: https://github.com/Tahsine/kaggle-llm-server