Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF

概要

Qwen3.5-9Bをベースに、Claude 4.6 Opus由来の推論データを蒸留してSFT+LoRAで強化した推論特化モデルです。

`<think>`タグ内で段階的に考え、数理・科学・コーディング・複雑な指示対応を整理して答える設計が特徴で、冗長な思考ループを抑えつつ高密度な推論を行えます。

Unslothを使った学習手順や再現用ガイドも公開されており、推論性能を重視するLLM利用者や、ローカル/Colabでファインチューニングを再現したい初学者〜実践者向けのモデルです。

HuggingFace: https://huggingface.co/Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF