概要
Qwen3.5-9Bをベースに、Claude 4.6 Opus由来の推論データを蒸留してSFT+LoRAで強化した推論特化モデルです。
`<think>`タグ内で段階的に考え、数理・科学・コーディング・複雑な指示対応を整理して答える設計が特徴で、冗長な思考ループを抑えつつ高密度な推論を行えます。
Unslothを使った学習手順や再現用ガイドも公開されており、推論性能を重視するLLM利用者や、ローカル/Colabでファインチューニングを再現したい初学者〜実践者向けのモデルです。
互換性・特徴
- LLM
- 推論特化
- LoRA
- Unsloth
- CLI
- 英語対応
基本情報
| ライセンス | apache-2.0 |
| Likes | 298 |
| Downloads | 549,194 |
| Pipeline | image-text-to-image |
| カテゴリ | LLM |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF
