概要
SeedLM-405Mは、限られたハードウェアを持つ個人開発者がどこまでLLM開発を達成できるかを示すための実験的な大規模言語モデルです。
405Mパラメータを持つトランスフォーマーベースのモデルで、RTX 3060(12GB VRAM)のコンシューマーGPUのみで約60時間かけて学習されました。
小規模開発者や研究者が、高価な大規模GPUクラスターなしでも独自のLLMを構築・訓練できることを証明することを目的としています。
また、ファインチューニングが可能で、命令セットや会話データを用いてカスタムチャットボットやAIアシスタントとして適応させることができます。
独立した開発者がLLMのトレーニングやファインチューニングの可能性を探るための実践的なプラットフォームを提供します。
互換性・特徴
- Python
- GPU必須
- LLM
- 研究・開発向け
- ファインチューニング可能
基本情報
| ライセンス | NOASSERTION |
| Stars | 2 |
| カテゴリ | LLM |
| アクティビティ | low |