概要
Lestro Dataset Generatorは、GoogleのGemini APIを利用し、DevOpsやシステムエンジニアリング分野のLLMファインチューニング向けに、大規模で高品質なトレーニングデータセットを自動生成するPythonスクリプトです。
リアルな技術トラブルシューティングシナリオやシステム設定などを構造化された形式で出力し、既存のデータセットに追記することも可能です。
日々のAPIクォータ制限を考慮し、安全に運用できるよう設計されており、生成中に中断しても進行状況を自動保存し、再開できます。
大量の高品質な技術データ作成に手間を感じるAI開発者や研究者にとって、効率的なデータエンジニアリングパイプラインを提供します。
互換性・特徴
- LLM
- Gemini API
- Python
- CLI
- データ生成
- ファインチューニング
基本情報
| Stars | 1 |
| カテゴリ | LLM |
| アクティビティ | low |
GitHub: https://github.com/Karmin66/Lestro-Dataset-Generator