3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

jailbreak_llms

★ 3.7k ⑂ 321 MIT 更新: 2024-12-24 GitHubで見る →

#HuggingFace対応 #LLM研究 #Python #データセット #研究用

概要

このプロジェクトは、大規模言語モデル（LLM）における「in-the-wild」脱獄プロンプトに関する研究データセットを提供します。

Reddit、Discord、ウェブサイト、オープンソースデータセットから収集された15,140のプロンプト（うち1,405が脱獄プロンプト）を含み、これは最大級のコレクションです。

LLMの安全性や脆弱性、悪用メカニズムを研究する学術・セキュリティ関係者を主な対象としています。

このデータセットは、LLMの堅牢性評価と防御策開発に貢献することを目指しています。

互換性・特徴

データセット
LLM研究
研究用
Python
HuggingFace対応

基本情報

ライセンス	MIT
Stars	3,717
Forks	321
カテゴリ	LLM
アクティビティ	mid

最新のissue

📋 ドキュメント改善提案 (更新: 2026-05-15 / 📋 Documentation Enhancement Suggestion)
Update (更新: 2025-09-14)

GitHub: https://github.com/verazuo/jailbreak_llms

← 全リポジトリ一覧へ