3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

jailbreak_llms

★ 3.7k ⑂ 321 MIT 更新: 2024-12-24 GitHubで見る →

概要

このプロジェクトは、大規模言語モデル(LLM)における「in-the-wild」脱獄プロンプトに関する研究データセットを提供します。

Reddit、Discord、ウェブサイト、オープンソースデータセットから収集された15,140のプロンプト(うち1,405が脱獄プロンプト)を含み、これは最大級のコレクションです。

LLMの安全性や脆弱性、悪用メカニズムを研究する学術・セキュリティ関係者を主な対象としています。

このデータセットは、LLMの堅牢性評価と防御策開発に貢献することを目指しています。

互換性・特徴

  • データセット
  • LLM研究
  • 研究用
  • Python
  • HuggingFace対応

基本情報

ライセンスMIT
Stars3,717
Forks321
カテゴリLLM
アクティビティmid

最新のissue

GitHub: https://github.com/verazuo/jailbreak_llms