Detecting LLM-Generated-Text综述

2023-03-09

图片

  • 论文地址:https://github.com/datamllab/The-Science-of-LLM-generated-Text-Detection
  • 相关研究地址:https://github.com/datamllab/awsome-LLM-generated-text-detection/tree/main

大模型生成文本检测现有的方法大致可分为两类:黑盒检测和白盒检测

图片

  • 黑盒检测方法对大型语言模型通常只有 API 级别的访问权限。因此,这类方法依靠于收集人类和机器的文本样本来训练分类模型;
  • 白盒检测,这类方法拥有对大型语言模型的所有访问权限,并且可以通过控制模型的生成行为或者在生成文本中加入水印(watermark)来对生成文本进行追踪和检测。

在实践中,黑盒检测器通常由第三方构建,例如 GPTZero,而白盒检测器通常由大型语言模型开发人员构建。

图片