GPT 安全测试平台 | 项目资料库 | Logistics and Supply Chain MultiTech R&D Centre


项目简介	使用 GPT 的担忧之一是它可能会受到攻击而产生恶意内容，从而导致错误讯息的传播、舆论操纵和诈欺。在这个专案中，我们强调测试平台在满足基于人工智慧的模型的安全需求方面的重要性。该计画建议专门针对 GPT 攻击创建测试平台。探索的一种重要攻击技术是提示注入，其中精心设计的提示操纵 GPT 忽略指令或执行意外操作。尽管正在发现有关攻击技术的新研究，但针对即时注入攻击的防御仍处于早期阶段。该计画的另一个建议是开发评估框架来衡量即时注入攻击的影响、成功机率和加权弹性得分。可交付成果包括攻击资料集的建构、每次攻击的平均影响指标的测量、攻击成功机率的计算以及加权弹性分数的确定。此外，我们还将评估 3 种常见的 GPT 模型，包括不同国家开发的线上版本和在地化版本。

项目简介

使用 GPT 的担忧之一是它可能会受到攻击而产生恶意内容，从而导致错误讯息的传播、舆论操纵和诈欺。在这个专案中，我们强调测试平台在满足基于人工智慧的模型的安全需求方面的重要性。该计画建议专门针对 GPT 攻击创建测试平台。探索的一种重要攻击技术是提示注入，其中精心设计的提示操纵 GPT 忽略指令或执行意外操作。尽管正在发现有关攻击技术的新研究，但针对即时注入攻击的防御仍处于早期阶段。该计画的另一个建议是开发评估框架来衡量即时注入攻击的影响、成功机率和加权弹性得分。可交付成果包括攻击资料集的建构、每次攻击的平均影响指标的测量、攻击成功机率的计算以及加权弹性分数的确定。此外，我们还将评估 3 种常见的 GPT 模型，包括不同国家开发的线上版本和在地化版本。


项目编号	ITP/051/23LP
研发单位	LSCM 研发中心
项目统筹员	岑松德博士
资助金额	港币二百七十九万
项目週期	2024年2月1日 - 2025年1月31日

项目编号

ITP/051/23LP

研发单位

LSCM 研发中心

项目统筹员

岑松德博士

资助金额

港币二百七十九万

项目週期

2024年2月1日 - 2025年1月31日