GPT 安全測試平台 | 項目資料庫 | Logistics and Supply Chain MultiTech R&D Centre


項目簡介	使用 GPT 的擔憂之一是它可能會受到攻擊而產生惡意內容，從而導致錯誤訊息的傳播、輿論操縱和詐欺。在這個專案中，我們強調測試平台在滿足基於人工智慧的模型的安全需求方面的重要性。該計畫建議專門針對 GPT 攻擊創建測試平台。探索的一種重要攻擊技術是提示注入，其中精心設計的提示操縱 GPT 忽略指令或執行意外操作。儘管正在發現有關攻擊技術的新研究，但針對即時注入攻擊的防禦仍處於早期階段。該計畫的另一個建議是開發評估框架來衡量即時注入攻擊的影響、成功機率和加權彈性得分。可交付成果包括攻擊資料集的建構、每次攻擊的平均影響指標的測量、攻擊成功機率的計算以及加權彈性分數的確定。此外，我們還將評估 3 種常見的 GPT 模型，包括不同國家開發的線上版本和在地化版本。

項目簡介

使用 GPT 的擔憂之一是它可能會受到攻擊而產生惡意內容，從而導致錯誤訊息的傳播、輿論操縱和詐欺。在這個專案中，我們強調測試平台在滿足基於人工智慧的模型的安全需求方面的重要性。該計畫建議專門針對 GPT 攻擊創建測試平台。探索的一種重要攻擊技術是提示注入，其中精心設計的提示操縱 GPT 忽略指令或執行意外操作。儘管正在發現有關攻擊技術的新研究，但針對即時注入攻擊的防禦仍處於早期階段。該計畫的另一個建議是開發評估框架來衡量即時注入攻擊的影響、成功機率和加權彈性得分。可交付成果包括攻擊資料集的建構、每次攻擊的平均影響指標的測量、攻擊成功機率的計算以及加權彈性分數的確定。此外，我們還將評估 3 種常見的 GPT 模型，包括不同國家開發的線上版本和在地化版本。


項目編號	ITP/051/23LP
研發單位	LSCM研發中心
項目統籌員	岑松德博士
資助金額	港幣二百七十九萬
項目週期	2024年2月1日 - 2025年1月31日

項目編號

ITP/051/23LP

研發單位

LSCM研發中心

項目統籌員

岑松德博士

資助金額

港幣二百七十九萬

項目週期

2024年2月1日 - 2025年1月31日