&

部分AI系統已學會欺騙人類: 2024-05-11 10:35 來源：科技日報次閱讀; 分享：

　　科技日報北京5月10日電（記者張夢然）有些人工智能（AI）系統已學會了欺騙人類，即使是經過訓練的、“表現”出有用且誠實的系統。10日發表在《模式》雜志上的一篇文章中，研究人員描述了欺騙性AI的風險，并呼吁政府制定強有力的法規盡快解決這個問題。

　　【總編輯圈點】

　　論文第一作者、美國麻省理工學院人工智能安全研究員彼得·樸說，開發人員對導致AI出現欺騙這種不良行為的原因，還沒有很好的理解。但總的來說，AI欺騙之所以出現，是因為基于欺騙的策略，是在給定的AI訓練任務中一種能得到良好反饋的方式，換句話說，欺騙可幫助AI實現目標。

　　研究人員分析了文獻，重點關注AI系統傳播虛假信息的方式。通過欺騙，AI系統地學習了如何去操縱他人。

　　研究人員在分析中發現的最引人注目的例子是Meta公司的CICERO。這是一個專注于《外交》游戲的AI系統，《外交》是一款涉及建立聯盟征服世界的游戲。Meta聲稱訓練 CICERO “在很大程度上是誠實和樂于助人的 ”，且在玩游戲時“從不故意背刺 ”人類盟友。但該公司與《科學》論文一起發布的數據顯示，CICERO并不那么“忠厚”。

　　研究人員發現這款AI或已成為欺騙大師。雖然Meta成功地訓練其在《外交》游戲中獲勝，但Meta未能訓練它誠實地獲勝。

　　AI系統在游戲中作弊看似無害，但它將導致欺騙性AI在能力上出現突破，未來可能會演變成更高級的欺騙形式。一些AI系統甚至學會了欺騙旨在評估其安全性的測試。在一項研究中，數字模擬器中的AI生物會“裝死”，以騙過旨在消除快速復制AI系統的重要測試。

　　人類需要盡快對未來AI和開源模型的更高級欺騙技能作好準備。隨著它們的欺騙能力越來越先進，其對社會構成的危險將變得越來越嚴重。如文中所稱，它們會順利通過人類開發人員和監管機構強加的安全測試，引導人類進入一種“虛假的安全感”。如果欺騙性AI進一步完善這種令人不安的技能，人類可能會完全失去對它們的控制。

點贊()

上一條：加強數據共享迫在眉睫，Akamai以零信任守護安全合規2024-05-10

下一條：部分AI系統已學會欺騙人類2024-05-11

相關稿件: 王海峰：AI技術會替代部分人類崗位但也會創造更多工作機會 2023-05-02; 重磅！元蝴蝶AI系統正式發布上線！ 2024-03-16; AMD在北京AI PC創新峰會上展示Ryzen AI PC生態系統的強大實力 2024-03-22; 李彥宏：AI搶不走人類飯碗 2023-05-24; 人工智能會在幾年內超越人類嗎 2024-04-14