星期三, 7月 02, 2025

ChatGPT 比不上有 40 年歷史的數位口袋棋遊戲

 https://www.techradar.com/computing/artificial-intelligence/chatgpt-is-no-match-for-a-40-year-old-digital-pocket-chess-game-and-i-bet-garry-kasparov-would-be-pleased

AI示意圖

文章記錄了作者(一位資深棋手)進行的一項實驗:將OpenAI的ChatGPT-4o與一台近四十年前(1986年)的Kasparov Pocket Chess電子棋盤遊戲進行對弈。作者充當中間人,負責將老式遊戲的棋步輸入給ChatGPT,並將ChatGPT的棋步在實體棋盤上執行。實驗結果發現,儘管ChatGPT是先進的AI模型,但在對局過程中,它卻頻繁地無法準確記憶和追蹤棋盤上的棋子位置,不斷出現錯誤、誤讀棋步,並需要作者多次修正。最終,這台簡單的40年前的電子棋盤遊戲在最低難度下擊敗了ChatGPT。作者認為,這表明雖然現代AI在廣泛領域表現優異,但在需要精確空間邏輯和狀態追蹤的非線性複雜任務(如西洋棋)上,它們可能不如專門為此設計的老式專用系統。

文章的發現非常有趣,也引人深思。在一片關於現代AI(特別是大型語言模型如ChatGPT)強大能力和潛力的討論聲中,看到一個將近40年前的、專門為西洋棋設計的簡單電子設備,居然能在真實對局中擊敗最先進的通用型AI,這無疑是一個強烈的對比,也是對現今AI能力的「冷靜劑」。 這場對決的結果清楚地說明了當前AI的一個重要局限性:雖然它們擅長處理大量的文本、生成連貫的回應、甚至能「理解」概念,但在需要精確、實時的空間狀態追蹤和複雜非線性邏輯推理時,它們可能力有未逮。文章中描述的ChatGPT頻繁忘記棋子位置、需要作者不斷糾正的情景,恰好揭示了大型語言模型在處理這類任務時,可能存在基礎結構或訓練方式上的不足,它們並非像真正的西洋棋引擎那樣,能建立一個完美內部的棋盤狀態表示。 這也提醒我們,AI的能力是多樣化且有針對性的。Deep Blue能擊敗世界冠軍,是因為它是一個專門為西洋棋設計的、經過大量計算和最佳化的系統。而ChatGPT是為了處理和生成類人語言而訓練的。儘管後者更具通用性,但在特定且嚴謹的任務上,專業化系統可能仍然擁有優勢。這篇文章為我們提供了一個很好的視角,去看待不同世代和不同類型AI的獨特優勢與局限性,也強調了在看待AI能力時,需要區分通用智能與特定任務智能。

沒有留言:

張貼留言