隨著現在的主流大模型都能輕松通過圖靈測試,這個持續了數十年的標準開始逐漸過時。奧特曼和量子計算之父David Deutsch討論得出了一個新的圖靈測試2.0標準,可以更好地衡量究竟怎樣AI才算擁有真正的智能。
在過去的一年里,如果你還在用圖靈測試來評判一款大模型是否聰明,那可能已經有點跟不上節奏了。
從GPT-4、Claude 2、Gemini、LLaMA 3開始的這些模型,已經可以輕輕松松在圖靈測試中拿到通行證。
有研究者甚至表示:圖靈測試已經過時了。
只要模型在網上混得久一點、見多識廣一點,就能騙過絕大多數人類評審。
問題是:一臺會說話的機器,真的代表它理解你說的話嗎?
在最近的Axel Springer頒獎典禮上,奧特曼和量子物理學家David Deutsch正面交鋒,提出了一個新標準。

他們的對話中,一個大膽的提議浮出水面——圖靈測試2.0。