中國科學報聚焦:將決策權“外包”給AI靠譜麼?
2021年06月24日08:10

  原標題:中國科學報聚焦:將決策權“外包”給AI靠譜麼?

  很多時候,選擇或決策是困難的。人們不但會面臨諸多兩難選擇,還經常受到情緒、偏好、認知水平等因素的影響。同樣,精準地預測人類的選擇也非易事。在人工智能(AI)和大數據相關技術日新月異的今天,將決策和預測決策結果“外包”給人工智能,也許是個不錯的選擇。

  從個人衣食住行到國際間邦交誓盟,選擇或決策無處不在。

  很多時候,選擇或決策是困難的。人們不但會面臨諸多兩難選擇,還經常受到情緒、偏好、認知水平等因素的影響。同樣,精準地預測人類的選擇也非易事。在人工智能(AI)和大數據相關技術日新月異的今天,將決策和預測決策結果“外包”給人工智能,也許是個不錯的選擇。

  近日,上海大學雪梨工商學院(擬聘)副教授何黎勝和美國賓夕法尼亞大學Sudeep Bhatia合作發表在《科學》的文章,分析了深層神經網絡模擬人類行為特徵,在預測人類決策領域起到的重要作用。

  預測決策行為的瓶頸

  以20%的概率得到100美元,或以80%的概率得到50美元。如果面臨這樣的選擇,你會選擇哪個?

  1979年,諾貝爾經濟學獎獲得者卡尼曼等人提出的前景理論(Prospect Theory)認為,人們在面臨獲得時往往小心翼翼,不願冒風險;在失去時會很不甘心,更容易冒險。人們對損失的痛苦感要大大超過獲得時的快樂感。

  前景理論為人們理解決策者如何組織決策提供了模型,但用前景理論來模擬選擇行為並非沒有缺點。依據前景理論提出新理論的研究者通常會對諸如感知、注意力、記憶和情感等過程,以及干擾和選擇錯誤的原因做出複雜的假設。

  Sudeep Bhatia認為,這些理論本身只在“小數據集”的選擇上進行測試,很少與“大數據集”的已有模型進行比較。考慮到決策研究的跨學科曆史和風險選擇的複雜性,這是不可避免的:決策者很容易憑直覺對預期效用的偏差作出心理解釋。而且,很多新理論模型通常類似於先前發佈的模型,許多理論在基準數據集上高度模仿彼此的預測。

  “儘管新理論模型產生的速度正在加快,但在過去20年中,這些數據集的預測精度幾乎沒有提高。”何黎勝告訴《中國科學報》,“其根本原因是我們的認知系統具有高度複雜性。”

  何黎勝解釋說,風險決策看似簡單。如果問大學生或高中生如何做風險決策,他們中的大多數人可能會說“我們先算出每個選項的期望價值,然後選擇期望價值最高的選項”。

  但風險決策比這複雜得多,受到多種認知和情感因素影響。以往研究者通過考慮這些影響因素,對風險決策行為提出了多種理論解釋模型。

  “近20年來,這種‘小數據集+小模型’的研究範式遇到了瓶頸,主要表現為我們對決策行為的解釋越來越多,但對決策行為的預測能力並沒有顯著提升。”何黎勝說,“這很大程度上取決於常用的‘小數據集’和‘小模型’(與深度神經網絡相比,常規的決策模型都是小模型)研究範式。小數據集不足以支撐像深度神經網絡這樣的‘大模型’,而‘小模型’又不足以支撐決策過程中複雜的認知與情感因素。”

  “大模型”顯身手

  “人工智能技術雖然發展迅速,但計算機不會有人類意義上的感情,短期內也不可能產生人類特徵的情緒。”天津大學自動化學院副教授楊正瓴對《中國科學報》說,“這也許會成為人工智能的優勢,讓它在某些領域比人類做得更好。比如,利用‘大數據’的人工智能決策,的確可以幫助人類減少決策失誤。”

  近年來,不同學科之間的交叉研究提供了新的突破口,特別是行為決策、認知科學和機器學習等領域的交叉。

  “總體而言,在‘小模型’範圍內,前景理論的預測精度是上佳的,是迄今為止預測精度最好的風險決策模型之一。”何黎勝說,“如果我們把視野放到更廣闊的‘大模型’(例如深度神經網絡等機器學習算法),前景理論等小模型的預測劣勢就顯現出來了。”

  不久前,美國學者喬舒亞·彼得森等人發表於《科學》的文章,系統地比較了“大模型”與“小模型”(如前景理論)對風險決策行為的預測能力。結果發現,深度神經網絡的預測能力比前景理論高出幾個能級。研究者首先針對10000多個不同的選擇問題(涉及概率貨幣回報的賭博,超過了先前數據集的大小)和人類最終在這些問題中作出的決定,來訓練深度神經網絡,發現這種網絡能夠以非常高的準確率模擬人類決策,大大優於現有的(人為)風險選擇模型。

  “在我與南丹麥大學教授Pantelis Analytis和賓夕法尼亞大學教授Sudeep Bhatia共同完成的另一項研究中,通過群體智慧算法整合不同的認知與情感因素,我們發現這樣的集成模型能顯著地提高對決策行為的預測能力。”何黎勝說,“這裏的集成模型也是一種‘大模型’,它的預測精度也超過了前景理論。”

  前景理論提出至今,給後續研究帶來極大的啟發,成為決策科學中的經典研究。當前,研究人員在此基礎上,利用人工智能和大數據算法,一方面不斷完善前景理論,另一方面通過新的技術方法不斷拓展決策理論的邊界,提高預測精度。

  實現決策智能化

  “經過學習和訓練,深度神經網絡能夠模仿人類的行為,它甚至可以像人類在做選擇時會有不理性的行為那樣,表現出非理性。”Sudeep Bhatia告訴《中國科學報》,“因此,用它來預測人類決策行為會大大提高預測精度。”

  “人工智能、認知神經科學的發展,將為心理學、決策科學的發展提供有力的研究手段。”何黎勝說,“得益於學術界和工業界的大模型投入,近年來人工智能和認知神經科學發展迅速,湧現出大量的開創性研究,也為其他學科提供了成熟的研究工具。”

  何黎勝認為,在決策研究中,研究人員會研究不同類型的決策,像風險決策、跨期決策、社會決策、博弈決策等。目前,對這些不同決策類型的研究和建模工作通常相互獨立。然而,從認知的角度,不同的決策類型必然有互聞共通的認知與情感機製。“而不同決策類型之間互聞共通的建模研究還非常稀缺,未來完全有可能通過與人工智能、認知神經科學融合,實現不同決策類型的互聞建模。”

  “機器生成理論在決策和管理場景中有巨大的應用潛力,其核心的變革在於管理自動化。這個轉變類似於計算視覺研究中的深度神經網絡模型在醫學圖像處理中的應用。”何黎勝說。

  目前,管理科學越來越趨向於數據驅動的決策。在工業界和公共政策等領域,越來越多的公司和組織實驗方法(如A/B 測試)獲得實證數據,通過分析實證數據達到決策優化的目的。然而,目前這種數據驅動的決策有不小的局限性。其中一個重要原因是管理者很多時候面臨的是一個複雜的動態系統,是由多種因素交織而成的綜合體。但A/B測試等方法收集到的數據往往是針對某個特定的小點,對複雜決策中多因素之間的交錯互動缺乏全局把握,限製了A/B測試實驗數據的適用性。

  “機器生成理論可以更大程度地利用A/B測試等方法收集到的數據。更為重要的是,機器生成理論足夠靈活,我們可以用真實的數據去訓練這個系統,讓它不斷地逼近真實的管理場景。”何黎勝說,“未來,訓練好的機器生成理論模型可以自動地對複雜管理場景中的事件作出反應。也就是說,機器生成理論有能力將分散的實驗數據昇華成具有邏輯一致性的體系,實現複雜管理決策的自動化、智能化。”

  來源:張雙虎/中國科學報

關注我們Facebook專頁
    相關新聞
      更多瀏覽