2024年9月27日 星期五

不可靠的LLM

 前天(9/25)《自然》期刊登出一篇慘烈的AI研究:


隨著大型語言模型(LLM)的訓練參數越來越龐大,#AI卻越來越不可靠。


研究團隊發現,早年的AI模型,遇到不懂的問題比較會迴避,但升級過後的版本,更容易胡謅出一個有模有樣(但錯誤)的答案。


他們分析了三個大型語言模型:OpenAI的 #GPT、Meta(臉書)的 #LLaMA、還有 #BLOOM(BigScience專案開發的全球最大開源語言模型)。發現雖然越大的語言模型回答的精確度確實有上升,但在另外那些不精確的答案中,錯誤的比例卻更上升。


而且這種傾向隨著提出的問題越難、也會越嚴重,尤其像GPT-4,幾乎所有問題都硬要回答、裝得有模有樣。(如圖)


最慘的是,研究團隊讓人類來給予AI模型評價,區辨這些AI的答案是對是錯,結果真人把AI的錯誤答案當成正確答案的比例,大約介於10% - 40%之間。也就是說人類辨識AI答案真假的能力還蠻差的。


⋯⋯看完這篇研究,是否覺得AI跟人類超像:


1. 自以為博學多聞,遇到不懂的問題,卻越來越難以承認「我不知道」 🤷


2. 即使嚴重誇誇其談、裝作無所不知,都還是會有很多人相信他 🤷


(好吧,至少證明AI還是人類文化養出來的小孩無誤)


▌ Zhou, L., Schellaert, W., Martínez-Plumed, F. et al. Larger and more instructable language models become less reliable. Nature (2024).h

2024年9月10日 星期二

醫療 AI 新紀元

 和您分享

賴清德總統健康台灣推動委員會的

重要顧問

台大醫院吳明賢院長的臉書推文


本週六下午

在基金會會館與您分享

台灣可以拿出來和全世界較量的

尖端醫療、智慧醫療、精準健康


吳院長本尊親臨新港

現身說法

與您們共同分享


以下是最有人文素養的

吳院長的推文


醫療文藝復興元年


        最近台灣颳起人工智慧(AI)旋風,關鍵人物是輝達(Nvidia)創辦人黃仁勳。 Nvidia的GPU比起過去傳統的CPU運算能力更為強大,在大數據時代恭逢其時。假如數據是未來的原油,有了GPU如此高效能的挖掘工具,自然有源源不絕的石油。於是AI應用進入各行各業,吹起第四代工業革命的號角。


       AI應用最後一塊聖域是醫療照護,這也是黃仁勳某次演講𥚃提到的,不要再電腦科學,而是要生物學的微言大義。智慧醫療是我就任院長射出三箭之一(另二為尖端醫療和精準健康)。而且本院早在2020年9月22日即購入兩台Nvidia的DGX A100,是全台灣最早採用Nvidia產品來深耕智慧醫療發展的醫療機構。幾年下來在強大算力加持,也有不僅是台灣第一甚至世界第一的產品問世。台大醫院擁有人才、資料、算力、法規四大優勢發展AI,並且不斷推陳出新,持續強化和Nvidia合作。今天Nvidia總部負責醫療服務的總經理Kimberly Powell和台灣區總經理Eunice Chiu,加上多位研發、行銷、產品負責人和協力廠商來本院洽談合作事宜,確認雙方共同開發健康照護產品及台大醫院持續增加運算能力的投資。


        雖然生物系統的複雜性、數據的侷限性、監管要求的嚴格性都是AI發展路上有待突破的障礙。但是隨著未來數據收集的完整及規模性增加、演算法的進步,再經由跨領域合作、數據共享和技術整合,有機會以Medical AI開啟”醫療文藝復興運動”,解決全世界醫療體系共通的醫護人力不足和醫療不平權的問題。中世紀歐洲黑死病以後在佛羅倫斯發生文藝復興運動,我們成功渡過三年新冠疫情的考驗。


本人深信台灣有最優秀的醫師和工程師,加上世界第一的晶片和硬體製造生態系,有機會在這一波AI熱潮下以medical AI產業回饋世界。只要我們發展的AI是以人為本,真正以人類利益為中心,未來我們除了再造另一個護國神山外,也一定可以讓世界每一個角落、每一個人都能享受不受時空限制且付得起的高品質醫療,不會因病而貧,真正實踐使人免於恐懼的最終健康人權。

失望的應用?great Herbert Simon /Daniel Kahneman《 思考,快與慢》/ the priming effects 爭議

這篇是2013年的貼文。2024年補記,Daniel Kahneman 過世了.....

Some of the evidence for this view is convincingly presented in Daniel Kahneman’s recent book “Thinking Fast and Slow”: spectacular failures of expertise include predictions of the future value of wine, the performance of baseball players, the health of newborn babies and a couple’s prospects for marital stability.
有关这一观点,丹尼尔·卡尼曼 (Daniel Kahneman)在其新近著述《思考:快与慢》(Thinking Fast and Slow)中展示了一些令人信服的证据:就葡萄酒的未来价值、棒球运动员的表现、新生婴儿的健康情况,以及一对夫妇对婚姻稳定度的前景期望等问题,专家做 出的预测大错特错,令人叹为观止。


《 思考,快與慢》是預計6月15日討論的書. 不過戴老師覺得此書很無趣.讀不下去. 所以孤掌難鳴......



最近讀K. J. Wu 轉來的洪蘭教授的"負面言語讓人「未戰先敗」"
其中引用 Daniel Kahneman的一些想法
不過我認為洪教授太盡信書

 .......諾貝爾經濟獎得主康納曼(D.  Kahneman)在他的新書《Thinking, fast and slow  》中說,香蕉和嘔吐這兩個字本不相干,但是一旦把它們放在一起,會馬上令人感到不愉快。
大腦會自動作時間的序列,把香蕉和嘔吐連成因果,你就對香蕉產生暫時性的反感,連帶對黃色水果也不喜歡了。
這個自動化聯結所產生的作用,並不限於概念和文字,它甚至會改變你的行為。
 紐約大學心理系教授巴夫請學生從五個字中選四個字出來造句,如:find(發現)、he(他)、if(如果)、yellow(黃色)、instantly(立即)。另一組學生看到的字則是與「老」有關,如:forgetful(健忘的)、bald(禿頭的)、gray(灰色的)、wrinkle(皺紋)。
做完之後,學生要到走廊另一端的實驗室去做另一個實驗。他測量學生走過走廊的時間,結果發現,那些看到跟「老」相關字組的大學生,走的時間比看中性字組來得慢。原因在於,「健忘」、「禿頭」、「皺紋」這些字促發了老的意念;這個意念又促發了行為,使學生走路變慢了。

 這個「促發效應」(priming  effect)非常強烈。即使沒有一個學生注意到,這些字有共同的主題「老」。他們也都堅持,老的念頭從未進入他們心中。然而,他們的行動卻變慢了,這就是所謂的「意念動作效應」(ideomotor effect)。
更可怕的是,這個效應也可以倒過來做,動作也會強化意念。德國的研究者請學生在房間中走五分鐘,每一分鐘走三十步,這是一般大學生步伐速度的三分之一,然後請他們在電腦上辨認一閃而過的單字,結果發現這些慢走的學生,對老年有關的字辨識特別快,如forgetful、old。
 假如你動作像老人,它會強化你老年的思想,這效應是雙向的。因為這暗示的作用是不自覺地發生。官員在談論國家前途時,宜從正向著手去尋找解決方式,不可未戰先敗。........

 現在我們可以查到近日心理學中的一熱門話題/爭議:Priming (psychology)
From Wikipedia, the free encyclopedia
 此文批評欄中有許多異議和建議:

Criticism

Many of the priming effects could not be replicated in further studies, casting doubt on their effectiveness or even existence.[43] Nobel Laurate and psychologist Daniel Kahneman has called on social psychologists to check the robustness of priming studies in an open letter to the community, claiming that social psychology has become a "poster child for doubts about the integrity of psychological research."[44].....
 換句話說  "the priming effects"還只是待詳細驗證的假說.
洪教授似乎過於肯定了.
 -----


諾貝爾經濟學獎得主、決策大師康納曼(Daniel Kahneman)原本預計4月1日下午與桃園縣長吳志揚對談,並針對台灣公共政策及經濟環境等議題提供建言。但桃園縣政府臨時表示,康納曼疑因心臟病發,緊急送至台北榮總就醫。
▼諾貝爾獎得主康納曼原要在桃園演講,疑因心臟病發緊急送至台北榮總。(圖/取自網路)
康納曼3月31日才拜會總統馬英九討論核四問題,今日則要就桃園航空城的發展提供意見,不料會議前驚傳身體不適。《遠見雜誌》創辦人高希均下午仍舊 主持高峰論壇,他表示,康納曼早上進行研討會時站起來答覆問題,突然覺得身體不舒服,後來深怕心臟病發作,便緊急送醫,後來證實只是腸胃不適。
高希均說,康納曼目前狀況已經穩定,也託夫人打電話轉達歉意。吳志揚表示,康納曼晚間7時還要搭飛機回美國舊金山參加另一場演講,80多歲的教授還能這麼有衝勁令人佩服。




 ------2012.7.26
Thinking, Fast and Slow (Daniel Kahneman)
本書稱Herbert Simon 之前  加一"偉大的 "/了不起的

在Herbert Simon追思集Models of a Man
Daniel Kahneman and Shane Frederick 合寫一篇-- Encounters with the force of Herbert A. Simon



紐約時報書評

兩個大腦在運轉,一個快一個慢


丹尼爾·卡納曼(Daniel Kahneman)於2002年獲得諾貝爾經濟學獎。有意思的是,卡納曼是一位心理學家。具體說來,他的貢獻就在於他與另一位心理學家阿莫斯·特維斯基 (Amos Tversky(自二十世紀七十年代初開始,挑戰、瓦解了經濟學理論界長期抱持的一個概念:稱作“經濟人”(Homo economicus)的理性優先決策者。特維斯基於1996年逝世,享年59歲。如果他還活着,他肯定會與其長期的合作者和摯友卡納曼共享諾貝爾獎。

“人類的非理性”是卡納曼的主要研究對象。他的職業生涯基本上分為三個階段。在第一階段,他和特維斯基做了一系列別出心裁的實驗,揭示了二十多個 “認知偏差”(cognitive biases)——推理中無意識的差錯歪曲了我們對世界的判斷。其中具有代表性的是“錨定效應”(anchoring effect):我們傾向於受正巧展露給我們的不相干數字的影響(例如,在一次實驗中,經驗豐富的德國法官如果擲出一對骰子後,剛好得到一個大數字,那麼 他們對商店扒手判的刑期就更長)。在第二階段,卡納曼和特維斯基證明,在不確定的情況下做決定的人,並非如傳統經濟學模型所假定的那樣行事,他們並沒有 “效用最大化”(maximize utility)。兩人隨後發展出另一種更符合人類心理的解釋決策的理論,他們稱之為“預期理論”(prospect theory,卡納曼便是因為這一成就獲得諾貝爾獎)。在其職業生涯的第三個階段——主要是在特維斯基過世以後——卡納曼轉向研究“享樂心理學” (hedonic psychology):快樂行為學及其性質和成因。他在這一領域的發現證明是令人不安的——這不僅僅是因為其中一個關鍵實驗涉及一次故意延長的結腸鏡檢 查。

《思考,快與慢》(Thinking, Fast and Slow)的內容貫穿了以上這三個階段。這本書內容豐富,它清晰、深刻,充滿智慧的驚喜和自助價值。全書讀來妙趣橫生,在很多時候也很感人,尤其是卡納曼 講述他和特維斯基共事的時候(“我們在一起工作獲得的樂趣使我們變得格外地耐心;當你樂此不疲時,就不難做到精益求精。”)它對人類理性缺陷的洞見令人印 象深刻,《紐約時報》專欄作家大衛·布魯克斯(David Brooks)最近就宣稱,卡納曼和特維斯基的工作“將會流芳百世”,是“我們如何看待自己的關鍵支點”。布魯克斯說,他們“就像思想界的‘路易斯與克拉 克遠征’ ”。

間接宣布了人類的非理性
現在,該說說讓我略微不安的部分。這本書的一個主題是關於過分自信。卡納曼提醒我們,我們所有人,尤其是專家,容易誇張地感覺自己是多麼了解這個世 界。當然,他自己對過分自信保持了警惕。儘管他和特維斯基(與其他研究者一道)宣稱在最近幾十年里發現了種種認知偏差、謬論和錯覺,他始終不願勇敢地宣 布,人根本就是非理性的。
抑或他做了間接的宣布?“我們大部分人在大部分時候都是健康的,我們大部分判斷和行動在大部分時候都是恰當的”,卡納曼在序言中寫道。然而,就在幾 頁之後,他又說,他和特維斯基所做的工作“挑戰”了1970年代社會學家普遍持有的觀念:“人大致是理性的。”兩位心理學家發現“在正常人的思考中存在系 統性的差錯”:差錯的出現不是源於情緒的惡劣影響,而是內置於我們逐漸演化的認知機制里。儘管卡納曼僅僅提出一些最為尋常的政策建議(例如,合同應該用更 清晰的語言表述),其他人卻發揮得更多——也許是過於自信?比如,布魯克斯認為,卡納曼和特維斯基的工作表明了“社會政策的局限”,尤其是政府為解決失業 問題、扭轉經濟局面所乾的蠢事。

這些過於籠統的結論,尚不論作者未必贊成,至少是令我皺眉的。而皺眉——你會在本書第152頁了解到——會激發我們的懷疑:懷疑卡納曼所謂的“第二 系統”。實驗表明,單是皺眉就可有效減輕過度自信;能讓我們在思考中更善於分析,更加警覺;能讓我們對那些因其輕易可得、條理井然而不假思索接受的故事產 生疑問。這就是我為什麼會皺着眉頭,持最懷疑的態度來閱讀這本非常有趣的書。

在卡納曼的模式中,第二系統是我們在思索世界時緩慢的、有意的、分析的、自覺努力的模式,第一系統與之相反,是我們快速的、自動的、直覺的、大半無 意識的模式。在一個聲音中聽到敵意,或者毫不費勁地完成“麵包和……”這個短語的是第一系統。而諸如不得不填寫納稅申報單、把車停在一個很狹小的停車位等 行為,則是第二系統在起作用(卡納曼等人發現,有一個簡單方法可以分辨一個人的第二系統在一項任務中所發揮的程度:只要盯着對方的眼睛,注意瞳孔的放大程 度)

更寬泛地說,第一系統運用聯想和隱喻快速、粗糙地勾畫出現實世界的草圖,第二系統進而達到明確的信念和理性的選擇。第一系統提出意圖,第二系統執 行。所以,第二系統似乎是老闆,對吧?在原則上是的。但第二系統不僅僅更有意圖、更加理性,同時也是懶惰的。它容易疲倦(流行的術語是“自我損耗” 【ego depletion】)。與放慢節奏、對事物進行分析相反,第二系統常常滿足於第一系統提供給它的簡單卻不可靠的關於這個世界的描述。“雖然第二系統相信 自己乃行動之所在,”卡納曼寫道:“但自動的第一系統才是本書的主角。”當你心情愉快時,第二系統似乎尤其不活躍。

這時,持懷疑態度的讀者也許會思忖,究竟要多認真地看待關於第一系統和第二系統的說法。它們真是我們頭腦中各自帶有鮮明個性的一對小小的代理人嗎?並非如此,卡納曼說道,確切地說,它們是“有用的虛構”——有用是因為它們有助於解釋人類的思維習慣。
那個叫“琳達”的銀行出納
要明白這一點,請想想“琳達問題”(the Linda problem)。卡納曼認為這是他和特維斯基一起做的“最著名和最具爭議性的”實驗。實驗的參與者會聽到一個虛構的、名叫琳達的年輕女人的故事,她單 身,坦率,非常開朗,在學生時代非常關注各種歧視和社會正義。接着,參與者會接受提問,以下哪一個更有可能:(1)琳達是一位銀行出納。(2)琳達是一位 銀行出納,活躍於女權主義運動。大多數人都選擇了(2)。換言之,提供的背景訊息表明“女權主義的銀行出納員”比“銀行出納員”更有可能。當然,這明顯違背了概率法則(每一位女權主義的銀行出納都是銀行出納;補充的細節越多,可能性就越低)。然而,甚至在斯坦福商業研究院受過大量概率訓練的學生當中,也有 百分之八十五的人無法通過琳達問題。有一位學生在得知她犯了一個低級的邏輯錯誤後,答道:“我以為你只是在詢問我的看法。”

這是怎麼回事?一個簡單的問題(敘述有多清晰連貫?)被一個更難的問題(它有多大可能?)替代了。在卡納曼看來,這就是我們在思考過程中出現許多偏 差的來源。第一系統匆匆得出一個基於“啟發”的直覺結論——這是回答艱深問題的一個簡單卻不完美的辦法——第二系統就懶惰地接受了這一啟發式的答案,絲毫 不想細查它是否合乎邏輯。

卡納曼描述了許多這類經過實驗證明的理性故障——“比率忽略”(base-rate neglect)、“有效性級聯”(availability cascade)、“有效性的錯覺”(the illusion of validity)等等。其結果就是逐漸讓讀者對人類的理性絕望。

我們真的如此無可救藥嗎?再想想琳達問題。甚至連偉大的生物進化學家斯蒂芬·傑伊·古爾德(Stephen Jay Gould)都受到它的困擾。作為一位概率專家,他知道正確的答案,但他寫道,“有一個小人兒在我頭腦里不斷地跳上跳下,對我喊道——‘可她不僅僅是一個 銀行出納;看一下描述吧。’”卡納曼使我們相信,是古爾德的第一系統一直朝他喊着錯誤的答案。可是,也許發生着更為微妙的事情。我們的日常對話都發生在一 個對期望未加說明的豐富背景下——語言學家稱之為“言下之意”(implicatures)。這些言下之意可以滲透到心理實驗中去。鑒於我們都期望讓對話 更加簡潔,實驗的參與者將“琳達是一位銀行職”當作是在暗示“此外,她並不是一個女權主義者”,也是相當合理的。如果是這樣,他們的答案就並非那麼謬誤。

這似乎是一個次要的問題。但它卻適用於卡納曼和特維斯基,還有其他研究者所聲稱的在正規的實驗中發現的一些偏差。在更加自然的情景中——當我們在偵 查騙子而不是解決邏輯謎題,在推斷事物而不是象徵物,在評估原始數據而不是百分比的時候——人們就不太可能出現同樣的差錯。至少,後來的許多實驗都間接地 表明了這一點。也許我們根本就不是那麼不理性。

當然,一些認知偏差甚至公然出現在最為自然的情景中。比如卡納曼所說的“規劃謬誤”(planning fallacy):我們傾向於高估利潤和低估成本,因而愚蠢地施行一些存在很大風險的方案。例如,在2002年,美國人改建廚房,預期這項工作平均花費 18,658美元,但他們最後卻花費了38,769美元。

"規劃謬誤“只是一種普遍存在的樂觀偏差的一個表現”,卡納曼寫道,這“很可能是最重大的認知偏差”。在某種意義上,一種傾向於樂觀主義的偏差顯然是 糟糕的,因為它帶來錯誤的信念——比如:是我們在掌控運氣而不是運氣在玩弄我們。但是,如果沒有這一“掌控的錯覺”,我們在早上甚至都沒辦法起床吧?比起 與之相對應的更立足於現實的人,樂觀主義者更具心理彈性,具備更強大的免疫系統,平均壽命更長。此外,正如卡納曼所指出的,過分的樂觀主義使個人和組織都 免受另一種偏差的麻痹效應,這種偏差就是“損失規避”(loss aversion):我們對損失的畏懼更甚於對獲利的重視。當約翰·梅納爾德·凱恩斯(John Maynard Keynes)談到驅策資本主義的“動物精神”(animal spirits)時,他頭腦中就存在着過分的樂觀主義。

即便我們能夠擺脫這本書所指出的那些偏差和錯覺——卡納曼以他自己在克服這些偏差和錯覺方面殊少進步為例,懷疑我們也不能克服它們——我們也根本不 清楚這是否能讓我們的生活變得更好。這引發了一個根本問題:理性的意義何在?說到底,我們全都是達爾文學說里的倖存者。我們日常的推理能力為了有效地適應 一個複雜的動態環境,已經隨之進化了。因此,這些推理能力大概也會適應這一環境,即便它們在心理學家那些多少存在人為因素的實驗中出錯。如果理性的模範不 是對人類在日常生活中的實際推理的一種理想化,那它們又是從何而來?作為一個物種,我們不能讓自己的判斷存在普遍的偏差,就像我們不能在使用語言時普遍地 不顧語法——抑或在對像卡納曼和特維斯基所做的研究進行批評時也是如此。

幸福是什麼?
卡納曼從未從哲學上抓住理性的特徵。然而,他為能夠作為其目標的幸福提供了一個迷人的描述。幸福是什麼意思?當卡納曼在1990年代中期首次提出這 個問題時,大部分對幸福的研究還依賴於詢問人們在大體上對他們的生活感到多麼滿意。但這種回顧性的評估依賴於記憶,眾所周知,記憶是不可靠的。如果與此相 反,一個人對快樂或者痛苦的實際體驗能夠隨時隨地取樣,然後隨着時間推移加以總結,那會怎樣?卡納曼將之稱為“體驗的”幸福,與研究者依賴的“記憶的”幸 福相對立。他發現這兩種對幸福的衡量方式存在驚人的差異。使“體驗的自我”(experiencing self)感到幸福的東西並不是使“記憶的自我”(remembering self)感到幸福的東西。尤其是,記憶的自我並不在乎持續時間——不在乎一段愉快或者不愉快的經歷持續多久。它會通過體驗過程中痛苦或者快樂的峰值水 平,通過體驗的結果來回顧性地衡量一段體驗。

記憶的幸福的兩個缺陷——“對持續時間的忽略”(duration neglect)和“峰終定律”(peak-end rule)——在卡納曼的一個更令人難受的實驗中得到了驚人的展現。兩組病人要接受痛苦的結腸鏡檢查。A組病人依照的是正常的程序。B組病人也一樣,只不 過——他們沒被告知——在檢查結束後,額外加上了幾分鐘的輕度不適。哪一組更痛苦呢?嗯,B組承受了A組的全部痛苦,然後還有額外的一些痛苦。但由於B組 的結腸鏡檢查延長意味着結束時的痛苦要小於A組,這一組病人在回顧的時候就不那麼在意(在更早的一篇研究論文中——雖然不在這本書里——卡納曼提出,在這 個實驗中,如果B組受到的這陣額外的不適能夠增強他們回來參加後續實驗的意願,它就是合乎倫理的!)。

在結腸鏡檢查中是如此,在生活中也是如此。在發號施令的是記憶的自我,而不是體驗的自我。例如,卡納曼引述研究表明,一個大學生決定是否重複一次春 季假期,取決於前一個假期的峰終定律(peak-end rule),而不是取決於那一個一個瞬間多麼有趣(或者多麼悲慘)。記憶的自我對無聲的體驗的自我施加了一種“暴虐”。“好像很奇怪,”卡納曼寫道,“我 是我記憶的自我,而那個過着我的生活的體驗的自我,對我而言就像一個陌生人。”
卡納曼的結論聽起來很激進,也許還不夠激進。也許根本就沒有體驗的自我。例如,以色列魏慈曼研究所(Weizmann Institute)的拉斐爾·馬拉克(Rafael Malach)和同事進行的大腦掃描實驗表明,當實驗對象專註於一項體驗,比如觀看電影《黃金三鏢客》(The Good, the Bad, and the Ugly),大腦中跟自我意識聯繫起來的部分不僅僅是安靜了,實際上是被大腦的其他部分關閉(“抑制”)了。自我似乎消失了。那麼,到底是誰在享受電影 呢?為什麼這種無我的快樂會進入記憶的自我的決策演算中呢?

顯然,在享樂心理學中還有許多研究要做。但卡納曼的觀念革新已經為他在書中講到的許多經驗成果打下了基礎:較之美國母親,法國母親與子女待在一起的 時間更少,但她們卻更享受;窮人更受頭痛的侵襲;獨居的女人似乎與那些有配偶的女人享受着同等的幸福;在這個國家的高生活成本地區,一個收入大約 75,000美元的家庭足夠將幸福最大化。那些有志於降低社會不幸指數的政策制定者,將會在這裡發現許多值得深思的東西。
在讀到《思考,快與慢》結尾的時候,我充滿狐疑的皺眉早已舒展開,臉上掛着智性滿足的微笑。根據峰終定律來評價這本書,我會過分自信地催促每個人都 去買來讀。但對於那些只關心卡納曼如何售賣馬爾科姆·格拉德維爾問題的人來說:如果你已經在一個可預知的、快速反饋的環境中接受了10,000小時的訓練 ——國際象棋、消防、麻醉學——那麼,就不用看了。至於其他人,則好好想想吧。

吉姆·霍爾特(Jim Holt )的新書叫《世界為什麼存在?》(“Why Does the World Exist?”)
本文最初發表於2011年11月25日。
翻譯:流暢

昏姻或非理性

 人為什麼會出軌?麻省理工學院告訴你:男女配對的真相


我們都是有感情有弱點的動物,婚姻的神奇在於,這種利益交換有時候是不對等的,而讓它不對等的原因,是我們所說的變量。這個變量叫“感情”。


該實驗出自麻省理工學院著名經濟學家Dan Ariely的《The Upside of Irrationality》。其結果很有趣,也在我們的生活中尤為常見。


1


實驗人員找來100位正值青春年華的大學生,男女各半。然後製作了100張卡片,卡片上寫了從1到100總共一百個數字。


單數的50張卡片給男生,雙數的50張卡片給女生。但他們並不知道卡片上寫的是什麼數字。


工作人員將卡片拆封,然後貼在該大學生的背後。


實驗規則:


1、男女共100人,男的單數編號,女的雙數。


2、編號為1~100,但他們不知道數字最大的是100,最小的是1。


3、編號貼在背後,自己只能看見別人的編號。


4、大家可以說任何話,但不能把對方的編號告訴對方。


實驗要求:


大家去找一個異性配對,只要兩人加起來的數字越大,得到的獎品越高,獎金歸他們所有。


配對時間有限。


2


大家猜猜會怎麼著?


這個實驗設置很簡單,就是要男女都能找到適合自己的異性,爭取能湊到最大的總和。


實驗是有獎金的,獎金金額為編號總和翻10倍。比如,83號男生找到了74號女生配對,那麼兩人可以獲得(83+74)*10=1570美元的獎金;但如果2號女生找到了3號男生配對,那麼兩人只能拿到50 美元了。


3


實驗開始。


由於大家都不知道自己背後的數字,因此首先就是觀察別人,很快分數高的男生和女生很快被大家找出來了。例如,99號男生和100號女生。


這兩人身邊圍了一大群人,大家都想說服他們和自己配成一對。


“來跟我一起嘛!我會給你幸福的!”


“我們簡直天作之合啊!”


是的,有些人天生就自帶“女神”/“男神”光環……誰都想和最好的“女神”/“男神”配對。


但人類的一夫一妻制決定了,人不可能同時和N個人配對,因此他們(高分者)變得非常挑剔,他們雖然不知道自己的分數具體是多少,但他們知道一定是比普通人的要高。


為什麼?


看看圍在自己身邊的狂蜂浪蝶就知道了,從這些追求者們殷切的眼神中就能夠看出來。


自小是女神的人為什麼被外界看起來更加“高貴冷艷傲慢”,是因為從小到大她們都有太多亂七八糟的浪蜂浪蝶撲過來了。


追求者太多,哪有時間去一一好口相向?只能高冷艷一點把不合格的拒之門外才是最佳策略。


那些碰壁的追求者迫於無奈只能退而求其次,原本給自己的目標是一定要找90+的人配對,慢慢的發現80+也可以了,甚至70+或者60+也湊合著過了。


但那些數字太小的人就很悲催了,他們到處碰壁,到處被拒,被嫌棄。


據一位學生事後表示,在參加了這場遊戲之後,他對人生的理解都有了不同……因為他在短短幾小時裡就感受到了人間的冷暖——他們背後的數字太小了( 基本都是個位數),要找一個願意配對的人簡直是難上加難。


最後他們想出來的辦法無外乎兩條路:


一個是大家自己找個差不多的湊合湊合算了,比如5號和6號倆人配成一對,雖然獎金只有110美元,那也好過沒有。


二是和對方商量,如果你願意和我配對,那麼拿到獎金的時候就不是對半分,我願意給你更多,比如三七分或四六分等等,或者事後再請你吃飯,雖然請客吃飯花的錢肯定多過獎金數額,但是找不到人配對實在是太沒面子了。(這個在現實中就有的交易婚姻:交易條件包括房子、財產、其他物質不等、代際婚姻、假婚等)


經過了漫長的配對過程,眼看時間就要到了,還有少數人沒有成功配對,這些人沒辦法了,只能趕緊的草草找人完成任務,因為單身一人的話是拿不到獎金的。


最後的倒數階段,沒有配對的都胡亂找了個人。當然也有堅持不配對,單身結束遊戲的大學生。


實驗結束。


4


心理學家發現,絕大多數人的配對對象,其背後的數字都非常接近自己的數字,換言之中國古人說的“門當戶對”還是很有道理。


比如55號男生,他的對象有80%的可能性是50-60之間的女生,倆人數字相差20以上的情況非常罕見。


那你們猜100號的女生的配對對象是誰?


好玩的是,100號女生的配對對象竟然不是99號男,也不是97或95,竟然是73號男生,兩人相差了27。


為什麼會相差這麼多?


原來100 號女生被眾多的追求者沖昏了頭,她採取的策略是“捂盤惜售”(因為她並不知道100是最大值,也不知道自己就是100號),她還在等待更大數字的男人,等到大家都配對完畢,她終於開始慌了。於是她在剩下的男生裡找了一個數字最大的,就是那位73號幸運兒。她最後也嘗試過去找90+的男生,但是人家都已經有女伴了,讓他們拋棄現有的女伴跟她配對並不現實,何況已經配對了他們不會為了這點錢而損自己名聲 。


從中我們還可以總結出很多經驗:


1、因為人太多地方太小,你並不可能跑去看每個人背後的數字。(空間,圈子,地域限制)


2、你只要看誰邊上圍著的人多,誰就是數字較大的人,而那些身邊孤苦伶仃門可羅雀的人,肯定是數字小的,通過這個方法你可以立刻篩選出目標對象。(多數決擇,光環效應)


3、小數字的人追求大數字的人一般都很辛苦,因為要大數字的人接受小數字的人總不是那麼甘心,因此追求方要付出更大的努力才行,但更大的可能是你再怎麼努力,對方也不理你。


這場心理學實驗完全就是人類戀愛行為的實驗簡化版啊。


5


我們每個人在遇到一個異性的時候,出於本能的就會開始評價對方的價值,這完全是下意識的。但人類的價值非常難評估,沒有誰會把數字貼在自己的背後,人們還往往會故意誇大自己的價值。


我們在生活中所遇到的人也遠遠超過了100 個,我們面臨的是一個更加複雜的環境,這讓我們做出決定的難度成倍增加。


正因為選擇的難度很大,因此人類進化出了一些很簡單的指標。比如,我們更傾向於基於別人的判斷來決定自己的判斷。


實驗讓我們知道,如果愛情是一場精確的匹配遊戲,最重要的是你自身的價值有多高(即背後的數字大小),而你採取什麼辦法去戀愛可能都是次要的。


但和這個實驗有個很重要的不同就是:生活實在太複雜了,一個人的價值並不是那麼容易就能體現出來的。而且我們很難去判別一個人的價值。


還有一點就是,我們每個人眼中的價值標準都不一樣,所以我們可以看到這麼多元的愛情。 張生與崔鶯鶯,白瑞德與郝思嘉,羅密歐與朱麗葉…這些故事代代傳頌,足以證實每個年代都有在世人看來“不可能”的愛情正在發生。


這裡的世人是誰?就是那些“大多數人”,是你的鄰居三姑八姨婆九舅舅隔壁學校的同學,甚至是你的父母。


這個社會的風潮是由這些“大多數人”去決定的,所以當你看到社會的價值傾向時,你看到的就是大多數人的標準。但大多數人的就一定是正確的嗎?他們也許都不自知該用什麼樣的標準來對待愛情。


人云亦云是他們大多數人“發表意見”的最佳策略。就像對於某些鄰居三姑八姨婆來說,婚姻就是一樁買賣。


其實,作為理性的經濟人,這可能沒錯,婚姻本質就是一種利益交換,就像經濟學裡所有東西都可以量化,用等額的貨幣來取代。但是我們都是有感情有弱點的動物,婚姻的神奇在於,這種利益交換有時候是不對等的,而讓它不對等的原因,是我們所說的變量。


這個變量叫“感情”。


6


一個教經濟學的老頭,曾經給學生說過愛情的經濟學:


“姑娘,一個百萬富翁向你求婚,他願意給你一切,這本來是一件非常美好的事情。算一下,你以為自己賺了一百萬。


但同時又有一個千萬富翁看上你了,那麼你與百萬富翁結婚的機會成本就是一千萬。也就是說,如果你嫁給了百萬富翁,那麼你會虧損九百萬。 ”


這是經濟學。


“我非常慶幸,我的太太經濟學沒有學好,那時候她非常漂亮我卻沒有錢,但她還是嫁給我了。”


這是愛情。


至於你,是被這些思潮所裹挾,還是有自己的愛情觀,完全取決於你。


⚛️ 推薦好書:

📕 認知覺醒:發掘天命內驅力的能量之旅

📕 https://reurl.cc/YVG190

📙 量子力學與混沌理論的人生十二堂課

📙 https://bit.ly/3f2Jtr1


⚛️ 推薦影音成長課程:

📕 生命解碼講座:當量子力學遇見哲學與神學

📕 https://reurl.cc/zYyYG7


本文源自網路,歡迎分享,若知原作者,請告知。

2024年9月9日 星期一

簡述D. Dennett 和 Y. H. Harari 談A.I. :(周奕成)

 周奕成:


關於AI在台灣的公共討論,大多集中在產業面,而少關注其社會人文的影響。在西方,當前最重要的思想者之一,以色列出身的歷史學家Yuval Noah Harari 對AI做了許多討論,在媒體上有很大影響力。而今年過世的美國哈佛大學哲學與認知科學家Daniel Dennett則是AI與心智的先驅。這兩位思想家在AI、民主及創造力等議題上展現了不同的見解。儘管學術背景不同和世代差異,但兩位都極有洞見,值得放在一起討論。


Dennett出生於1942年,是哲學家和認知科學家,研究意識、自由意志以及人類心智的進化。他對AI的關注集中在其如何模擬人類心智,並提出AI能夠透過模仿人類行為來執行複雜任務,卻不具備真正的意識。他在《心智解釋》(Consciousness Explained, 1991)中探討了意識的進化,他主張意識只是神經系統運作的結果,並質疑人工智能是否能夠真正模擬或替代人類的自我意識。


Harari出生於1976年,是以色列著名的歷史學家,以他對歷史和未來的宏觀視角而聞名。他的著作《人類大歷史》(Sapiens, 2014)和《未來簡史》(Homo Deus, 2016)探討了人類文明的演變,並警告AI和其他技術將徹底改變未來社會。他擔心AI不僅會顛覆政治、經濟結構,還可能削弱人類自由意志,甚至影響人類的自我認知。在《未來簡史》中,他指出AI和大數據技術將能夠更準確地預測和影響人類行為,從而引發政治控制和社會不平等的加劇。


Dennett警告說,AI對民主最大的威脅並非來自科幻小說中的超級智能接管世界,而是AI模仿人類的能力可能會使社會信任崩潰。他認為,能在數位環境中冒充真人的AI實體,即「假人」,是歷史上最危險的人造物。這類技術可能破壞民主制度的知情同意原則,因為AI生成的虛假信息可能混淆公眾,使其無法辨別真實與虛假。更糟糕的是,AI掌控的強大實體可能操縱輿論,從而引發一種新型的奴役,並造成社會廣泛的混亂和不安。為此,Dennett主張應該對這類「假人」進行嚴格的法律限制,並懲罰模仿人類的AI系統,確保它們不會危害社會。


Dennett的思想雖然主要集中在心智和意識的問題上,但他的見解為我們理解AI對藝術的影響提供了洞見。他認為,藝術作為一種人類成就,是演化過程的結果,而非神靈的賦予。這表明他可能將AI生成的藝術視為人類創造力的延伸。但他同時對AI模仿人類藝術風格的能力表示擔憂,認為這可能會削弱人類藝術的真實性與價值,尤其是在AI創作出與人類無法區別的藝術作品時,會挑戰人類藝術家的地位。Dennett的這些擔憂也延伸到他對「假人」的危機警告中,因為這些AI技術不僅影響公眾的信任,還可能破壞我們對藝術的認識。


Dennett的哲學強調人類創造力與AI系統之間的相似性。他認為,無論是人類還是AI,創造過程都涉及數據的學習、聚合與再生產。因此,他指出,從本質上來看,人類與機器創造的過程並無太大區別。Dennett運用了神經網絡的類比,指出人類意識是數十億神經元相互作用的結果,與AI的運作方式類似。他認為人類的創造力和意識都可以在機器中實現,因為人類本身就是一個由無數「小機器」組成的複雜系統。


然而,Dennett也強調了當前AI與人類意識在複雜性上的巨大差異。他警告不要過於關注AI是否能達到「通用智能」,而應該更加關注AI作為「極具操縱性」的自主代理,可能帶來的社會風險。Dennett認為,人類對自己創造力的特殊性看法,可能只是一種錯覺,由文化和社會條件塑造而成。AI的發展使我們開始重新思考什麼是創造力,並挑戰了我們對人類作為獨特創作者的傳統觀念。


雖然Dennett認為人類與AI的創造過程相似,但他主張應該將AI視為一種工具,而不是賦予其「同事」或「夥伴」的地位。他認為賦予AI以情感或意識不僅是不必要的,還可能使其變得更加「焦慮」,而非更智能。因此,Dennett提出,將AI看作「奴隸」是合適的,因為它們沒有意識或感覺,我們可以像對待汽車一樣處理AI,隨時關閉或拆解它們。


同時,Dennett提醒我們,儘管AI在某些任務上表現優異,但它們並不理解自己在做什麼,這種「無理解的能力」可能帶來潛在的社會風險。如果AI被用來傳播虛假信息或操縱輿論,我們將陷入深重的困境,因為我們將不知道自己能信任什麼,甚至無法確定我們所接收到的信息是否真實。


Harari認為AI對民主體制帶來了前所未有的威脅,其中最大的危險在於AI操縱公眾輿論的能力。他指出AI可以被用來創造高度逼真的假內容,包括錄音、錄影和文字,這些內容可能被用來誤導選民,破壞政治對手的聲譽,或者製造社會分裂。隨著AI技術的進步,區分真實和虛假信息變得越來越困難,這可能導致公眾對所有信息來源失去信任,從而削弱民主社會賴以運作的溝通基礎。


Harari認為AI是歷史上第一個能夠自主做出決定和創造新想法的工具。這一特性使AI與過去的任何技術都截然不同。傳統工具,如鋤頭或印刷機,雖然改變了社會,但它們本身並不能做決定或產生新的思想。相比之下,AI可以分析大量數據,做出複雜的判斷,甚至創造出全新的概念。這種能力使AI成為一個潛在的強大政治行為者,可能對民主制度產生深遠影響。控制資訊流動的風險。


更令人擔憂的是,AI可能會控制人們獲取信息的方式。搜尋引擎、社交媒體平台和新聞媒體越來越依賴AI演算法來決定向用戶展示什麼內容。Harari指出,這種權力可能被濫用,無論是由獨裁政權還是私人公司。通過控制資訊流動,AI系統可以塑造公眾對重要議題的看法,影響政治辯論的走向,甚至決定選舉的結果。


Harari認為,AI可能會使傳統的民主程序,如選舉,變得不那麼重要或有效。隨著AI能夠更準確地預測和影響人類行為,選舉可能被視為一種過時的決策方式。例如,如果AI能夠準確預測大多數人在特定情況下的選擇,那麼舉行實際選舉的必要性就可能受到質疑。這種情況下,民主的基本原則——人民的意願——可能被AI的預測所取代。


更深層次的問題是,AI可能會挑戰自由意志的概念,而自由意志是民主的根本基礎。如果AI能夠準確預測和影響個人的決策,那麼我們是否還能說我們的選擇是真正自由的?Harari警告,這種情況可能導致一種新形式的極權主義,在這種制度下,政府或公司可以通過AI系統來操縱人們的思想和行為,而不需要使用傳統的強制手段。


全文詳見留言處