2024年11月17日 星期日

不可靠的LLM。我明知 ChatGPT 沒有設計這部分,我不知光靠LLM是怎麼辦到的。真的很神奇。ChungChih Li


ChungChih Li

ChatGPT 還是很不可靠,我又出了20題是非題(計算理論),題目沒有比較難,這次錯了11題,等於亂猜,解釋也亂七八糟,連猜對的都亂扯。(昨天答對 46/50 我很驚奇,但沒看它的解釋,可能也是鬼扯。)鞥鞥鞥

。。。。
ChatGPT 還是很厲害的,我出了50題是非題,不是記憶性的,理論的,也不是很簡單,學生程度好的可以答對45題,平均是30題,比用猜的好一些。一時興起丟給ChatGPT ,答對46題,很神奇。那是給大學部最後一年的考題,另一份給研究生的 ChatGPT 表現稍差,但50題也答對了41題,很厲害,學生很少高於30的,25以下很多,比用猜的還爛,因為有陷阱。幾乎每題都要邏輯推理,而我明知 ChatGPT 沒有設計這部分,我不知光靠LLM是怎麼辦到的。真的很神奇。


+++++Huang Gino 是非題對人腦比較難,容易被情緒影響,但選擇題AI確實比較不行,我覺得是因為焦點被分散,比較不好收斂,但還是頗厲害,水準以上。計算題(或者說應用題),除非很標準的問題,AI常大崩潰。

 前天(9/25)《自然》期刊登出一篇慘烈的AI研究:


隨著大型語言模型(LLM)的訓練參數越來越龐大,#AI卻越來越不可靠。


研究團隊發現,早年的AI模型,遇到不懂的問題比較會迴避,但升級過後的版本,更容易胡謅出一個有模有樣(但錯誤)的答案。


他們分析了三個大型語言模型:OpenAI的 #GPT、Meta(臉書)的 #LLaMA、還有 #BLOOM(BigScience專案開發的全球最大開源語言模型)。發現雖然越大的語言模型回答的精確度確實有上升,但在另外那些不精確的答案中,錯誤的比例卻更上升。


而且這種傾向隨著提出的問題越難、也會越嚴重,尤其像GPT-4,幾乎所有問題都硬要回答、裝得有模有樣。(如圖)


最慘的是,研究團隊讓人類來給予AI模型評價,區辨這些AI的答案是對是錯,結果真人把AI的錯誤答案當成正確答案的比例,大約介於10% - 40%之間。也就是說人類辨識AI答案真假的能力還蠻差的。


⋯⋯看完這篇研究,是否覺得AI跟人類超像:


1. 自以為博學多聞,遇到不懂的問題,卻越來越難以承認「我不知道」 🤷


2. 即使嚴重誇誇其談、裝作無所不知,都還是會有很多人相信他 🤷


(好吧,至少證明AI還是人類文化養出來的小孩無誤)


▌ Zhou, L., Schellaert, W., Martínez-Plumed, F. et al. Larger and more instructable language models become less reliable. Nature (2024).h

2024年11月11日 星期一

《AI製造商沒說的祕密: 企業巨頭的搶才大戰如何改寫我們的世界?》的序言。

 

【差點改寫全球 AI 競爭的一場競標】
這是《AI製造商沒說的祕密: 企業巨頭的搶才大戰如何改寫我們的世界?》的序言。
本書英文版是由《紐約時報》和《連線》科技記者凱德.梅茲(Cade Metz)在2021年寫成,時報出版在2022年就翻譯在台出版了。我覺得原訂書名《天才製造商》要比《AI製造商沒說的祕密》更吸引人,也更符合英文書名。
當時辛頓(Geoffrey Hinton)雖然已經是 AI 大師,但還沒有獲得諾貝爾物理學家,也讓這本書出版時沒有獲得太多關注,但本書對於當代 AI 的起源 —— 不只是辛頓,還包含許多其他關鍵人物以及之前的歷史,有著十分詳細的紀錄。
以下是本書開頭的序言,從中可以看出,2012年,當代 AI 誕生之初,辛頓差一點就到百度去工作,為中國發展 AI 。如果成真的話,恐將改寫今日的全球科技競爭格局。有興趣的人不要錯過。
_____________
當傑弗瑞.辛頓(Geoffrey Hinton)登上多倫多前往太浩湖(Lake Tahoe)的巴士時,他已有七年沒有坐下了。「我上回坐下來還是二○○五年的事情,」他常常這麼說,「而那是一個錯誤。」他青少年時期幫母親抬蓄熱器傷了背,到他坐五望六時只要坐下就可能造成腰椎滑脫,只要一滑脫,那種痛楚就會讓他躺在床上好幾個星期。於是他不再坐下。
他在他多倫多大學的辦公室擺了一張站立式書桌。當他用餐時,他會在地上鋪一張泡棉墊,然後跪在桌前,像極了祭壇前的僧侶。搭小客車時他必須躺下來,整個身子伸展在後座。長途旅行時他都是搭火 車。他無法搭飛機,至少一般客機不行,因為都會要求他在飛機起飛與降落時必須坐下來。「我都覺得我要殘廢了──我感覺自己連一天都撐不住──我發現事態嚴重,」他說道,「你不如讓它完全控制你的生活,這樣你就不會有任何問題 了。」
那年秋天,在他躺在巴士後座前往紐約,一路搭乘火車來到位於加州內華達山脊頂端的特拉基(Truckee),然後癱在計程車後座,爬了三十分鐘的山路抵達太浩湖之前,他開了一家公司。除了他之外,該公司只有兩個人,都是他在多倫多大學實驗室的研究生。這家公司沒有產品,也不打算生產任何產品。它的網站上什麼都沒有,只有一個名稱,DNN 研究公司(DNNresearch),簡直比這網站還沒趣。
六十四歲的辛頓──看來準備在學術界終老一生,一頭雜草般的灰髮,平日老是穿著毛衣,永遠比人快兩步的幽默感──原本根本不想要開公司,是他兩個學生勸他這麼做的。但是當他抵達太浩湖時,中國一家企業巨擘已開價一千二 百萬美元要買下這家新創公司,而且很快地又有另外三家公司也加入競標,包括美國兩家最大的企業。
辛頓是要前往赫拉斯(Harrah’s)與哈維斯(Harvey’s),這是兩家高聳入雲的 賭場,位於太浩湖南岸滑雪山腳下。這兩座賭場聳立於內華達松樹群中,是一對由厚重的玻璃、鋼骨與石板構成的孿生建築物,同時也提供會議中心的服務,擁有數百間飯店客房、幾十個會議廳,以及多家(二流)餐廳。
那年的十二月,這兒舉行了一場電腦科學家年會,稱作 NIPS 大會,NIPS 是「神經訊息處理系統」 (Neural Information Processing Systems)的簡稱──是一個深入研究電算未來的 代名詞──NIPS 大會的主題是人工智慧(Artificial Intelligence,AI)。
辛頓是一位出生於倫敦的學者,自一九七○年代早期以來就一直在英國、美國與加拿大的 大學探索人工智慧的疆界。他幾乎每年都參加 NIPS 年會,但是這一回情況不同。 雖然中國已鎖定他的公司,但是他知道還有別人也大感興趣,而 NIPS 大會看來是一個競標的好地方。
兩個月前,辛頓與他的學生改變了機器看世界的方式。他們建造了一套所謂的神經網路(neural network),這是模仿人類大腦神經元網絡的數學系統,可以辨識一般的物體──例如花朵、狗與汽車──而且準確無比,前所未見。辛頓與他的學生證明,一套神經網路可以藉由分析大量數據來學習人類技能。他將之稱為 「深度學習」(deep learning),而其潛力無窮。它不但能夠改變電腦視覺,也能 帶動包括從語音數位助理、自動駕駛車到新藥研發的變革。
神經網路的概念可以回溯至一九五○年代,但是早期的研究前輩一直不得要領。隨著新的千禧年來到,大部分的研究人員都已放棄這個概念,認為在技術上是死路一條,或是要以數學系統來模仿人腦根本就是已有五十年歷史、不切實際 的想法。那些仍在探索此一科技可能性的專家學者在學術期刊發表論文時,甚至往往還會遮遮掩掩,以其他的字語來取代「神經網路」以避免觸怒其他的科學家。 辛頓是少數幾位仍然堅信此一科技終將大放異彩的科學家之一,他相信它不但能讓機器辨認物體,同時也能辨識口語、了解自然語言、進行交談,甚至解決人類無法自行解決的問題,或是為探索生物學、醫藥、地質學與其他科學的奧祕提供更為深刻的新途徑。
辛頓的堅持使他即使在自己的大學都成為一個特立獨行的 人,校方多年來一直否決他要求再聘請一位教授與他合作,為建造可以自我學習 的機器共同努力。他說:「有一個瘋子在做這樣的工作已經夠了。」但是到了二○一二年的春夏之際,辛頓與他的學生獲得重大突破:他們證明神經網路能以任何科技都無法企及的準確度來辨識物體。他們在該年秋天發表了一篇長達九頁的論文,向世人宣告神經網路此一概念的力量正如辛頓長期以來所堅信的無遠弗屆。
幾天後,辛頓收到另一位人工智慧科學家的電子郵件,此人名叫余凱,來自中國的科技巨擘百度。表面上,辛頓與余凱毫無共同之處。辛頓出生於戰後英倫的一個科學家世家,他們的影響力很大,古怪程度也不遑多讓。辛頓先是在劍橋就 讀,然後在愛丁堡大學拿到人工智慧博士學位,在接下來的三十年一直是電腦科學的教授。
余凱比辛頓晚了三十年出生,他成長於共產黨治下的中國,是一位汽車機師的兒子,在南京就讀,接著到慕尼黑深造,後來到矽谷一家企業研究實驗 室工作。他們兩人無論是在階級、年齡、文化、語言與地域環境上都相差得十萬八千里,但是他們卻共享一個特別的興趣:神經網路。
他們是在加拿大一場學術研討會上初識,這場研討會是為在科學界重振近乎休眠的神經網路研究所做的草 根性努力之一,同時也將其重新命名為「深度學習」。余凱是幫助傳播此一新信仰的人之一。回到中國後,他將此一概念帶入百度,該公司的執行長對他的研究 頗感興趣。當那篇來自多倫多大學的九頁論文出現時,余凱告訴百度智庫應該儘 快聘請辛頓。余凱在其電子郵件中將辛頓推薦給百度一位副總裁,後者向辛頓提 出酬勞高達一千二百萬美元,僅需工作數年的邀約。
起初,辛頓在北京的求才者覺得他們肯定已達成協議,但是辛頓卻不這麼想。 最近幾個月來他一直在與其他多家公司接觸,其中有大有小,包括百度的美國兩大勁敵,而他們也打電話到他在多倫多的辦公室,探詢聘用他與他的學生的可能性。看到機會愈來愈多,他於是詢問百度,他在接受一千二百萬美元的邀約前能否多考慮一會兒。百度同意了,而他則是趁此時機翻轉了整個情勢。
一方面受到學生的刺激,一方面了解到百度與其競爭對手相較於以高薪聘僱幾名來自國際學界的人士,可能會更願意以大手筆來買下一家公司,他於是決定成立自己的小公司。他將其稱為 DNN 研究公司,DNN 指的是他們專精的「deep neural networks」 (深度神經網路)。他還詢問多倫多的一位律師,他如何將一家只有三人、沒有 產品,也沒有歷史的公司價格最大化。律師認為他有兩個選擇:他可以僱用一位 談判專家,冒著觸怒有意買下他這家小公司的潛在買家的風險,或是他可以舉行一場拍賣會。辛頓選擇了拍賣會。最終有四家公司加入這場競標:百度、谷歌、 微軟,還有一家只成立兩年,名不見經傳的新創企業。這家公司名叫深度心智 (DeepMind),是由一位年輕的神經科學家德米斯.哈薩比斯(Demis Hassabis) 在倫敦設立的。該公司將成為近十年來最具聲望與影響力的人工智慧實驗基地。
在競標的那一週,谷歌高級工程部門的領導人艾倫.尤斯塔斯(Alan Eustace) 駕著他的雙引擎飛機降落在太浩湖南岸附近的機場。他和谷歌備受推崇的工程師傑夫.狄恩(Jeff Dean)與辛頓和他的學生在赫拉斯頂樓的一家餐廳共進晚餐, 這是一家由一千支空酒瓶裝飾的牛排館。當天是辛頓六十五歲生日。他站在吧檯旁邊,其他人則是坐在高腳凳上,談論谷歌的企圖心、拍賣會與他在多倫多實驗 室最近的研究工作。對谷歌的人來說,他們想利用這頓晚餐來掂掂辛頓這兩位年輕學生的斤兩,因為他們從未見過面。百度、微軟與深度心智也都派了代表來太浩湖參加大會,另外還有一些人也在拍賣會上試圖發揮影響力。余凱,這位引發辛頓與其學生爭奪戰的百度研究專家,在競標之前就曾與辛頓等人會面。但是這些競標者從來沒有共聚一堂的時候。競標是以電子郵件進行,大部分的出價都是由世界其他地方的企業高層發出,包括加州、倫敦與北京。辛頓並沒有透露競標者的身分。
他是在他下榻的旅館房間,可以遠眺內華達松樹群與白雪皚皚山峰的赫拉斯高塔七三一號房,主持拍賣。他每一天都會訂下下一回競標的時間,然後他和他的學生會在固定的時間在他的房間監看顯示在一部筆記電腦上的競標情況。
電腦是置於一個倒放的垃圾桶上,垃圾桶則是放在兩張加大尺寸雙人床前的桌上,只有這樣,辛頓才可以站著輸入資料。出價是由谷歌的電子郵件服務 Gmail 傳送至電 腦,這是因為辛頓在此有一個電子郵件帳戶。但是微軟不喜歡這樣的安排,在競標幾天前抱怨其最大的競爭對手谷歌可能會藉此竊取私人訊息,甚至操縱競標。 辛頓與他的學生也曾討論發生這種情況的可能性,不過在他看來,這不是什麼值得認真憂慮的事,而比較算是對谷歌勢力日趨龐大的嘲諷。技術上,谷歌確實可以看到 Gmail 的任何訊息。服務規定上說它不會這麼做,不過在現實生活中它若 是違反規定,也不太可能有人知道。最後,辛頓與微軟都同意將他們的顧慮擺在 一邊──辛頓表示「我們都相信谷歌不會看我們的 Gmail。」──那個時候他們都未曾想到,這將是一個意義非凡的時刻。
拍賣的規則相當簡單:在每一次出價後,這四家公司有一個小時的時間來提高買價,每次必須至少提高一百萬美元。這個一小時是自最近一次出價在電子郵件上出現的時間開始起算,如果一小時結束沒有新的出價,拍賣就宣告結束。深度心智是以公司股票而非現金來競標,但是它無法和科技世界的巨頭相拚,早早就退出競賽。如此一來,只剩下百度、谷歌與微軟。
出價持續升高,先是一千五百 萬美元,接著是兩千萬美元,微軟也退出了,不過之後又回來了。辛頓與他的學生一直在爭論哪一家公司適合他們加入,使得每一個時刻都顯得意義重大。一天下午稍晚,他們遠眺窗外山峰,看到兩架飛機對向飛來,凝結尾跡在空中形成一 個巨大的 X。在屋內興奮與緊張的氣氛驅使下,他們不禁猜想這代表什麼涵意,之後又想起谷歌的總部是位於一個叫山景(Mountain View)的地方。「難道是要我們加入谷歌?」辛頓問道,「或是暗示我們不應加入?」
出價到了二千二百萬美元,辛頓暫時中止拍賣,與其中一位競標者進行交談, 半小時之後,微軟再度退出。現在只剩下百度與谷歌了,隨著時間過去,這兩家公司的出價也愈來愈高。百度的出價原本由余凱負責,但是當出價達到二千四百 萬美元後,百度一位高層開始自北京接手。余凱三不五時會蹓躂到七三一號房, 希望能夠打探到一些競標的消息。
余凱根本不知道他的探訪對辛頓造成困擾。辛頓已六十五歲,他來太浩湖經常 會生病,因為當地空氣冷冽、稀薄、乾燥。他擔心自己會再度染病,而他不希望余凱或其他人看見。他表示,「我不想讓他們覺得我已老態畢露。」他於是將牆 邊可以拉出來的沙發床墊拆下來鋪在兩床之間,然後把熨衣板與一些厚重的物件 放在沙發床墊與兩床間的空隙內,上面掛著浸濕的毛巾,他就睡在這個臨時搭建 的頂篷下潮濕的空氣中。辛頓認為這樣可以避免他生病,問題是隨著拍賣持續進行,余凱,一個戴著眼鏡的圓臉小個子,總是會不時過來找機會聊天。辛頓不想讓余凱看到他為預防生病所做的措施,於是每當余凱到來,辛頓就會要他的兩名學生,這三人公司的另外兩人,趕快把沙發床墊、熨衣板與毛巾收起來。他告訴他們:「這是副總裁要做的事。」
在一次探訪之後,余凱把背包忘在室內了,辛頓與他的學生看到椅子上的背包,不禁在想是否應該打開背包,看看裡面有沒有百度會出價多少的資料。不過 他們並沒有這麼做,因為這是不對的。不管怎麼樣,他們很快就知道百度願意一 路提高出價:二千五百萬美元、三千萬美元、三千五百萬美元。隨著喊價持續走高,出價也開始在一小時接近尾聲時才會出現,在拍賣會就要結束時又把它延長。
出價一路飆高,辛頓將出價時間縮短至半小時。出價很快就攀上四千萬美元、 四千一百萬美元、四千二百萬美元、四千三百萬美元。他說:「這好像演電影一 樣。」一天晚上,將近午夜時分,出價來到四千四百萬美元,他再次暫停競標。 他需要睡眠。
翌日,在競標開始前三十分鐘左右,他發出電子郵件表示將會延後競標。大約 一個小時後,他又發出另一封電子郵件,拍賣結束了。在昨晚的某一時刻,他決定將公司賣給谷歌──而且不須加價。他給百度寄了一封電子郵件,表示百度接下來所寄的其他任何訊息,都將轉寄給他的新僱主,不過他並沒有說明他的新僱主是誰。
他後來承認他其實早就想要這樣的結果。甚至連余凱都猜想辛頓最終會屬意谷歌,或者至少是美國的企業,因為他的背部不允許他長途旅行至中國。儘管結果不盡如人意,但是余凱依然為百度能參與競價感到欣慰。他相信將美國的競爭對手逼到極限,足以讓百度的智庫得以了解深度學習在未來會有多重要。
辛頓叫停拍賣是因為他了解,為他的研究找到一個適合的家園要比提高賣價更 為重要。當他告訴谷歌的代表,他決定在四千四百萬美元的價位上停止競標,他們覺得他在開玩笑──他不可能放棄更高的價位。他是認真的,他的學生也與他有同樣的看法。他們是學者,不是創業家,他們應該忠於自己的理念。
但是辛頓並不了解他們的概念有多珍貴。事實上,沒有人料想得到。在其他一小批科學家的支持下──此一概念在這四家公司、另外一家美國網際網路巨擘, 以及一家新崛起的競爭者間播種生根──辛頓與他的學生很快將他們的概念發 展成為科技產業的重心。受此挹注,人工智慧的發展突飛猛進,包括語音數位助理、自動駕駛車、機器人、自動化保健服務,還有──儘管並非他們的本意── 自動化戰爭與監視。「它改變了我看待科技的方式,」艾倫.尤斯塔斯說道,「它也改變了其他許多人的看法。」
有些研究人士,尤其是德米斯.哈薩比斯,創辦深度心智的年輕神經科學家, 甚至相信他們能夠建造一部功效有如人腦的機器,甚至比人腦還好,這是自電腦時代草創初期以來就一直存有的夢想。沒有人能夠確定這樣的機器何時會出現, 但是儘管直到最近此一機器何時問世仍未可知,社會上已對其充滿期待。
人類向來對力量強大的機器敬畏有加,而且不時會對其押下重注。這一回的賭注更是高到研究此一概念的科學家難以想像。深度學習的興起代表從根本改變數位科技的發展。相對於一次只適用一個規則,一次只能套用一行程式,工程師開始建造能 夠透過他們的經驗來自我學習的機器,這些經驗需要承載超大量的數位資訊,數量之大,人腦根本無法處理。這類新式機器不僅力量空前強大,而且也更為神祕 與難以捉摸。
在谷歌與其他科技巨擘採用此一科技時,沒有人知道它其實是在學習研究人員的偏見。這些研究人員大部分都是白人男性,他們沒有看出問題所在,直到新一批的研究人員──女性與有色人種──點出問題。隨著此一科技的進一步發展,觸及保健、政府監視與軍事等方面的領域,誤入歧途的可能性也開始升高。 深度學習創造出一種力量,即使是當初的開發者也無法完全控制,尤其是如今已被永遠在追求營收與獲利的科技超級強權所把持。
在辛頓於太浩湖的拍賣會與 NIPS 年會結束後,余凱登上返回北京的飛機。他 遇到一位中國出生的微軟科學家,名叫鄧力,此人認識辛頓,並且也在拍賣中扮 演了一個角色。余凱與鄧力早在多年前的人工智慧大會與研討會上就已結識,他們特地訂了相鄰的座位,一起飛回亞洲。由於辛頓並沒有透露競標者的身分,因此他們兩人也無法確定有哪些公司參與競標。他們很想知道,而鄧力又愛聊天。 在飛行中,他們有好幾個小時就站在機艙後面,談論深度學習的崛起。但是他們各為其主,不能透露他們自己也曾參與拍賣。於是他們兩人的交談大繞圈子,一方面想打探對方的消息,一方面又極力避免透露自己的祕密。不過儘管他們沒有明說,他們都心知肚明,一場新的競爭已經登場。他們的公司必須回應谷歌的行動。科技業就是這樣運作,一場全球軍備競賽已經鳴槍起跑,而且這場競賽勢將日趨激烈,盛況空前。
與此同時,辛頓搭乘火車返回多倫多。他最終會落腳於谷歌在加州山景的總 部,不過他即使加入谷歌,也仍保留在多倫多大學的教授職位,繼續堅守他的理 念與目標,由此也為之後大批跟隨他腳步加入全球科技巨擘的專家學者樹立榜樣。幾年後,有人請他透露當初的競標者,他以他特有的風格回答。「我與他們 簽有協議不得透露他們。我與微軟簽了協議、與百度也簽了協議,還有谷歌,」 他說道,「最好不要再深究了。」他並沒有提到深度心智,不過那是另外一個故事了。在太浩湖拍賣會後,德米斯.哈薩比斯,這家倫敦實驗室的創辦人,也在世界上烙下自己的足印。就某些方面來看,他的觀點是響應辛頓的理念,但是就另一方面來看,他看得甚至更遠。不久之後,哈薩比斯也捲入了這場全球軍備競賽。
這是辛頓、哈薩比斯與其他一些科學家點燃這場戰火的故事。這一小批來自全球各地的專家學者,儘管互有不同,幾十年來一直堅守理念,往往必須面對排山倒海而來的質疑聲浪。隨著此一概念一夕成人,他們也被地表最大的幾家公司所 吸收,進入一個他們始料未及的混沌世界。
可能是文字的圖形