Herbert A. Simon 司馬賀: Cisco’s research team used algorithmic jailbreaking techniques to test DeepSeek R1 against 50 random prompts 瑞士人工智慧領域 DeepSeek：Gemini Flash 2.0 Thinking

Cisco’s research team used algorithmic jailbreaking techniques to test DeepSeek R1 against 50 random prompts from the HarmBench dataset, covering six categories of harmful behaviors including cybercrime, misinformation, illegal activities, and general harm.

"The results were alarming: DeepSeek R1 exhibited a 100% attack success rate, meaning it failed to block a single harmful prompt," Cisco says. "This contrasts starkly with other leading models, which demonstrated at least partial resistance."

Cisco's researchers blame the much lower development budget of DeepSeek compared to rivals. DeepSeek claims its model took just $6 million to develop, while a six-month training run for OpenAI's yet-to-be-released GPT-5 costs around half a billion dollars in computing costs alone.

可能是顯示的文字是「 PC MAG Hi, I'm DeepSeek NEWS DeepSeek Fails Researchers' Safety Tests According to Cisco, DeepSeek failed to block Abooobopoa a single harmful prompt. 」的圖像

近期，DeepSeek無疑是全球科技界最受矚目的焦點。然而，DeepSeek的爆紅更像是一場過度炒作的現象，目前市場傳聞與真實情況有所落差。

#DeepSeek背後是中資避險基金

DeepSeek的背後，其實有個不容忽視的推手：High-Flyer（幻方量化）。這是一家中國的對沖基金，早期就意識到人工智慧在金融以外領域的巨大潛力，並持續擴增其GPU供應。

High-Flyer早在2021年，也就是晶片出口管制之前，就投資了1萬顆A100GPU。而隨著High-Flyer的AI技術不斷提升，他們決定在2023年5月成立DeepSeek，專注於人工智慧的研發。

#訓練成本不只600萬美元

研究半導體和人工智慧的分析公司SemiAnalysis指出，600萬美元僅為預訓練過程中的GPU成本，並非模型全部成本。實際總成本遠高於此，因為還包括研發、硬體的總擁有成本（TCO）等。

做為參考，Claude 3.5 Sonnet的訓練成本高達數千萬美元。SemiAnalysis認為，如果訓練成本真的只有幾百萬美元，Anthropic就不需要從Google和Amazon募集數十億美元的資金。

#R1模型的推論能力是新典範

DeepSeek的R1模型也備受關注，其效能可與OpenAI的o1相提並論，後者甚至是去（2024）年9月才發布的。

SemiAnalysis指出，DeepSeek能夠如此迅速趕上，是因為推論能力是新的典範，迭代速度更快，而且可以透過較少的運算資源獲得顯著的進展。過去的範例主要依賴預訓練，但現在這變得更加昂貴，且難以獲得穩定的進展。

新的典範著重於透過合成資料生成和RL（強化學習）在現有模型上進行後訓練，這使得能夠以較低的成本更快地獲得進展。由於門檻較低，且容易優化，DeepSeek能夠比以往更快地複製o1的方法。

然而，隨著各家廠商開始研究如何在新的典範中擴展規模，趕上領先地位所需的時間可能會增加。

#Google的強力競爭

雖然R1引起了市場與大眾的關注，但Google在R1發布前一個月就推出了一款更便宜的推論模型：Gemini Flash 2.0 Thinking。

根據基準測試結果，Flash 2.0 Thinking的表現優於R1。SemiAnalysis認為，Google的模型非常穩健，在許多方面都可與R1相提並論，但並未受到相同的關注。

這可能是由於Google的市場策略和使用者體驗不佳所致，也可能是因為R1的中國背景更引人注目。

#DeepSeek將引發AI價格戰

SemiAnalysis認為，DeepSeek的創新對於利潤率有深遠影響。他們預期，DeepSeek正在補貼價格以獲得市佔，實際上沒賺到錢。此外，傑文斯悖論（Jevons paradox）正在發生。

這場由中國新創引發的人工智慧價格戰，不僅考驗著現有業者的應對策略，更可能加速產業洗牌，為全球科技產業帶來新一輪的變革。

可能是顯示的文字是「 TNL 圖片來源圖片來源：Shutterstock Shutterstock < Search Search cc 1:15 1:15 oe ΑΙ AAλCEOH DeepSeek- Assistant 4.5 Open Open IntelligentA moloin 破解 DeepSeek 神話：破解Deepseek神話：華爾華爾街可能誤讀了這場AI革命？街可能誤讀 A 革命？」的圖像

所有心情：

2025年瑞士人工智慧領域將有大動作

2025年01月27日 • 2025年，瑞士將在人工智慧(AI)監管法規、醫療和製藥等領域的“瑞士版ChatGPT”，以及自動駕駛汽車落地等方面邁出重要步伐，這不僅將為自身塑造人工智慧發展的新格局，也為全球提供一份值得借鏡的樣本。

人工智能芯片之争：瑞士缘何不被美国视为盟友？

2025年01月27日 • 日前，美国将瑞士排除在无限制获取人工智能所需芯片的盟友名单之外。美国试图通过限制先进芯片技术的出口，防止中国在人工智能和军事领域取得优势。在此背景下，美国对芯片出口实施了更严格的管控政策，这也波及到瑞士等未被列入“最亲密盟友”名单的国家。

Herbert A. Simon 司馬賀

2025年2月3日星期一

Cisco’s research team used algorithmic jailbreaking techniques to test DeepSeek R1 against 50 random prompts 瑞士人工智慧領域 DeepSeek：Gemini Flash 2.0 Thinking

沒有留言:

網誌存檔

2025年2月3日 星期一

Cisco’s research team used algorithmic jailbreaking techniques to test DeepSeek R1 against 50 random prompts 瑞士人工智慧領域 DeepSeek：Gemini Flash 2.0 Thinking

沒有留言:

2025年2月3日星期一