微信掃一掃
中國人工智能公司深度求索(DeepSeek)近期開源人工智能(AI)模型DeepSeek-V3和DeepSeek-R1,引起了硅谷同行以及西方媒體的高度關(guān)注。
1月23日,英媒《金融時(shí)報(bào)》刊文《深度求索等中國初創(chuàng)企業(yè)正在挑戰(zhàn)全球AI巨頭》,對(duì)于深度求索給予高度評(píng)價(jià)。文章稱,該公司推出的V3模型震驚了國際科技界,其性能可與資金更雄厚的OpenAI等美國競(jìng)爭(zhēng)對(duì)手相媲美;R1模型給人留下了深刻印象,是其進(jìn)軍AI推理領(lǐng)域的嘗試。
美國南加州大學(xué)古爾德法學(xué)院法學(xué)教授張湖月(Angela Zhang)在文中提到,深度求索并非孤例。自去年年中以來,阿里巴巴、騰訊、字節(jié)跳動(dòng)等中國科技公司一直在穩(wěn)扎穩(wěn)打,逐步縮小與美國同行的差距,在能力上與他們匹敵,在成本效率上超越他們。
“中國在效率方面的成就并非偶然。這是中國對(duì)美國及其盟友不斷升級(jí)的出口限制的直接回應(yīng)?!睆埡抡J(rèn)為,“美國限制中國獲取先進(jìn)的AI芯片,卻無意中刺激了中國的創(chuàng)新。”
Deepseek-V3與多個(gè)國內(nèi)外大模型的測(cè)試數(shù)據(jù)對(duì)比“Deepseek”公眾號(hào)
文章觀察到,在美國打壓中企并限制AI芯片對(duì)華出口后,為了減少對(duì)海外高端芯片的依賴,中國AI公司在算法、架構(gòu)和訓(xùn)練策略方面嘗試了新方法。許多公司采用了“混合專家”方法,專注于針對(duì)特定數(shù)據(jù)進(jìn)行訓(xùn)練的小型AI模型。這些方法可以在減少計(jì)算資源的同時(shí)提供強(qiáng)大的結(jié)果。
DeepSeek-V3模型體現(xiàn)了這種方法的成功。根據(jù)其技術(shù)報(bào)告,該模型使用由英偉達(dá)H800 GPU驅(qū)動(dòng)的數(shù)據(jù)中心進(jìn)行訓(xùn)練。據(jù)介紹,深度求索公司僅用兩個(gè)月就完成了訓(xùn)練,成本為550萬美元,僅為OpenAI等美國公司所花費(fèi)金額的一小部分。
深度求索公司還大幅降低了推理成本,因此獲得了“AI屆拼多多”的綽號(hào)。這一突破意義深遠(yuǎn),挑戰(zhàn)了人們普遍持有的假設(shè),即尖端AI需要大量計(jì)算能力和高達(dá)數(shù)十億美元的資金。深度求索展示了軟件的獨(dú)創(chuàng)性如何抵消硬件的限制。
文章稱,這同時(shí)暴露了美國旨在阻礙中國AI發(fā)展的出口管制的局限性。雖然這些措施可能會(huì)造成短期干擾,但隨著中國不斷創(chuàng)新以適應(yīng),其影響只會(huì)逐漸減弱。
“對(duì)于美國政策制定者來說,一個(gè)難以接受的事實(shí)是,嚴(yán)格的出口管制迫使中國科技公司變得更加自力更生,從而推動(dòng)了原本可能不會(huì)發(fā)生的突破?!蔽恼氯绱藢懙?。
文章認(rèn)為,美國對(duì)華限制,“在不經(jīng)意間”提供了一個(gè)強(qiáng)大的商業(yè)激勵(lì),促使中國私營(yíng)部門填補(bǔ)AI這一空白。盡管美國通常在開創(chuàng)性研究中占據(jù)主導(dǎo)地位,但中國公司在執(zhí)行力、價(jià)格承受能力和產(chǎn)品推廣方面表現(xiàn)出色。這一點(diǎn)已在電子商務(wù)、電動(dòng)汽車、太陽能電池板和電池等領(lǐng)域得到了生動(dòng)體現(xiàn)。
“深度求索的崛起生動(dòng)地提醒我們,限制可以促進(jìn)創(chuàng)新?!蔽恼伦詈笙蛎绹岢鲆蓡枺皩?duì)于特朗普的新政府來說,這提出了一個(gè)令人不安的問題:對(duì)中國實(shí)施越來越嚴(yán)厲的制裁是否會(huì)適得其反,加速他們?cè)鞠胍獕褐频倪M(jìn)步?”
值得注意的是,張湖月并非唯一一個(gè)提出上述疑問的學(xué)者。
“深度求索的誕生,說明了為什么特朗普很難打贏貿(mào)易戰(zhàn)?!?月9日,美國喬治梅森大學(xué)經(jīng)濟(jì)系教授泰勒·考恩在彭博社刊文稱,由于美國限制對(duì)華出口芯片,深度求索等中企無法獲得最新的尖端芯片,因此不得不尋找其他更便宜的方法來訓(xùn)練其模型,并“間接導(dǎo)致了中國重要?jiǎng)?chuàng)新的出現(xiàn)”。
考恩在文中引用了奧地利經(jīng)濟(jì)學(xué)家路德維?!っ兹沟囊痪湓挘骸罢深A(yù)會(huì)產(chǎn)生重要的、意想不到的次生后果。”他表示,要看一項(xiàng)政策是否奏效,不僅要考慮其直接影響,也要看它的二階甚至三階影響。
22日,前《紐約時(shí)報(bào)》專欄作者克雷格·史密斯在美國《福布斯》雜志刊文稱,深度求索的成功,體現(xiàn)了中國AI創(chuàng)新者是如何挑戰(zhàn)現(xiàn)狀的。他同樣認(rèn)為,美國的出口管制旨在減緩中國AI的發(fā)展,但這可能無意中刺激了創(chuàng)新,中企被迫尋找創(chuàng)造性的解決方案,以更少的投入實(shí)現(xiàn)更多的成果。
史密斯預(yù)測(cè)稱,隨著中國繼續(xù)投資和推動(dòng)開源AI發(fā)展,同時(shí)應(yīng)對(duì)出口管制帶來的挑戰(zhàn),全球技術(shù)格局可能會(huì)進(jìn)一步改變權(quán)力動(dòng)態(tài)、合作模式和創(chuàng)新軌跡。這一戰(zhàn)略的成功可能使中國成為塑造AI未來的主導(dǎo)力量,對(duì)技術(shù)進(jìn)步、經(jīng)濟(jì)競(jìng)爭(zhēng)力和地緣政治影響力產(chǎn)生深遠(yuǎn)影響。
不久前,深度求索公司創(chuàng)始人梁文鋒接受媒體采訪時(shí)指出:“在顛覆性的技術(shù)面前,閉源形成的護(hù)城河是短暫的。即使OpenAI閉源,也無法阻止被別人趕超。”
深度求索的迅速崛起,引起了美國媒體和硅谷的警惕。
Scale AI首席執(zhí)行官亞歷山大·王談深度求索AI新模型視頻截圖
當(dāng)?shù)貢r(shí)間22日,微軟首席執(zhí)行官薩蒂亞·納德拉在瑞士達(dá)沃斯世界經(jīng)濟(jì)論壇上表示:“深度求索的新模型非常令人印象深刻,他們不僅有效地開發(fā)出一種開源模型,實(shí)現(xiàn)了推理時(shí)間計(jì)算,而且計(jì)算效率極高?!彼麖?qiáng)調(diào):“我們應(yīng)該非常認(rèn)真地對(duì)待中國的發(fā)展?!?/p>
美國AI科技公司Scale AI首席執(zhí)行官亞歷山大·王(Alexandr Wang)23日接受美國消費(fèi)者新聞與商業(yè)頻道(CNBC)采訪時(shí)說,中國已憑借深度求索推出的開源模型迅速趕超美國。他表示:“我們發(fā)現(xiàn),深度求索模型表現(xiàn)最佳,大致與美國最好的模型相當(dāng)?!?/p>
亞歷山大·王認(rèn)為中美間正在進(jìn)行“AI戰(zhàn)爭(zhēng)”,并補(bǔ)充說,中國在AI領(lǐng)域擁有比英偉達(dá)更強(qiáng)大的人才儲(chǔ)備。他說:“美國將需要大量的計(jì)算能力和基礎(chǔ)設(shè)施。我們需要釋放美國的能量來推動(dòng)AI繁榮?!?/p>
24日,CNBC再次發(fā)文稱,深度求索的AI模型“威脅美國在AI領(lǐng)域的主導(dǎo)地位”。文章表示,深度求索花費(fèi)兩個(gè)月和約500萬美元完成了V3模型的構(gòu)建,引起了人們對(duì)于美國在AI領(lǐng)域的全球領(lǐng)先地位正在縮小的擔(dān)憂,并對(duì)大型科技公司在建設(shè)AI模型和數(shù)據(jù)中心方面的巨額投入提出了質(zhì)疑。
廣州信息港是免費(fèi)發(fā)布廣州招聘、求職、交友、二手、房產(chǎn)、廣州夜場(chǎng)招聘、廣州夜總會(huì)招聘、廣州ktv招聘、廣州夜總會(huì)預(yù)訂、廣州酒吧預(yù)訂、廣州ktv預(yù)訂等商業(yè)服務(wù)分類信息免費(fèi)發(fā)布平臺(tái)。www.258754.com
Copyright @ 2003-2023 廣州信息港-yczixun.com All Right Reserved