來源:新華社
2024-06-05 10:55:06
新華社舊金山6月3日電 硅谷手記|AI抄襲背后的硅谷“不光彩文化”
新華社記者吳曉凌 黃堃
“‘作假,直至成功’,這是硅谷不光彩的文化。”美國斯坦福大學人工智能實驗室主任克里斯托弗·曼寧3日就該校某些研究人員抄襲中國清華大學等機構(gòu)成果的行為這樣評論說。他在社交媒體上還指出,該研究團隊應(yīng)該深刻認識自己的錯誤。
??圖為2024年5月30日,在瑞士日內(nèi)瓦舉行的2024年“人工智能造福人類全球峰會” 上,參會者和中國移動開發(fā)的AI機器人下棋。(新華社記者連漪攝)
5月29日,斯坦福大學一個研究團隊發(fā)布名為Llama3-V的大模型,聲稱只要500美元的預訓練成本,就能用它獲得比肩GPT-4V等著名大模型的效果。這一消息在社交媒體和人工智能學術(shù)界被廣泛轉(zhuǎn)發(fā)。
但業(yè)內(nèi)人士很快發(fā)現(xiàn),該大模型涉嫌抄襲清華大學等機構(gòu)發(fā)布的 MiniCPM-Llama3-V 2.5大模型。它們都是基于開源的Llama3大模型,但清華團隊進行了獨特的訓練,包括利用“清華簡”(清華大學收藏的一批戰(zhàn)國竹簡)訓練它識別古代中國文字的能力。測試顯示,斯坦福大學這個團隊發(fā)布的大模型居然也能識別“清華簡”。
“已經(jīng)比較確信,斯坦福這個團隊‘套殼’了我們的大模型研究成果。”清華大學計算機系長聘副教授劉知遠對新華社記者說。
“我們從‘清華簡’逐字掃描并標注的數(shù)據(jù)集從未公開,而Llama3-V展現(xiàn)出了一模一樣的識別‘清華簡’能力,連做錯的樣例都一樣。”劉知遠是清華這個大模型團隊成員。他介紹說,在質(zhì)疑聲發(fā)酵后,對方已經(jīng)在網(wǎng)上刪除了此前發(fā)布的數(shù)據(jù)庫和宣傳文章,“從證據(jù)和對方反應(yīng)來看,抄襲性質(zhì)已比較確定”。
曼寧發(fā)聲批評后,斯坦福該團隊的兩名成員夏爾馬和加格也在社交媒體上正式道歉,并表示要完全撤下Llama3-V模型。
在當前的人工智能熱潮中,這個事件引發(fā)廣泛關(guān)注。有觀點認為美國的人工智能全面領(lǐng)先,但該事件說明,雖然美國科技仍然整體領(lǐng)先,但遠非全能,也不應(yīng)迷信美國單方宣布的“重大成果”。
斯坦福大學所處的硅谷地區(qū)被認為是美國科技創(chuàng)新的重鎮(zhèn),既孕育了許多先進技術(shù),也有“作假,直至成功”等被津津樂道的負面文化。
比如,從斯坦福大學退學創(chuàng)業(yè)的伊麗莎白·霍姆斯曾吹噓有顛覆性檢測技術(shù)可“抽指血查癌癥”,一度成為全球聞名的科技創(chuàng)業(yè)明星,但后來被發(fā)現(xiàn)造假并因欺詐投資者罪名獲刑。放眼整個美國科技領(lǐng)域,近年來波音客機事故頻發(fā)等暴露了更多、更大的問題。
在人工智能領(lǐng)域,前段時間還有個“著名”事件,在用中文問谷歌人工智能模型“雙子座”Pro版(Gemini Pro)它是誰時,它會回答自己是“文心一言”,這個問題很快被谷歌消除。業(yè)界人士認為,其原因可能是谷歌在訓練大模型的中文時“參考”了中國百度公司的大模型“文心一言”相關(guān)數(shù)據(jù)。
可見,中國科技近年來快速發(fā)展,一些獨特的優(yōu)勢越來越引人注目,被美國同行“參考”甚至抄襲。
“中國人工智能研究的國際影響力越來越大”,劉知遠說,“這次抄襲事件也從側(cè)面反映了我們的創(chuàng)新成果正在受到國際關(guān)注”。他說,從橫向來看,中國研究與國際頂尖成果仍有顯著差距,但從縱向來看,中國已快速成長為人工智能科技創(chuàng)新的重要推動者。
想爆料?請登錄《陽光連線》( https://minsheng.iqilu.com/)、撥打新聞熱線0531-66661234或96678,或登錄齊魯網(wǎng)官方微博(@齊魯網(wǎng))提供新聞線索。齊魯網(wǎng)廣告熱線0531-81695052,誠邀合作伙伴。