美斯坦福團隊抄襲中國開源模型「小鋼炮」公開道歉中國AI大模型崛起勢不可擋

財經緯度

2024-06-12 11:24

近日，斯坦福大學AI團隊主導的Llama3-V開源模型被證實套殼抄襲中國清華大學與面壁智能的開源模型“小鋼炮”MiniCPM-Llama3-V 2.5。

斯坦福Llama3-V團隊的兩位作者森德哈斯·沙瑪和阿克沙·加格在社交平臺上，就這一學術不端行爲向中國面壁MiniCPM團隊正式道歉。

斯坦福人工智能實驗室主任Christopher David Manning發文譴責這一抄襲行爲，並對MiniCPM這一中國開源模型表示讚揚。

斯坦福AI團隊在網絡上宣傳只需500美元就可訓練出一個超越GPT-4V的SOTA多模態大模型。然而該團隊的Llama3-V模型使用的模型結構和代碼與中國面壁智能不久前發布的MiniCPM-Llama3-V2.5極爲相似，僅修改了部分變量名。Llama3-V也具有與MiniCPM-Llama3-V 2.5相同的分詞器，包括後者新定義的特殊符號。

中國面壁智能團隊證實，斯坦福大模型項目Llama3-V與MiniCPM一樣，可以識別出“清華簡”戰國古文字，“不僅對得一模一樣、連錯得都一模一樣”。這一古文字數據爲中國研究團隊花費數月從清華簡上逐字掃描並人工標註而得來，從未對外布開，從而證實抄襲事實。

中國面壁智能首席科學家、清華大學長聘副教授劉知遠表示，人工智能的飛速發展離不開全球算法、數據與模型的開源共享，讓人們始終可以站在SOTA的肩上持續前進。面壁開源的MiniCPM-Llama3-V 2.5 就用了最新的Llama3作爲語言模型基座。而開源共享的基石是對開源協議的遵守，對其他貢獻者的信任，對前人成果的尊重和致敬，Llama3-V團隊無疑嚴重破壞了這一點。

自去年以來，中國大模型如同雨後春筍般陸續開源，從以往的受益者轉變爲貢獻者，不吝於向世界提供更多開源的優異成果。上至阿里巴巴、騰訊等巨頭，下至面壁智能，智譜AI、崑崙天工等AI初創，也都是開源社區的積極分子，在爲中國大模型的發展添磚加瓦。

這起事件令人深思，引發了全球範圍內對中美科技競賽的新一輪關注。斯坦福大學AI項目團隊抄襲中國大模型公司的開源模型，從一個角度看，這起事件揭示了中國AI研發的實力，越來越多的創新產品開始受到國際廣泛關注，中國在大模型研發上的發展速度可見一斑。中國的創新能力、應用場景、算法優化和數據資源在全球大模型競爭中佔據了重要位置。

另一方面，這件事也揭示了AI領域的一個挑戰，那就是如何維護和尊重知識產權。儘管在開源社區中，共享和借鑑是鼓勵的，但明確的署名和尊重作者的貢獻是基本的道德底線。

這次事件無疑對斯坦福大學AI團隊的聲譽造成了一定的影響。在科研領域，遵守學術誠信和尊重知識產權是非常基本也是非常重要的。該團隊抄襲他人的開源模型，並試圖將其作爲自己的研究成果進行推廣，這種行爲既違反了學術誠信原則，也傷害了原作者的權益。

總的來看，對於全球的AI領域來說，這是一個引人深思的事件，也是一個學習和改進的機會。它揭示了中國在AI研發上的強大實力，也提醒人們在發展的同時要尊重和保護知識產權。在未來，人們期待看到的是一個公平、包容且尊重創新的全球AI領域。