【新唐人北京時間2024年10月19日訊】中國互聯網上傳出消息,指中國頭部科技公司字節跳動的大模型訓練遭到入侵,被一名實習生注入破壞代碼,潛在損失可能超過千萬美元。但被指實施入侵的田姓實習生卻堅稱,破壞行為是其他人所為。專家稱,此次事件暴露出字節跳動的模型訓練存在安全漏洞。
星期五(10月18日),一則消息在微信群內廣泛流傳引起社會輿論關注。根據這則消息所言,「某頭部大廠」的大模型訓練被實習生入侵,注入了破壞代碼,導致其訓練成果不可靠,可能需要重新訓練。消息稱,「遭到入侵的代碼注入了8000多張卡,帶來的損失可能超過千萬美元。」
陸媒界面新聞報導稱,有知情人士透露,上述傳聞中的「頭部大廠」指的是字節跳動,而此事件發生在今年6月。當時,某高校的一名博士生在字節跳動商業化技術團隊實習,因對團隊資源分配不滿,便使用攻擊代碼破壞團隊的模型訓練任務。
網絡社群中還有傳言透露了這起事件的一些細節。據稱,那名博士實習生姓田,他利用了 HF(疑指huggingface)的漏洞,在公司的共享模型裡寫入了破壞代碼,導致模型的訓練效果忽高忽低,無法產生預期的訓練效果,而AML 團隊一時也難以查明原因。
傳聞還提到,這名實習生現在已經被辭退,而字節跳動已將此事通報給大模型行業聯盟和實習生所在學校。
陸媒聯繫了字節跳動,就上述傳聞向該公司求證,但後者沒有就此作出回應。
向陸媒爆料的「知情者」所提到的那位高校實習生田某某,卻在網絡社群中公開闢謠,堅稱自己是被冤枉的。該實習生在微信群裡發帖稱,自己當初發完論文後就離開了字節跳動,在這個當口有另一個人鑽漏洞改模型代碼,把鍋扣到了自己頭上。
一位技術安全專家在接受陸媒採訪時介紹說,HF漏洞的產生通常與單一性集中訓練有關。如果傳聞屬實,則此次事件暴露出字節跳動在技術訓練中,既未實施權限隔離,也未做好共用代碼的審計工作,存在安全管理問題。
(記者何雅婷綜合報導/責任編輯:鄭宇)