編故事神器的完整版代碼來(lái)了!但OpenAI不保證不被濫用

巫盼 6年前 (2019-11-08)

技術(shù)永遠(yuǎn)是把雙刃劍。

時(shí)隔九月,OpenAI終于放出了旗下最強(qiáng)NLP模型 GPT-2模型的完整代碼,包含15億參數(shù)。

編故事神器的完整版代碼來(lái)了!OpenAI不保證不被濫用

這套模型最初是被OpenAI的工程師用來(lái)根據(jù)文本中已知的單詞預(yù)測(cè)下一個(gè)單詞,后來(lái)經(jīng)過(guò)大量數(shù)據(jù)訓(xùn)練后,成為了現(xiàn)在的AI文本生成系統(tǒng)。該模型不僅可以根據(jù)給定的文本流暢地續(xù)寫句子,甚至可以形成成篇的文章,寫作水平堪比人類,被外界成為新一代“編故事”神器。

另外,GPT-2模型還可以執(zhí)行機(jī)器翻譯、問(wèn)答、閱讀理解和總結(jié)段落等任務(wù)。之前,OpenAI 已經(jīng)發(fā)布了不同參數(shù)大小的三種GPT-2模型,今年2月,他們?cè)疽尦鐾暾腉PT-2模型,期望GPT-2能夠被用來(lái)開(kāi)發(fā)成寫作AI助手或是語(yǔ)言理解系統(tǒng)等應(yīng)用。

但是許多研究人員持反對(duì)意見(jiàn),認(rèn)為該套模型會(huì)被用于制造假新聞,甚至被極端主義團(tuán)體濫用進(jìn)行意識(shí)形態(tài)的干涉影響,技術(shù)引發(fā)的爭(zhēng)議讓OpenAI決定暫緩?fù)暾a的開(kāi)源,僅發(fā)布較小型的模型、范例和技術(shù)白皮書,供外部研究人員使用。

經(jīng)過(guò)幾個(gè)月的調(diào)查,OpenAI表示還未發(fā)現(xiàn)改模型被濫用的證據(jù),所以選擇釋出模型的完整代碼。同時(shí)他們也開(kāi)發(fā)了一種檢測(cè)模型,來(lái)防范模型產(chǎn)生的造假文件,面對(duì)由GPT-2 生成的文本,檢測(cè)模型能夠帶來(lái)95%的成功率。

編故事神器的完整版代碼來(lái)了!OpenAI不保證不被濫用

但OpenAI的研究人員也表示,隨著文字生成器的輸出質(zhì)量持續(xù)提升,被濫用的可能性就會(huì)提高,而檢測(cè)的挑戰(zhàn)性也更高。

所以,后續(xù)OpenAI會(huì)持續(xù)研究語(yǔ)言模型存在的偏差,并通過(guò)參與Partnership on AI的“Responsible Publication Norms for Machine Learning”項(xiàng)目,與其他AI研究人員共同探討此類問(wèn)題。

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到