「不完美」的百度文心一言,背水一戰(zhàn)

jh 3年前 (2023-03-17)

國產(chǎn)ChatGPT應(yīng)用,仍待市場檢驗。

大概百度CEO李彥宏自己也沒有想到,GPT-4會突然“搶跑”。

因此在今日下午的文心一言發(fā)布會現(xiàn)場,李彥宏的話語之間少了些從容,多了幾分緊張,開場白中也多次提及GPT-4。

在隨后的展示環(huán)節(jié)中,李彥宏親自展示了文心一言在五個使用場景的表現(xiàn),包括文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解以及多模態(tài)生成。

不過由于現(xiàn)場采用錄播的形式進(jìn)行演示,因此不少觀眾對評論中紛紛表達(dá)出失望。

資本市場更是直接用股價“表達(dá)”不滿,在李彥宏臺上講話的同時,百度股價在港股市場上直接跳水,一度暴跌10%。

那么文心一言真的如網(wǎng)友所評價的一樣“不堪”嗎?

中國版ChatGPT,能力如何?

十月懷胎,一朝分娩”。

每個人都在期待這個預(yù)熱多時的AI大模型文心一言長什么樣?

在進(jìn)行簡單的開場白后,李彥宏直接展示了文心一言的五大能力:

· 文學(xué)創(chuàng)作

在這一環(huán)節(jié),李彥宏拿出了知名科幻小說《三體》和文心一言進(jìn)行了六輪對話,主要體現(xiàn)文心一言所具有的總結(jié)能力、推理能力等等。

作為大模型的最基本能力,文心一言采用了5500億知識圖譜的事實的訓(xùn)練數(shù)據(jù),來保證事實性問題回答準(zhǔn)確。

從回答來看,文心一言的準(zhǔn)確性相當(dāng)不錯。

“不完美”的百度文心一言,是否還有驚喜?

· 商業(yè)文案創(chuàng)作

李彥宏以一家科技服務(wù)創(chuàng)業(yè)公司為例,要求文心一言從取名、Slogan等方面提出建議。

文心一言表現(xiàn)出的能力也符合預(yù)期,還為生成的5個公司名稱進(jìn)行了解釋。

“不完美”的百度文心一言,是否還有驚喜?

· 數(shù)理邏輯推算

用大模型做題,是ChatGPT的亮點之一,文心一言也具備這一能力。

這一環(huán)節(jié),李彥宏提出了“雞兔同籠”這一中國古代典型數(shù)學(xué)題。

一開始,題目中給出一個錯誤的數(shù)據(jù),文心一言及時給出了提示。

在修改數(shù)據(jù)后,文心一言不僅給出了正確答案,同時也給出了解題步驟。

“不完美”的百度文心一言,是否還有驚喜?

· 中文理解

毫無疑問,這是國產(chǎn)大模型與英文大模型最大的區(qū)別之一。

據(jù)李彥宏表示,文心一言使用了大量中文數(shù)據(jù)集來進(jìn)行訓(xùn)練。

在現(xiàn)場展示的有關(guān)“洛陽紙貴”的一系列問題時,文心一言合理解釋了這個帶有內(nèi)涵的成語,同時秀了一首藏頭詩。

不過李彥宏也坦言,文心一言在處理英文問題時還存在差距,部分原因是因為在訓(xùn)練數(shù)據(jù)樣本還不夠大。

由此可見,文心一言還是更貼近中文語境。

“不完美”的百度文心一言,是否還有驚喜?

· 多模態(tài)生成

對比上一代產(chǎn)品,GPT-4最大的特點是支持多模態(tài)生成。而這一次,文心一言也展示了自身多模態(tài)生成能力。

在現(xiàn)場,文心一言現(xiàn)場秀了一段四川話,還展示了一段文字轉(zhuǎn)視頻的能力。

“不完美”的百度文心一言,是否還有驚喜?

有趣的是,李彥宏在展示這一環(huán)節(jié)時,百度的股價一度有回升的態(tài)勢,但李彥宏隨后表示視頻暫時還沒有對外開放后,上漲的勢頭突然就被“撲滅”……

從上述五大能力來看,文心一言已經(jīng)具備了ChatGPT擁有的能力,甚至在“雞兔同籠”、“洛陽紙貴”等表現(xiàn)上更勝一籌。

但奈何GPT-4直接降維打擊,沖擊感更大,能力也更強。

當(dāng)文心一言拋出這些“新功能”時,很難再稱得上是一種驚喜。

“不完美”的文心一言,沒有退路

在發(fā)布會上,李彥宏提出一個問題,百度是不是真的Ready了?

這一問題上,李彥宏并沒有給出直接答復(fù),而是從側(cè)面指出,百度是全球大廠中第一個發(fā)布對標(biāo)ChatGPT的產(chǎn)品,甚至超過了微軟和谷歌(注:李彥宏指出,微軟是直接調(diào)用GPT)。

同時他指出,選擇于此時發(fā)布,主要是基于市場需求。

眾所周知,隨著GPT-4的震撼發(fā)布,OpenAI在產(chǎn)品力上又向前邁進(jìn)一步,這對于國內(nèi)廠商來說并不是什么好消息。

目前國內(nèi)追趕OpenAI的陣營中,百度在大模型上的研發(fā)投入屬于第一梯隊,從發(fā)布會上的演示來看,文心一言的表現(xiàn)其實表現(xiàn)的非常出色,在多個環(huán)節(jié)表示完全不輸ChatGPT。

但眾所周知,發(fā)布多時的ChatGPT是基于GPT-3.5架構(gòu)開發(fā),而GPT-4已經(jīng)是新一代的升級版本。

隨著GPT-4以狂飆之勢涌入主流視野,百度的進(jìn)度一瞬間就被甩開了一大截。

作為百度的帶路人,李彥宏自然深知行業(yè)的一舉一動,如果此時再不上馬“文心一言”,后面的壓力可想而言。

因此在進(jìn)退兩難面前,李彥宏還是選擇迎頭直面OpenAI。

或許文心一言的demo演示或多或少讓人感到失望,但當(dāng)下目前最重要的任務(wù)還是搶占市場還是。

值得一提的是,在百度 CTO 王海峰上臺分享了背后的技術(shù)與百度多年的技術(shù)積累后,百度的股價再次“抬頭”。

“不完美”的百度文心一言,是否還有驚喜?

多年沉淀,文心一言仍有機會顛覆

不可否認(rèn)的是,文心一言在一些細(xì)節(jié)上仍顯得不足,李彥宏也正視了文心一言與頂尖模型GPT-4的差距。

不過,中文大模型與英文大模型從背后邏輯來看存在差異。多數(shù)業(yè)內(nèi)人士指出,中文與英文的互聯(lián)網(wǎng)環(huán)境互相不同,訓(xùn)練的難度也有所不同。

即便是ChatGPT,在一些中文問題上也會有水土不服的現(xiàn)象,例如“藏頭詩”,GPT-4就很難理解。

而這一點,在中文環(huán)境中沉淀多時的文心一言就表現(xiàn)的更好。

事實上,文心一言并不是一個新事物,該大模型從2019年誕生的預(yù)訓(xùn)練模型ERNIE1.0開始,歷經(jīng)多年的迭代,最終構(gòu)成了如今的文心大模型。

而在發(fā)布會上,王海峰也介紹道,文心一言是新一代知識增強大語言模型,是在ERNIE及PLATO系列模型的基礎(chǔ)上研發(fā)的。它的關(guān)鍵技術(shù)包括有監(jiān)督精調(diào)、人類反饋的強化學(xué)習(xí)、提示、知識增強、檢索增強和對話增強。

“不完美”的百度文心一言,是否還有驚喜?

換句話說,文心一言更像是百度多年以來AI能力的大合集。

除了AI對話以外,文心大模型涉及的應(yīng)用非常多,包括搜索、智能云、自動駕駛、繪畫等多個領(lǐng)域。涉及的行業(yè)也涵蓋了金融、能源、媒體、政務(wù)等千行百業(yè)。另外在會上,百度表示已有超過650家企業(yè)宣布接入文心一言生態(tài)。

因此,在實際應(yīng)用面前,文心一言的商業(yè)能力還是遠(yuǎn)超其他公司。這也驗證了李彥宏所說的:“此時發(fā)布,主要是基于市場需求。”

隨著后期越來越多的用戶接入文心一言,該大模型的能力也會不斷提升。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動創(chuàng)新

分享到