程序員最?lèi)?ài)的問(wèn)答網(wǎng)站,給ChatGPT當(dāng)起了“奶媽”
打不過(guò),就加入。
Stack Overflow,一個(gè)類(lèi)似知乎、Reddit的老牌網(wǎng)站,因?qū)W⒂诩夹g(shù)問(wèn)答和社區(qū)運(yùn)營(yíng),因此在全球程序員圈內(nèi)備受歡迎。
然而自從ChatGPT問(wèn)世以來(lái),該網(wǎng)站的訪問(wèn)量和搜索量都在短時(shí)間里驟降,眾多程序員開(kāi)始放棄使用。
為了挽留住用戶,Stack Overflow先是封殺ChatGPT,緊接著推出自研AIGC產(chǎn)品,但接二連三的“自救”依然止不住流量的大幅下降。
令人驚訝的是,Stack Overflow突然在本周一宣布與OpenAI簽訂協(xié)議,為其提供數(shù)據(jù)。
有意思的是,Stack Overflow不僅與OpenAI合作,其豐富的數(shù)據(jù)也被谷歌的Gemini模型買(mǎi)走。
程序員最大的問(wèn)答網(wǎng)站,擋不住AI
在程序員圈里,Stack Overflow地位有多高?
簡(jiǎn)單點(diǎn)說(shuō),作為一家老牌問(wèn)答網(wǎng)站,Stack Overflow已經(jīng)成立了16年、最高時(shí)每月都有2億臺(tái)主機(jī)訪問(wèn)。
無(wú)論一線大廠技術(shù)大佬,還是剛?cè)腴T(mén)的計(jì)算機(jī)小白,只要提出了編程問(wèn)題,總會(huì)有網(wǎng)友挺身而出,提供思路,甚至直接給出最優(yōu)解的答案。
正是因?yàn)橛兄嫶蟮臄?shù)據(jù),Stack Overflow雖然名氣比不上Reddit,但也算是圈內(nèi)人的必備網(wǎng)站。
但事情在ChatGPT橫空出世后,開(kāi)始朝著衰落的方向發(fā)展。
在 ChatGPT上線后,迅速有網(wǎng)友發(fā)現(xiàn)其出色的代碼生成能力,因此“ChatGPT可以取代Google、Stack Overflow”的言論吸引了大批程序員的目光。
然而令人沒(méi)想到的是,僅僅上線5天后,Stack Overflow反手就把 ChatGPT 給封殺了。
原因是ChatGPT生成的代碼錯(cuò)得過(guò)于離譜,因此Stack Overflow宣布這些生成垃圾答案的賬號(hào)都會(huì)被封號(hào)。
有意思的是,Stack Overflow團(tuán)隊(duì)發(fā)現(xiàn),很多用來(lái)訓(xùn)練AI模型的數(shù)據(jù),其實(shí)就是來(lái)自Stack Overflow。
如果放任AI機(jī)器人生成垃圾回答,那不就等于搬起石頭砸自己的腳嗎?
雖然Stack Overflow的表態(tài)很明確,廣大程序員們也能理解,但奈何ChatGPT的體驗(yàn)實(shí)在是真香!
最終,面對(duì)AI的強(qiáng)勢(shì)來(lái)襲,Stack Overflow的流量也是越來(lái)越差,到了2023年6月,瀏覽量幾乎已經(jīng)是腰斬。
為了止住頹勢(shì),Stack Overflow 開(kāi)始是一系列措施。
先是在7月,技術(shù)團(tuán)隊(duì)利用自家5800萬(wàn)個(gè)問(wèn)題和答案的數(shù)據(jù)庫(kù),做了一款名為「OverflowAI」的AI 工具,其功能主要圍繞著編程,但沒(méi)有掀起太大的水花。
到了10月,公司CEO宣布解雇了約28%的員工,通過(guò)縮減營(yíng)銷(xiāo)預(yù)算的方式,為 AI工具持續(xù)輸血。
不過(guò)由于OverflowAI還處于初級(jí)測(cè)試階段,面對(duì)實(shí)力強(qiáng)勁且不斷進(jìn)化的ChatGPT,OverflowAI能做的僅僅是拖延Stack Overflow衰落的速度。
賣(mài)數(shù)據(jù),真香
在面對(duì)ChatGPT的威脅時(shí),Stack Overflow一開(kāi)始選擇使用“防御”的姿態(tài)。
但殊不知,這些公開(kāi)的互聯(lián)網(wǎng)數(shù)據(jù)早已被OpenAI等科技公司用“爬蟲(chóng)”等手段進(jìn)行搜刮,自己不僅要面臨用戶的流失,更要面臨數(shù)據(jù)的流失。
不過(guò)畢竟日訪問(wèn)量擺在那里,Stack Overflow手握著大量?jī)?yōu)質(zhì)的數(shù)據(jù),倒也成為一筆可以交易的資源。
自《紐約時(shí)報(bào)》帶頭起訴OpenAI后,越來(lái)越多的新聞媒體和門(mén)戶網(wǎng)站加入到討伐OpenAI的隊(duì)伍中。
在面對(duì)版權(quán)問(wèn)題時(shí),科技公司們只能乖乖掏錢(qián)為訓(xùn)練數(shù)據(jù)付費(fèi),并承諾不會(huì)使用私人數(shù)據(jù)。
Reddit、Youtube、ShutterStock、Photobucket等網(wǎng)站都是數(shù)據(jù)交易的受益者,手握大把優(yōu)質(zhì)的訓(xùn)練材料,科技巨頭們花起錢(qián)來(lái)也是毫不吝嗇。
相比之下,Stack Overflow的數(shù)據(jù)同樣出色,甚至比Reddit這樣的綜合性網(wǎng)站更加專(zhuān)業(yè)。
因此,Stack Overflow CEO也開(kāi)始學(xué)會(huì)了向各大科技公司推銷(xiāo)自家數(shù)據(jù),其中就包括了Google的 Gemini 模型。
或許正是看到了科技公司對(duì)于優(yōu)質(zhì)數(shù)據(jù)的渴望,讓高層選擇來(lái)了一次360度的態(tài)度大轉(zhuǎn)變,既然用戶是回不來(lái)了,那至少把錢(qián)賺到口袋里。
值得一提的是,Stack Overflow當(dāng)時(shí)強(qiáng)調(diào),該協(xié)議并不具有排他性,這就意味著任何科技公司都可以購(gòu)買(mǎi)同樣的數(shù)據(jù),剩下就看哪家訓(xùn)練得更好。
據(jù)報(bào)道稱(chēng),Stack Overflow 的技術(shù)內(nèi)容將與 OpenAI 的 GPT-4 等模型相結(jié)合,通過(guò)OverflowAPI訪問(wèn),未來(lái)開(kāi)發(fā)者可以直接通過(guò) OpenAI獲得可靠且經(jīng)過(guò)驗(yàn)證的數(shù)據(jù),并幫助他們快速找到解決復(fù)雜問(wèn)題的方法。
而Stack Overflow 也能從開(kāi)發(fā)社區(qū)收集反饋,確保 AI 開(kāi)發(fā)工具持續(xù)改進(jìn)。
簡(jiǎn)單點(diǎn)就是說(shuō),Stack Overflow與 OpenAI來(lái)了一次技術(shù)和數(shù)據(jù)的互換,前者提高了AI能力,后者得到了可靠的數(shù)據(jù),兩者雙贏。
據(jù)悉,此次合作將帶來(lái)的第一組集成功能和能力,預(yù)計(jì)將于 2024 年上半年發(fā)布,這也說(shuō)明雙方的合作其實(shí)已經(jīng)進(jìn)行了很久。
隱私還是大問(wèn)題?
目前,越來(lái)越多的社區(qū)網(wǎng)站開(kāi)始加入到AI訓(xùn)練中,包括百度貼吧的“弱智吧”,在一次研究里顯現(xiàn)出不俗的數(shù)據(jù)訓(xùn)練效果,一度沖上熱搜。
對(duì)于訪問(wèn)量不斷下降的傳統(tǒng)內(nèi)容網(wǎng)站們,優(yōu)質(zhì)的數(shù)據(jù)確實(shí)是一個(gè)可以長(zhǎng)期進(jìn)行的“副業(yè)”。
另外,AI固然很香,但不是沒(méi)有缺點(diǎn)。
自Stack Overflow開(kāi)始轉(zhuǎn)向開(kāi)發(fā)AI能力后,開(kāi)發(fā)者社區(qū)的一些成員對(duì)這一變化表示反對(duì),他們對(duì)人工智能生成的信息的有效性、以及數(shù)據(jù)隱私表示擔(dān)憂。
也有專(zhuān)家指出,AI會(huì)導(dǎo)致更多錯(cuò)誤代碼被推送到代碼庫(kù)中,甚至放大軟件項(xiàng)目中現(xiàn)有的漏洞和安全問(wèn)題。
但對(duì)于“饑渴”的AI公司們,不斷膨脹的數(shù)據(jù)消耗問(wèn)題已經(jīng)足夠頭疼。
而網(wǎng)站的幫助,剛好可以為自己分擔(dān)一些風(fēng)險(xiǎn)。
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
