智能降噪、獨(dú)立4G聯(lián)網(wǎng)、63個(gè)語種隨意切換,搜狗AI錄音筆“玩花招”

韓璐 6年前 (2020-03-09)

功能方面,搜狗S1幾乎考慮到了用戶的所有需求。

近幾年來人們手中的錄音設(shè)備經(jīng)歷了質(zhì)的變革,在傳統(tǒng)錄音筆的多模態(tài)錄音、播放以及編輯的基礎(chǔ)上,越來越多的廠商也賦予了設(shè)備“AI”能力,并基于此能力為錄音筆開發(fā)多樣化功能。

就在前不久,國內(nèi)AI錄音筆賽道重度玩家之一的搜狗在線上發(fā)布了最新兩款產(chǎn)品,分別是S1和E1。發(fā)布會(huì)后,鎂客網(wǎng)也拿到了一部“S1”,并進(jìn)行了數(shù)天的深度測(cè)評(píng):

這只搜狗AI錄音筆,到底能“玩出什么花樣”?

3.5寸大屏+納米注塑工藝,風(fēng)格硬朗、便于攜帶

拿到產(chǎn)品包裝盒,S1的機(jī)身造型赫然映入眼簾,而在包裝盒背面,則以文字和圖片的形式簡(jiǎn)單囊括了S1的四大特色功能,包括麥克風(fēng)陣列超強(qiáng)拾音、錄音準(zhǔn)確轉(zhuǎn)文字、根據(jù)語義智能提取重點(diǎn)以及語音翻譯。

S1整體包裝以黑色為主,除了S1機(jī)身之外,另外還有充電器、Type-C接口充電(數(shù)據(jù))線、保護(hù)套、防風(fēng)罩等配件,以及一份說明書。

這只搜狗AI錄音筆,到底能“玩出什么花樣”?

S1整機(jī)重146g,拿在手上較為輕巧,一只手便能實(shí)現(xiàn)全部機(jī)身操作,可以如同手機(jī)一般揣到兜里,做到隨用隨拿。機(jī)身內(nèi)存為64G,電池容量2450mAh,從0%充電至100%僅需2個(gè)半小時(shí),能夠持續(xù)錄音10個(gè)小時(shí)以上,對(duì)于多數(shù)用戶而言已經(jīng)綽綽有余。

機(jī)身主色調(diào)為黑、灰,機(jī)身正面配有一個(gè)3.5寸觸摸顯示屏,便于部分功能調(diào)用、實(shí)時(shí)查看語音實(shí)時(shí)轉(zhuǎn)錄和翻譯的進(jìn)度和內(nèi)容;背面由樹膠打造,經(jīng)磨砂打磨處理,上面印有搜狗的logo,也貼上了防滑膠墊;邊框采用納米注塑工藝和6系鋁材質(zhì)。S1整體看起來,帶給人一種干練、硬朗的商務(wù)感。

機(jī)身頂部設(shè)計(jì)為鏤空樣式,配備2顆哈曼駐極體指向麥克風(fēng),大屏左右兩側(cè)對(duì)稱分布了6個(gè)小細(xì)孔,內(nèi)置6顆全向麥克風(fēng),形成8麥陣列,實(shí)現(xiàn)360°拾音。機(jī)身底部為Type-C端口和揚(yáng)聲器。

其他方面,機(jī)身左側(cè)排列有電源建、音量調(diào)節(jié)鍵、3.5mm耳機(jī)插孔和SIM卡槽。卡槽的加入讓S1也能夠?qū)崿F(xiàn)4G聯(lián)網(wǎng),讓用戶在沒有WiFi的場(chǎng)景中也能夠?qū)崿F(xiàn)錄音的上傳、轉(zhuǎn)寫、翻譯等等。

這只搜狗AI錄音筆,到底能“玩出什么花樣”?

而在機(jī)身右側(cè),除了錄音開始/暫停鍵,S1還擁有了一個(gè)全新功能鍵“M鍵”,通過短按、長(zhǎng)按,用戶可啟用重點(diǎn)標(biāo)記、語音助手等功能。

這只搜狗AI錄音筆,到底能“玩出什么花樣”?

智能降噪、遠(yuǎn)程拾音,多場(chǎng)景針對(duì)性進(jìn)行錄音

作為一款錄音筆,S1最為基本的功能就是“錄音”,但這件事并不是那么簡(jiǎn)單就能做好。

1對(duì)1采訪時(shí),聲源方向是相對(duì)單一的,人們一般會(huì)將錄音設(shè)備的麥克風(fēng)指向聲源,但周遭的雜音會(huì)往往帶來一定的干擾;會(huì)議過程中的聲源則是多方向的,最終錄音文件中的人聲有的清楚有的模糊,音質(zhì)不一……

在“錄音”方面,傳統(tǒng)錄音筆在過程中會(huì)將所有的聲音都收錄進(jìn)去,其中聲源的距離、方向以及周遭的雜音均會(huì)帶來影響,為后期整理增加難度。這方面,S1針對(duì)性的提供了4種錄音模式,覆蓋場(chǎng)景包括會(huì)議、采訪、聽課、音樂。

這只搜狗AI錄音筆,到底能“玩出什么花樣”?

基于clairVoice8麥克風(fēng)陣列算法,S1能夠針對(duì)不同場(chǎng)景的錄音需求進(jìn)行智能調(diào)整,以實(shí)現(xiàn)360°拾音或定向拾音,打造一個(gè)好的收音效果。經(jīng)實(shí)際測(cè)試,10米范圍內(nèi),S1在安靜或雜聲較小的環(huán)境內(nèi)的錄音還是清晰的,轉(zhuǎn)寫準(zhǔn)確率也處于高水平。

與此同時(shí),S1還運(yùn)用了pureVoice AI降噪算法,提供三種降噪模式:真實(shí)音質(zhì)(保留真實(shí)人聲和環(huán)境音)、人聲增強(qiáng)(過濾環(huán)境音,顯著增強(qiáng)人聲)、純凈人聲(深度刪除環(huán)境音,僅保留人聲),讓用戶在使用過程中能夠依據(jù)自身需求進(jìn)行選擇。

選定錄音模式和降噪方式之后,用戶短按REC鍵即可一鍵開始錄音,過程中可隨時(shí)更換語種,以及暫定或繼續(xù)錄音。當(dāng)錄音結(jié)束并保存本地之后,用戶可點(diǎn)擊機(jī)身屏幕主頁面的“錄音文件”查看錄音情況,若先前忘記選擇降噪方式,用戶也可點(diǎn)擊錄音詳情頁下方的“降噪方式”,打開“純凈人聲降噪”以聽取降噪處理之后的錄音。

這只搜狗AI錄音筆,到底能“玩出什么花樣”?

為了測(cè)試降噪效果,筆者一手拿正在運(yùn)作的吹風(fēng)機(jī)(與S1距離60-70公分),一手拿S1進(jìn)行錄音(會(huì)議模式,機(jī)身距離嘴部約50-60公分)。依據(jù)測(cè)試成果,在80-101分貝干擾聲的環(huán)境中,S1經(jīng)降噪處理后的錄音依舊存在少許雜音,不過人聲部分聽起來相當(dāng)清楚,最終的轉(zhuǎn)寫效果即使受到了一點(diǎn)干擾,但已能夠滿足基本需求。

實(shí)時(shí)轉(zhuǎn)寫、翻譯,告別難懂方言和外語小白

相比于傳統(tǒng)錄音筆,AI錄音筆最大的特色在于語音識(shí)別與轉(zhuǎn)寫、中外文互譯。

在實(shí)時(shí)轉(zhuǎn)寫方面,目前S1除普通話外還支持10種方言和9種外語,覆蓋粵語、東北話、南京話、英語、日語、法語等。

需要注意的是,過程中每當(dāng)息屏或是連續(xù)轉(zhuǎn)寫10分鐘后,系統(tǒng)會(huì)判定用戶未關(guān)注轉(zhuǎn)寫內(nèi)容而暫停轉(zhuǎn)寫。若用戶還需繼續(xù)使用該功能,記得手動(dòng)在錄音界面發(fā)起繼續(xù)轉(zhuǎn)寫。

針對(duì)實(shí)時(shí)轉(zhuǎn)寫功能,鎂客網(wǎng)以一段24分鐘時(shí)長(zhǎng)的采訪錄音進(jìn)行測(cè)試,原始錄音文件以中文為主,間雜少量英文詞匯的全拼及縮寫,測(cè)試結(jié)果顯示實(shí)時(shí)轉(zhuǎn)寫的速度延遲小,但在識(shí)別準(zhǔn)確度上還存在些許誤差。

在錄音結(jié)束后,用戶也可以選擇在錄音詳情頁將該文件全部轉(zhuǎn)寫成文字。本次測(cè)試用的24分鐘錄音轉(zhuǎn)寫共用時(shí)3分30秒,轉(zhuǎn)寫準(zhǔn)確度較實(shí)時(shí)轉(zhuǎn)寫有所提升。

S1官方介紹稱可準(zhǔn)確識(shí)別財(cái)經(jīng)貿(mào)易、醫(yī)療、IT 科技、政法、文化體育這5大領(lǐng)域的專業(yè)術(shù)語,實(shí)際測(cè)試中,不管是實(shí)時(shí)轉(zhuǎn)寫,還是錄音完成后進(jìn)行的轉(zhuǎn)寫,涉及專業(yè)詞匯的轉(zhuǎn)寫都比較準(zhǔn)確。值得注意的是,基于新增的M鍵,搜狗為S1增添了一些人性化功能,包括一鍵標(biāo)記重點(diǎn),便于系統(tǒng)基于NLP等技術(shù)提煉重點(diǎn),用于后期查閱和快速定點(diǎn)回聽。

這只搜狗AI錄音筆,到底能“玩出什么花樣”?

這只搜狗AI錄音筆,到底能“玩出什么花樣”?

若用戶急需在眾多保存的錄音中找到某一段,也可長(zhǎng)按M鍵喚醒智能語音助手,經(jīng)由語音交互找出自己想要的錄音記錄。

這只搜狗AI錄音筆,到底能“玩出什么花樣”?

鎂客網(wǎng)在使用過程中也發(fā)現(xiàn),只要該錄音在結(jié)束后進(jìn)行了轉(zhuǎn)寫,系統(tǒng)便會(huì)自動(dòng)提煉摘要。與重點(diǎn)標(biāo)記一樣,系統(tǒng)智能提煉摘要的目的也是方便用戶后期查閱和快速定點(diǎn)回聽,只不過精準(zhǔn)度還需多加提升。

這只搜狗AI錄音筆,到底能“玩出什么花樣”?

另外基于聲紋識(shí)別等技術(shù),用戶在錄音完成轉(zhuǎn)寫之后,可以點(diǎn)擊錄音詳情頁面左下角的“智能整理”功能,隨即S1將對(duì)錄音中的說話者進(jìn)行區(qū)分,讓用戶能夠以一種更為直觀的方式看到錄音內(nèi)容,也方便了之后的整理等工作。

這只搜狗AI錄音筆,到底能“玩出什么花樣”?

翻譯方面,S1提供兩種模式,分別是對(duì)話翻譯和同聲傳譯,前者能夠提供63種語言交傳互譯服務(wù)(包括63個(gè)語種、13種外語口音、9種離線語言),覆蓋全球200多個(gè)國家和地區(qū),后者目前僅支持中英互譯。

這只搜狗AI錄音筆,到底能“玩出什么花樣”?

在對(duì)話翻譯模式中,REC鍵和M鍵將各自承擔(dān)一種語言的錄入工作,屆時(shí)用戶需長(zhǎng)按以錄入對(duì)應(yīng)語音,繼而系統(tǒng)會(huì)自動(dòng)讀出對(duì)應(yīng)內(nèi)容的翻譯結(jié)果。對(duì)于兩個(gè)語言不通的交流者而言,利用錄音筆進(jìn)行逐個(gè)轉(zhuǎn)寫或許會(huì)耗費(fèi)些時(shí)間,但能有效避免交談過程中因語音來回交叉而帶來的錯(cuò)亂問題,保證內(nèi)容的準(zhǔn)確性。

相比于對(duì)話翻譯,同聲傳譯不需要用戶在過程中長(zhǎng)按某個(gè)鍵,點(diǎn)擊屏幕頂端即可調(diào)換翻譯方向。若中途需要暫停/繼續(xù),只需短按一下REC鍵即可。

從測(cè)試結(jié)果來看,在發(fā)音正常的情況下,S1的識(shí)別和翻譯準(zhǔn)確度接近完美,些微差錯(cuò)也在可接受范圍內(nèi)。

此外所有的錄音文件和轉(zhuǎn)寫內(nèi)容,用戶可以通過微信小程序掃碼、藍(lán)牙連接手機(jī)APP后實(shí)現(xiàn)云端上傳下載,以及多人共享。

總結(jié)

眾所周知,錄音筆市場(chǎng)一直都是相對(duì)小眾的,主要受眾群體集中在新聞媒體、政府、事業(yè)單位等。依據(jù)中國報(bào)告網(wǎng)數(shù)據(jù),國內(nèi)錄音筆市場(chǎng)呈現(xiàn)行業(yè)發(fā)展緩慢、替代風(fēng)險(xiǎn)大等特點(diǎn),一句話概括,因?yàn)槭謾C(jī)等數(shù)碼產(chǎn)品的沖擊等因素,國內(nèi)錄音筆市場(chǎng)長(zhǎng)時(shí)間處于“供過于求”的境遇,年度產(chǎn)量基本維持在400多萬臺(tái)左右,一度出現(xiàn)小幅下滑現(xiàn)象。長(zhǎng)年以來,這一硬件品類的市場(chǎng)由索尼、愛國者等廠商所霸占。

就在近幾年,隨著語音識(shí)別、自然語言處理等AI語音技術(shù)的逐步發(fā)展,錄音筆的AI化趨勢(shì)也是不可逆的。數(shù)據(jù)顯示,經(jīng)過近幾年的產(chǎn)品研發(fā)和推廣,AI錄音筆已經(jīng)占據(jù)整個(gè)市場(chǎng)份額的35%,這其中,搜狗是其中的重度玩家之一。

基于搜狗AI錄音筆S1的深度體驗(yàn)來看,自最初的單一語音轉(zhuǎn)寫服務(wù),AI錄音筆的功能發(fā)展至今已經(jīng)較為多元化,傾向于人性化等,覆蓋了轉(zhuǎn)寫、翻譯等多個(gè)方面,而這些功能也挑動(dòng)了用戶心中那根敏感的神經(jīng),滿足了多種需求。

如果套用主播風(fēng)格來為這款搜狗AI錄音筆下定義的話,那就是:買它、買它、買它!

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到