圖鴨科技武俊敏:打造從壓縮、通信到分析的完整視頻解決方案

Lotusun 8年前 (2018-01-31)

圖像壓縮技術(shù)已經(jīng)存在20多年,20年來技術(shù)不斷地推進(jìn),導(dǎo)致其技術(shù)門檻越來越高。

我們經(jīng)常會(huì)遇到這種狀況,想要把圖片壓縮的又小又能保持圖片的高清度;想要在語音聊天時(shí)保持通話流暢;想要在視頻時(shí)保持視頻的清晰度和流暢度……

圖鴨科技就是這樣一家公司,他們主要研發(fā)圖片壓縮、通信傳輸視頻分析技術(shù)與產(chǎn)品。

每個(gè)起點(diǎn)都不簡單——高起點(diǎn)的圖像壓縮技術(shù)

圖鴨科技的CEO是來自上海交通大學(xué)的武俊敏。武俊敏在創(chuàng)立圖鴨科技前曾在專門做3G手機(jī)視頻直播業(yè)務(wù)的掌贏科技當(dāng)過首席科學(xué)家,主要研究人臉美化和表情遷移技術(shù)。

武俊敏在掌贏科技積累了許多關(guān)于人臉美化和表情遷移的技術(shù),例如表情遷移用到小波變換、非線性TensorFlow等算法。而圖像壓縮是通過損失較少的比特存儲(chǔ)空間或不損耗比特,來表示原來像素矩陣,其使用的算法種類更多也更加復(fù)雜。可以說人臉美化、表情遷移與圖像壓縮技術(shù)是兩個(gè)完全獨(dú)立的技術(shù)。武俊敏的創(chuàng)業(yè)基于自身的學(xué)習(xí)基礎(chǔ),轉(zhuǎn)向一個(gè)新的技術(shù)方向。而這個(gè)新方向要困難的多。

圖鴨科技武俊敏:打造從壓縮、通信到分析的完整視頻解決方案

(圖:圖鴨科技CEO武俊敏)

“圖像壓縮技術(shù)已經(jīng)存在20多年,20年來技術(shù)不斷地推進(jìn),導(dǎo)致其技術(shù)門檻越來越高。”武俊敏說道,“因此,我在一開始請(qǐng)教了許多師兄和前輩,一起研究圖像壓縮的算法。”對(duì)于創(chuàng)業(yè)公司來說,開始都是困難的,資金、人才、技術(shù)可能都處于一個(gè)不完善的狀態(tài)。但是,這些困難必須一個(gè)個(gè)解決掉,做不下去就要死去。

必須相信技術(shù)會(huì)不斷進(jìn)步——升級(jí)打造完整視頻解決方案

自2016年8月創(chuàng)建以來,接近一年半的時(shí)間,圖鴨科技在圖像壓縮方面取得了不俗的成績。其圖像壓縮與JPEG相比,壓縮率提升了70% 多,和WebP相比壓縮率提高了60% 多。即在保持相同圖像峰值信噪比的同時(shí),極大減少了存儲(chǔ)空間。此技術(shù)能幫助需要大量傳輸、儲(chǔ)存圖片的企業(yè)節(jié)省一大筆開支。

不過,在圖像壓縮取得不錯(cuò)成績后,武俊敏團(tuán)隊(duì)發(fā)現(xiàn),海量和高清的圖片和視頻對(duì)通信的要求很高。因此,圖鴨對(duì)圖像和音視頻的通信傳輸進(jìn)行了研究。

在2017年年初完成千萬級(jí)天使輪融資后,圖鴨科技造的音視頻傳輸解決方案延時(shí)低至50-100ms。其內(nèi)容主要包括保證質(zhì)量的前提下,允許免費(fèi)接入VoIP SDK,零成本實(shí)現(xiàn)實(shí)時(shí)音視頻通訊功能。同時(shí),通訊效果普遍優(yōu)于Skype、微信等大眾品牌。

圖鴨還提供了所有涉及通訊方式的功能模塊,打通了Android、iOS、Mac和Windows等平臺(tái),一站式服務(wù),保證節(jié)約接入和成本維護(hù),使使用其系統(tǒng)的廠商不再為各個(gè)模塊接入SDK廠商不同而煩惱。

同時(shí),圖鴨不僅提供一站式服務(wù),還為開發(fā)者提供了便利平臺(tái)。“去年年底VolP技術(shù)的服務(wù)器源代碼和客戶端網(wǎng)絡(luò)模塊代碼已經(jīng)開源,開發(fā)者可以進(jìn)行二次開發(fā)。”武俊敏表示。

為了推動(dòng)壓縮技術(shù)的進(jìn)一步發(fā)展,武俊敏將壓縮和模式識(shí)別的技術(shù)融合,相互借鑒,創(chuàng)造性地得到了較好的壓縮效果。但是武俊敏對(duì)其技術(shù)發(fā)展還不滿意。

圖鴨科技武俊敏:打造從壓縮、通信到分析的完整視頻解決方案

(圖:公司視頻分析項(xiàng)目展示)

所以,圖鴨科技在不斷進(jìn)行技術(shù)創(chuàng)新的同時(shí),又更加深入的探索視頻智能分析技術(shù)。視頻智能分析不僅使用到了已有的表情遷移和人臉美化技術(shù),還需要利用深度學(xué)習(xí)人臉識(shí)別算法,對(duì)視頻進(jìn)行檢測(cè)和分類,提取視頻關(guān)鍵幀和關(guān)鍵段落。

這樣,公司就形成了一套完整的視頻解決方案,從視頻的壓縮,到通信傳輸,再到視頻的分析。

就像社會(huì)進(jìn)化論被很多理論學(xué)家質(zhì)疑,“技術(shù)會(huì)不斷的進(jìn)步”也被許多人質(zhì)疑。對(duì)于此,武俊敏認(rèn)為,技術(shù)會(huì)不斷的進(jìn)步已經(jīng)成為技術(shù)工作者的一種價(jià)值取向,“你只有相信技術(shù)會(huì)不斷地進(jìn)步,才會(huì)不斷地去努力去實(shí)踐,這樣才有可能出成果。而不去實(shí)踐,是永遠(yuǎn)不會(huì)出成果的。”

有道是,春江水暖鴨先知——迎接5G和AR設(shè)備的爆發(fā)點(diǎn)

雖然圖鴨科技已經(jīng)做出了一套完整的視頻解決方案,但是目前的分析系統(tǒng)能力還不夠強(qiáng),其準(zhǔn)確度和時(shí)間復(fù)雜度并沒有達(dá)到令武俊敏滿意的程度。

武俊敏說:“目前的分析系統(tǒng)要達(dá)到其基本要求,還需要1年時(shí)間,要達(dá)到滿意的要求約需一年半的時(shí)間。整個(gè)2018年,要將視頻解決方案上線并做好。”

目前,圖鴨科技在準(zhǔn)備下一輪pre-A的融資,并打算在今年6月份之前完成。融資將被用于技術(shù)升級(jí)和公司運(yùn)營。當(dāng)問到圖鴨科技是否會(huì)在視頻解決方案之外,開拓一些新的應(yīng)用,武俊敏表示,“在公司技術(shù)發(fā)展成熟滿意之前,無意向其他業(yè)務(wù)方向擴(kuò)散。對(duì)于一家科技公司來說,技術(shù)就是命根子。”武俊敏說道。

圖鴨科技武俊敏:打造從壓縮、通信到分析的完整視頻解決方案

(圖:圖鴨科技團(tuán)隊(duì))

就像電影《阿甘正傳》的臺(tái)詞一樣,“未來就像一盒巧克力,你永遠(yuǎn)不知道下一顆是什么味道。”對(duì)于圖鴨科技和武俊敏來說,把眼光聚焦于當(dāng)前技術(shù)的發(fā)展才是重中之重

而在靜心發(fā)展已有技術(shù)的同時(shí),仍要對(duì)未來的機(jī)會(huì)保持高度的敏銳度。眾所周知,當(dāng)5G時(shí)代帶來的時(shí)候,將會(huì)給現(xiàn)有的視頻等數(shù)據(jù)傳輸帶來變革性的變化。對(duì)此武俊敏說,“5G的到來將會(huì)推動(dòng)公司的發(fā)展。5G時(shí)代帶來的更多的視頻量和更多的存儲(chǔ)需求,而基礎(chǔ)的光纖網(wǎng)絡(luò)設(shè)備并沒有太多的改進(jìn),因此對(duì)于整套視頻解決方案的要求也會(huì)更大。”同時(shí),AR眼鏡的爆發(fā)也會(huì)為企業(yè)帶來新的生機(jī)。對(duì)于這兩個(gè)機(jī)會(huì),圖鴨科技會(huì)力求抓住。有道是“春江水暖鴨先知”。

結(jié)語:

目前,國內(nèi)做視頻壓縮、傳輸和分析的整套視頻解決方案的企業(yè)并不多。國外的此類公司也大都只做其中某個(gè)方向,做出整個(gè)完整技術(shù)流程的并不多。因此,圖鴨科技的壓縮技術(shù)和整套視頻解決方案有極大的競爭優(yōu)勢(shì)。而且,圖鴨科技的解決方案已經(jīng)部分了落地,用在了智能門禁、遠(yuǎn)程視頻傳輸無人店等場景。


【鎂客·請(qǐng)講】專注于報(bào)道科技創(chuàng)新項(xiàng)目;我們敞開心扉面對(duì)每一位創(chuàng)業(yè)者,力求為您呈現(xiàn)一群鮮活、有性格的品牌和人物;我們傾聽創(chuàng)業(yè)故事和人生經(jīng)歷、探討商業(yè)模式和行業(yè)趨勢(shì)、對(duì)接資本市場和供需雙方,以期為產(chǎn)業(yè)發(fā)展注入新的活力。

歡迎做客【鎂客·請(qǐng)講】,欄目合作請(qǐng)發(fā)送郵件至:post@im2maker.com

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到