元乘象Chatimg3.0發(fā)布,多模態(tài)大模型助力產(chǎn)業(yè)應(yīng)用再升級
通用人工智能時代,AI大模型技術(shù)成為數(shù)字經(jīng)濟下基礎(chǔ)設(shè)施建設(shè)的重要支撐,也成為產(chǎn)業(yè)智能化轉(zhuǎn)型的核心“引擎”,AI大模型+產(chǎn)業(yè)應(yīng)用迎來了前所未有的發(fā)展機遇。
通用人工智能時代,AI大模型技術(shù)成為數(shù)字經(jīng)濟下基礎(chǔ)設(shè)施建設(shè)的重要支撐,也成為產(chǎn)業(yè)智能化轉(zhuǎn)型的核心“引擎”,AI大模型+產(chǎn)業(yè)應(yīng)用迎來了前所未有的發(fā)展機遇。
在10月28日舉辦的CNCC 2023“超智融合AI大模型應(yīng)用落地發(fā)展論壇”上,智子引擎發(fā)布了“元乘象Chatimg3.0”,展示了多模態(tài)通用生成模型“元乘象Chatimg3.0”的最新進展與落地探索。
核心技術(shù)升級迭代
元乘象Chatimg3.0是一個超精細識別、少幻覺的多模態(tài)大模型,同時支持多圖理解、物體定位、OCR等功能。Chatimg3.0給硬件設(shè)備裝上了大腦,可實現(xiàn)更自然更流暢的人機交流,為AI多模態(tài)大模型賦能產(chǎn)業(yè)應(yīng)用打下了堅實的基礎(chǔ)。與Chatimg2.0相比,Chatimg3.0主要進行了兩方面的升級,包括第一階段的預訓練(描述、檢測、OCR等多任務(wù)訓練)以及第二階段的指令微調(diào)(高質(zhì)量的人工精篩指令集)。
為更好的評估多模態(tài)大模型的能力,我們構(gòu)建了一個全新的多模態(tài)對話測試集,從描述、推理、檢測、問答、業(yè)務(wù)五個方面對模型能力進行評測,而且在問答和業(yè)務(wù)兩個方面的能力上趕超GPT-4V,表現(xiàn)出優(yōu)秀的發(fā)展?jié)摿Α?/p>
以下是Chatimg3.0對比GPT-4V在測試中的具體表現(xiàn):
描述:
推理:

檢測:

問答:

重點領(lǐng)域探索應(yīng)用
目前智子引擎已經(jīng)將“元乘象Chatimg3.0”應(yīng)用于全域防控和無人機巡檢等領(lǐng)域,通過與無人機、電子探頭等前端感知設(shè)備的融合,升級傳統(tǒng)巡檢和安防,實現(xiàn)了AI缺陷識別、異常檢測、行為分析、重點監(jiān)控、自主巡查、風險預測等功能,推動了AI工程化革新進程。

作為國內(nèi)首個多模態(tài)大模型研發(fā)團隊,智子引擎不僅在人才和技術(shù)上擁有先天的優(yōu)勢,多個知名投資機構(gòu)和IT行業(yè)龍頭的天使投資,也使企業(yè)如虎添翼。在軟通動力、華軟科技等知名企業(yè)的協(xié)同助力下,融合“元乘象Chatimg3.0”研發(fā)的“智子•天穹”和“智子•天巡”系統(tǒng)一經(jīng)面世便得到了行業(yè)的關(guān)注,產(chǎn)品被快速應(yīng)用于城市治理、智慧電力、管道巡檢、園區(qū)管理、農(nóng)業(yè)、金融等多行業(yè)應(yīng)用場景,并逐步開始試點部署。
為加速大模型產(chǎn)業(yè)應(yīng)用落地,促進數(shù)字經(jīng)濟可持續(xù)發(fā)展,智子引擎將繼續(xù)加強模型訓練,提高自身能力,匯聚行業(yè)人才和優(yōu)勢資源,為大模型助力產(chǎn)業(yè)升級鞠躬盡瘁。核心模型“元乘象Chatimg”未來還會在AI agents、具身智能等方向持續(xù)發(fā)力,期待大家的關(guān)注。
元乘象Chatimg3.0體驗入口

本內(nèi)容系原作者授權(quán)轉(zhuǎn)載,鎂客網(wǎng)僅提供信息存儲空間服務(wù)。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動創(chuàng)新
OCR農(nóng)業(yè)天使投資投資智慧
微信ID:im2maker
長按識別二維碼關(guān)注