NVIDIA 通過企業(yè)級生成式 AI 微服務(wù)為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能
Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 優(yōu)化語義檢索,實現(xiàn)準確的 AI 推理
亞馬遜云科技 re:Invent — 太平洋時間 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一項生成式 AI 微服務(wù),支持企業(yè)將自定義大語言模型與企業(yè)數(shù)據(jù)相連接,使其 AI 應(yīng)用能夠提供高度準確的響應(yīng)。
NVIDIA NeMo™ Retriever 是 NVIDIA NeMo(一個用于構(gòu)建、自定義和部署生成式 AI 模型的框架和工具系列)的一項全新服務(wù),通過企業(yè)級檢索增強生成(RAG)功能,幫助組織加強其生成式 AI 應(yīng)用。
作為一項語義檢索微服務(wù),NeMo Retriever 借助經(jīng) NVIDIA 優(yōu)化的算法,幫助生成式 AI 應(yīng)用作出更加準確的回答。使用該微服務(wù)的開發(fā)者,可以將其 AI 應(yīng)用與位于各個云和數(shù)據(jù)中心的業(yè)務(wù)數(shù)據(jù)相連通。該服務(wù)為 AI 代工添加了 NVIDIA 優(yōu)化的 RAG 功能,并被整合到亞馬遜云科技 Marketplace 上的 NVIDIA AI Enterprise 軟件平臺中。
Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先與 NVIDIA 合作,將生產(chǎn)就緒型 RAG 功能整合至其自定義生成式 AI 應(yīng)用和服務(wù)中。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“具有 RAG 功能的生成式 AI 應(yīng)用是企業(yè)的下一個殺手級應(yīng)用。借助 NVIDIA NeMo Retriever,開發(fā)者可以創(chuàng)建自定義生成式 AI 聊天機器人、AI 助手和摘要工具。它們能夠訪問企業(yè)的業(yè)務(wù)數(shù)據(jù),通過準確且有價值的生成式 AI 智能來提高生產(chǎn)力。”
全球頭部企業(yè)借助 NeMo Retriever 提高大語言模型(LLM)準確性
電子系統(tǒng)設(shè)計領(lǐng)導廠商 Cadence 為超大規(guī)模計算、5G 通信、汽車、移動、航空航天、消費和醫(yī)療市場的企業(yè)提供服務(wù)。該公司正與 NVIDIA 合作,為工業(yè)電子設(shè)計領(lǐng)域的生成式 AI 應(yīng)用開發(fā) RAG 功能。
Cadence 總裁兼首席執(zhí)行官 Anirudh Devgan 表示:“生成式 AI 引入了創(chuàng)新方法來滿足客戶需求,比如能在設(shè)計流程早期發(fā)現(xiàn)潛在缺陷的工具等。我們的研究人員正在與 NVIDIA 合作,使用 NeMo Retriever 進一步提高生成式 AI 應(yīng)用的準確性和相關(guān)性,以便發(fā)現(xiàn)問題,并幫助客戶更快地將優(yōu)質(zhì)產(chǎn)品推向市場。”
破解精確的生成式 AI 應(yīng)用的“密碼”
與開源 RAG 工具套件不同,NeMo Retriever 是通過具有商業(yè)可行性的模型、API 穩(wěn)定性、安全補丁和企業(yè)級支持,來為生產(chǎn)就緒型生成式 AI 賦能。
經(jīng) NVIDIA 優(yōu)化的算法使 Retriever 的嵌入模型能夠產(chǎn)出準確性最高的結(jié)果。經(jīng)過優(yōu)化的嵌入模型能夠捕捉單詞之間的關(guān)系,使 LLM 能夠處理和分析文本數(shù)據(jù)。
企業(yè)可以使用 NeMo Retriever 將 LLM 連接到多個數(shù)據(jù)源和知識庫,這樣用戶就可以輕松地與數(shù)據(jù)交互,并通過簡單的對話指令獲得準確且最新的答案。通過使用由 Retriever 驅(qū)動的應(yīng)用,企業(yè)可以使用戶安全地訪問多種數(shù)據(jù)格式的信息,如文本、PDF、圖像和視頻等。
借助 NeMo Retriever,企業(yè)能夠以更少的訓練獲得更準確的結(jié)果,加快產(chǎn)品上市時間,并減少生成式 AI 應(yīng)用開發(fā)產(chǎn)生的能耗。
通過 NVIDIA AI Enterprise 實現(xiàn)可靠、簡單且安全的部署
企業(yè)可以在幾乎任何數(shù)據(jù)中心或云端的 NVIDIA 加速計算上部署由 NeMo Retriever 驅(qū)動的應(yīng)用,以便在推理過程中運行。NVIDIA AI Enterprise 可支持通過 NVIDIA Triton 推理服務(wù)器™、NVIDIA TensorRT™、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 軟件進行加速的高性能推理。
供應(yīng)情況
開發(fā)者可以注冊并搶先體驗 NVIDIA NeMo Retriever。
關(guān)于 NVIDIA
自 1993 年成立以來,NVIDIA(NASDAQ: NVDA)一直是加速計算領(lǐng)域的先驅(qū)。NVIDIA 1999 年發(fā)明的 GPU 驅(qū)動了 PC 游戲市場的增長,并重新定義了現(xiàn)代計算機圖形,開啟了現(xiàn)代 AI 時代,正在推動跨市場的工業(yè)數(shù)字化。NVIDIA 現(xiàn)在是一家全棧計算公司,其數(shù)據(jù)中心規(guī)模的解決方案正在重塑整個行業(yè)。
本新聞稿中的部分聲明包括但不限于有關(guān)以下內(nèi)容的聲明:我們的產(chǎn)品、服務(wù)和技術(shù),包括 NVIDIA NeMo Retriever、NVIDIA NeMo、NVIDIA AI Enterprise 的優(yōu)勢、影響、性能和供貨情況;部分企業(yè)率先與 NVIDIA 一起將生產(chǎn)就緒型 RAG 功能整合到其自定義生成式 AI 應(yīng)用和服務(wù);具有 RAG 功能的生成式 AI 應(yīng)用成為企業(yè)的下一個殺手級應(yīng)用;企業(yè)擁有數(shù)百個自定義生成式 AI 聊天機器人、AI 助手和摘要工具,它們能夠通過訪問企業(yè)的數(shù)據(jù),提供準確和有價值的智能;全球頭部企業(yè)借助 NeMo Retriever 提高 LLM 的準確性,包括其帶來的好處和影響等均為前瞻性聲明,存在風險與不確定性,且最終結(jié)果可能與預(yù)期存在極大差異??赡軐е聦嶋H結(jié)果出現(xiàn)極大差異的重要因素包括:全球經(jīng)濟狀況;我們在制造、組裝、包裝和測試產(chǎn)品方面對第三方的依賴性;技術(shù)發(fā)展和競爭的影響;新產(chǎn)品和技術(shù)的發(fā)展或?qū)ξ覀儸F(xiàn)有產(chǎn)品和技術(shù)的改良;市場對我們的產(chǎn)品或合作伙伴產(chǎn)品的接受情況;設(shè)計、制造或軟件缺陷;消費者偏好或需求的變化;行業(yè)標準和界面的變化;將我們的產(chǎn)品或技術(shù)集成到系統(tǒng)中時意外損耗的性能;以及 NVIDIA 近期提交給美國證券交易委員會 (SEC) 的報告(包括但不限于 Form 10-K 年報及 Form 10-Q 季報)中屢次具體說明的其他因素。提交給 SEC 的報告副本發(fā)布在公司網(wǎng)站上,且可免費從 NVIDIA 獲得。這些前瞻性聲明不能保證未來的表現(xiàn),僅在規(guī)定日期有效。除非法律另有要求,否則 NVIDIA 對更新這些前瞻性聲明以反映未來事件或環(huán)境不承擔任何責任。
©2023 NVIDIA Corporation。版權(quán)所有。NVIDIA、NVIDIA 徽標、NVIDIA NeMo、NVIDIA Triton 推理服務(wù)器、NVIDIA TensorRT 是 NVIDIA Corporation 在美國和其他國家的商標和/或注冊商標。其他公司和產(chǎn)品名稱可能為與之相關(guān)的各自公司的商標。功能、價格、供貨情況和規(guī)格如有變更,恕不另行通知。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動創(chuàng)新
