國(guó)內(nèi)比較出名大模型主要有:
1、ERNIE(EnhancedRepresentationthroughkNowledgeIntEgration):ERNIE是由百度開(kāi)發(fā)的一個(gè)基于Transformer結(jié)構(gòu)的預(yù)訓(xùn)練語(yǔ)言模型。ERNIE在自然語(yǔ)言處理任務(wù)中取得了較好的性能,包括情感分析、文本分類、命名實(shí)體識(shí)別等。
2、HANLP(HanLanguageProcessing):HANLP是由中國(guó)人民大學(xué)開(kāi)發(fā)的一個(gè)中文自然語(yǔ)言處理工具包,其中包含了一些中文大模型。例如,HANLP中的大模型包括中文分詞模型、詞法分析模型、命名實(shí)體識(shí)別模型等。
3、DeBERTa(Decoding-enhancedBERTwithdisentangledattention):DeBERTa是由華為開(kāi)發(fā)的一個(gè)基于Transformer結(jié)構(gòu)的預(yù)訓(xùn)練語(yǔ)言模型。DeBERTa可以同時(shí)學(xué)習(xí)局部關(guān)聯(lián)和全局關(guān)聯(lián),提高了模型的表示能力和上下文理解能力。
4、THUNLP(TsinghuaUniversityNaturalLanguageProcessingGroup):清華大學(xué)自然語(yǔ)言處理組(THUNLP)開(kāi)發(fā)了一些中文大模型。其中的大模型包括中文分詞模型、命名實(shí)體識(shí)別模型、依存句法分析模型等。
5、XiaoIce(小冰):XiaoIce是微軟亞洲研究院開(kāi)發(fā)的一個(gè)聊天機(jī)器人,擁有大型的對(duì)話系統(tǒng)模型。XiaoIce具備閑聊、情感交流等能力,并在中文語(yǔ)境下表現(xiàn)出很高的流暢性和語(yǔ)言理解能力。 大模型可以給機(jī)器人發(fā)命令、理解機(jī)器人的反饋、分解任務(wù)變成動(dòng)作、幫助機(jī)器處理圖像、聲音等多模態(tài)的數(shù)據(jù)。江蘇深度學(xué)習(xí)大模型發(fā)展前景是什么
大模型在企業(yè)內(nèi)部做應(yīng)用前一般不做預(yù)訓(xùn)練,而是直接調(diào)用通用大模型的一些能力,因此在整個(gè)通用大模型的能力進(jìn)一步增強(qiáng)的時(shí)候,會(huì)有越來(lái)越多的企業(yè)用行業(yè)數(shù)據(jù)集訓(xùn)練基礎(chǔ)大模型,然后形成行業(yè)大模型。
這就是涉及到本地化部署的大模型到底應(yīng)該如何選型的問(wèn)題?這里我們著重講常見(jiàn)的三個(gè)模型Vicuna、BloomZ和GLM。選型涉及三個(gè)維度:實(shí)際性能跑分,性價(jià)比,合規(guī)性。
從性能角度來(lái)講,目前評(píng)價(jià)比較高的還是Vicuna的13B模型,這也是Vicuna強(qiáng)勁的一個(gè)點(diǎn)。所以Vicuna經(jīng)常是實(shí)際落地的時(shí)候很多那個(gè)測(cè)試機(jī)上布的那個(gè)大模型。但它也有一個(gè)很明確的缺點(diǎn),即無(wú)法商用。所以實(shí)際在去真實(shí)落地的過(guò)程中,我們看到很多企業(yè)會(huì)去選BloomZ和GLM6B。
但是BloomZ也存在著不小的意識(shí)形態(tài)的問(wèn)題,它對(duì)金融行業(yè)測(cè)試的效果會(huì)相對(duì)較好,泛行業(yè)則會(huì)比較弱。整體來(lái)講,目前我們看到的其實(shí)采納度比較高的還是GLM6B這款產(chǎn)品,它不管是在性能還是價(jià)格本身,成本層面,包括合規(guī)性都有比較強(qiáng)的優(yōu)勢(shì)。 杭州通用大模型的概念是什么音視貝在智能呼叫中心的基礎(chǔ)上制定了大模型解決方案,為醫(yī)保局提供來(lái)電數(shù)據(jù)存儲(chǔ)分析、智能解答等新型工具。
AI大模型賦能智能服務(wù)場(chǎng)景主要有以下幾種:
1、智能熱線。可根據(jù)與居民/企業(yè)的交流內(nèi)容,快速判定并精細(xì)適配政策。根據(jù)**的不同需求,通過(guò)智能化解決方案,提供全天候的智能服務(wù)。
2、數(shù)字員工。將數(shù)字人對(duì)話場(chǎng)景無(wú)縫嵌入到服務(wù)業(yè)務(wù)流程中,為**提供“邊聊邊辦”的數(shù)字化服務(wù)。辦事**與數(shù)字人對(duì)話時(shí),數(shù)字人可提供智能推送服務(wù)入口,完成業(yè)務(wù)咨詢、資訊推送、服務(wù)引導(dǎo)、事項(xiàng)辦理等服務(wù)。
3、智能營(yíng)商環(huán)境分析。利用多模態(tài)大模技術(shù),為用戶提供精細(xì)的全生命周期辦事推薦、數(shù)據(jù)分析、信息展示等服務(wù),將“被動(dòng)服務(wù)”模式轉(zhuǎn)變?yōu)椤爸鲃?dòng)服務(wù)”模式。
4、智能審批。大模型+RPA的辦公助手,與審批系統(tǒng)集成,自動(dòng)處理一些標(biāo)準(zhǔn)化審批請(qǐng)求,審批進(jìn)程提醒,并自動(dòng)提取審批過(guò)程中的關(guān)鍵指標(biāo)和統(tǒng)計(jì)數(shù)據(jù),生成報(bào)告和可視化圖表,提高審批效率和質(zhì)量。
有了知識(shí)圖譜技術(shù)的加持,智能客服可以在語(yǔ)義理解與智能應(yīng)答方面表現(xiàn)更出色,有力提高各個(gè)行業(yè)客服系統(tǒng)的能力水平,同時(shí)也提高企業(yè)的競(jìng)爭(zhēng)力。
基于知識(shí)圖譜的客服系統(tǒng)可以根據(jù)用戶的個(gè)人信息和歷史記錄,提供個(gè)性化的服務(wù)。通過(guò)對(duì)用戶偏好和需求的建模,客服系統(tǒng)可以根據(jù)知識(shí)圖譜中的相關(guān)知識(shí)為每個(gè)用戶提供定制化的建議和支持。
知識(shí)圖譜技術(shù)可以將不同來(lái)源的數(shù)據(jù)結(jié)構(gòu)化、系統(tǒng)化,對(duì)數(shù)據(jù)進(jìn)行分析、挖掘,為更好地理解用戶需求和行為提供支持,應(yīng)用在客戶投訴與建議的信息分析方面,能夠幫助企業(yè)和機(jī)構(gòu)改善服務(wù),提高客戶(**)滿意度。
杭州音視貝科技有限公司是人工智能大模型的開(kāi)拓者與實(shí)踐者,在知識(shí)圖譜與智能客服應(yīng)用方面有多年的研發(fā)經(jīng)驗(yàn),不斷應(yīng)用新技術(shù),打造新產(chǎn)品,為企業(yè)、機(jī)構(gòu)的客戶服務(wù)系統(tǒng)提供能力升級(jí)的有力工具。 音視貝大模型智能客服為電商平臺(tái)提供了快速、個(gè)性化和高效的服務(wù),增強(qiáng)了用戶購(gòu)物體驗(yàn),提高了用戶復(fù)購(gòu)率。
目前市面上有許多出名的AI大模型,其中一些是:
1、GPT-3(GenerativePre-trainedTransformer3):GPT-3是由OpenAI開(kāi)發(fā)的一款自然語(yǔ)言處理(NLP)模型,擁有1750億個(gè)參數(shù)。它可以生成高質(zhì)量的文本、回答問(wèn)題、進(jìn)行對(duì)話等。GPT-3可以用于自動(dòng)摘要、語(yǔ)義搜索、語(yǔ)言翻譯等任務(wù)。
2、BERT(BidirectionalEncoderRepresentationsfromTransformers):BERT是由Google開(kāi)發(fā)的一款基于Transformer結(jié)構(gòu)的預(yù)訓(xùn)練語(yǔ)言模型。BERT擁有1億個(gè)參數(shù)。它在自然語(yǔ)言處理任務(wù)中取得了巨大的成功,包括文本分類、命名實(shí)體識(shí)別、句子關(guān)系判斷等。
3、ResNet(ResidualNetwork):ResNet是由Microsoft開(kāi)發(fā)的一種深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),被用于計(jì)算機(jī)視覺(jué)任務(wù)中。ResNet深層網(wǎng)絡(luò)結(jié)構(gòu)解決了梯度消失的問(wèn)題,使得訓(xùn)練更深的網(wǎng)絡(luò)變得可行。ResNet在圖像分類、目標(biāo)檢測(cè)和圖像分割等任務(wù)上取得了***的性能。
4、VGGNet(VisualGeometryGroupNetwork):VGGNet是由牛津大學(xué)的VisualGeometryGroup開(kāi)發(fā)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。VGGNet結(jié)構(gòu)簡(jiǎn)單清晰,以其較小的卷積核和深層的堆疊吸引了很多關(guān)注。VGGNet在圖像識(shí)別和圖像分類等任務(wù)上表現(xiàn)出色
。5、Transformer:Transformer是一種基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。 大模型通過(guò)大規(guī)模訓(xùn)練數(shù)據(jù)、多領(lǐng)域訓(xùn)練、知識(shí)融合和遷移學(xué)習(xí)等手段,擁有更全的知識(shí)儲(chǔ)備。深圳智能客服大模型發(fā)展前景是什么
隨著人工智能技術(shù)的不斷進(jìn)步,AI大模型將不斷延伸服務(wù)邊界,推進(jìn)智慧醫(yī)療的落地進(jìn)程。江蘇深度學(xué)習(xí)大模型發(fā)展前景是什么
百度創(chuàng)始人李彥宏早就公開(kāi)表示:"創(chuàng)業(yè)公司重新做一個(gè)ChatGPT其實(shí)沒(méi)有多大意義。我覺(jué)得基于這種大語(yǔ)言模型開(kāi)發(fā)應(yīng)用機(jī)會(huì)很大,沒(méi)有必要再重新發(fā)明一遍輪子,有了輪子之后,做汽車、飛機(jī),價(jià)值可能比輪子大多了。"
近期國(guó)內(nèi)發(fā)布的大模型,大多都面向垂直產(chǎn)業(yè)落地,如京東發(fā)布的言犀大模型,攜程發(fā)布的旅游業(yè)垂直大模型"攜程問(wèn)道",閱文集團(tuán)發(fā)布的閱文妙筆大模型,網(wǎng)易有道發(fā)布的教育領(lǐng)域垂直大模型"子曰"等。
企業(yè)如果基于行業(yè)大模型,再加上自身數(shù)據(jù)進(jìn)行精調(diào),可以建構(gòu)專屬模型,打造出高可用性的智能服務(wù),而且模型參數(shù)比通用大模型少,訓(xùn)練和推理的成本更低,模型優(yōu)化也更容易。 江蘇深度學(xué)習(xí)大模型發(fā)展前景是什么