AIGC是AI算法的一次重大突破,語(yǔ)義智能將迎來(lái)重大發(fā)展。拓爾思(300229)認(rèn)為:
萬(wàn)能的大模型不存在!拓爾思的目標(biāo)不是做最大的模型,而是做專業(yè)的大模型。
(資料圖)
數(shù)據(jù)+算法+算力三大核心要素,決定AIGC產(chǎn)出質(zhì)量。拓爾思將以“專業(yè)大模型+領(lǐng)域知識(shí)數(shù)據(jù)”為核,努力構(gòu)建起個(gè)性化、專業(yè)性的內(nèi)容自動(dòng)生成壁壘。
技術(shù)+產(chǎn)品+場(chǎng)景的完美結(jié)合,才能實(shí)現(xiàn)AIGC推動(dòng)更多商業(yè)落地進(jìn)程。拓爾思將在類人助手的道路上開(kāi)拓全新模式,在G+B雙端的需求持續(xù)催化下,優(yōu)化創(chuàng)新對(duì)話式AI、智能創(chuàng)作、AIGC搜索引擎等應(yīng)用場(chǎng)景,實(shí)現(xiàn)用數(shù)字化勞動(dòng)力替代枯燥重復(fù)性勞動(dòng)、擴(kuò)充資源稀缺勞動(dòng)力、協(xié)助人類完成相應(yīng)任務(wù)和滿足人類情感交流的需求。
10多年前,深度學(xué)習(xí)引發(fā)了人工智能的新浪潮,除了互聯(lián)網(wǎng)大廠外,以智能語(yǔ)音技術(shù)起家的科大訊飛(002230)成為人工智能領(lǐng)域的標(biāo)桿性企業(yè)之一。伴隨著ImageNet的標(biāo)志性突破,以四小龍為代表的圖像識(shí)別公司也獲得了很多的投資和關(guān)注度,但產(chǎn)業(yè)落地都碰到各種問(wèn)題,人們開(kāi)始懷疑人工智能賽道是否要陷入新一輪的低潮。OpenAI的ChatGPT橫空出世,人工智能再次成為人們的關(guān)注熱點(diǎn),不同的是,這一次的關(guān)注,不僅僅是學(xué)術(shù)界、產(chǎn)業(yè)界和資本界,“跨界”和“出圈”的特征非常明顯。
拓爾思2011年上市的時(shí)候,當(dāng)我們?cè)噲D給業(yè)界講“非結(jié)構(gòu)化信息智能處理”的概念時(shí),受眾是無(wú)感的,最后被貼為更通俗的“大數(shù)據(jù)第一股”的標(biāo)簽。當(dāng)我們?cè)?019年第一次以“語(yǔ)義智能”的大主題給市場(chǎng)表達(dá)我們定位的時(shí)候,我們自認(rèn)為把NLP、知識(shí)圖譜和圖像音視頻內(nèi)容理解統(tǒng)一到“語(yǔ)義智能旗下,從而定位拓爾思是認(rèn)知智能開(kāi)拓者,但不是所有的人都能理解和認(rèn)同。但是現(xiàn)在不同了,ChatGPT的流行,很容易給拓爾思的語(yǔ)義智能實(shí)現(xiàn)一個(gè)新的、輕松的表達(dá)。拓爾思語(yǔ)義智能=AI+NLP。其中AIGC將成為爆發(fā)點(diǎn),爆發(fā)的不僅僅是技術(shù),或者主要不是技術(shù),而是應(yīng)用的落地和遍地開(kāi)花。
一
AIGC的發(fā)展現(xiàn)狀
大模型在對(duì)話體驗(yàn)上的突破,讓機(jī)器已經(jīng)能夠近乎完美地理解人類指令,并給出符合預(yù)期答案的時(shí)候,人類終于要從感知智能正式邁向認(rèn)知智能了,人類終于可以用“說(shuō)話”這種方式和計(jì)算機(jī)交互,并讓計(jì)算機(jī)生成我們需要的內(nèi)容。
未來(lái)對(duì)話將成為新的UI,我們可以稱之為CUI(Conversation User Interface),這將給全產(chǎn)業(yè)帶來(lái)顛覆性的改變,推動(dòng)世界用工模式的轉(zhuǎn)變,讓勞動(dòng)力向數(shù)字化轉(zhuǎn)變,讓數(shù)字化勞動(dòng)力能夠和人類員工完美配合,“人+數(shù)字化勞動(dòng)力”將成為新的用工模式。2023年將為數(shù)字勞動(dòng)力元年,ChatGPT的火爆將加速世界勞動(dòng)力向數(shù)字化轉(zhuǎn)變,踏入認(rèn)知智能的時(shí)代。
隨著ChatGPT的火爆,AIGC已經(jīng)受到了全球資本、技術(shù)、產(chǎn)業(yè)和用戶等全維度的關(guān)注。AIGC全稱為AI-Generated Content,指基于大型預(yù)訓(xùn)練模型、生成對(duì)抗網(wǎng)絡(luò)GAN等人工智能技術(shù),通過(guò)已有數(shù)據(jù)尋找規(guī)律,并通過(guò)適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容(文字、圖像、音視頻、代碼等)的技術(shù)。
目前AIGC技術(shù)可生成的內(nèi)容形式已經(jīng)拓展到了包括文字、圖像、視頻、語(yǔ)音、代碼、機(jī)器人動(dòng)作等多種內(nèi)容形式,生成式AI讓機(jī)器開(kāi)始大規(guī)模涉足知識(shí)類和創(chuàng)造性工作,極大推動(dòng)數(shù)字化內(nèi)容生產(chǎn)與創(chuàng)造。
如:微軟宣布將ChatGPT整合到Office生產(chǎn)力程序套件中,并將通過(guò)云服務(wù)提供ChatGPT服務(wù);美國(guó)新媒體巨頭Buzzfeed計(jì)劃要用ChatGPT來(lái)創(chuàng)作內(nèi)容并削減12%的員工導(dǎo)致股價(jià)一夜翻倍;ChatGPT與搜索引擎結(jié)合,其內(nèi)容呈現(xiàn)方式也許會(huì)導(dǎo)致固化的搜索引擎商業(yè)模式被打破的變革。
二
拓爾思的AIGC商業(yè)實(shí)踐
知識(shí)圖譜是AIGC利用AI學(xué)習(xí)實(shí)現(xiàn)自動(dòng)生成的基礎(chǔ)之一。早在2015年,拓爾思參與了一項(xiàng)基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)的863課題《面向基礎(chǔ)教育的知識(shí)能力智能測(cè)評(píng)與類人答題驗(yàn)證-高考機(jī)器人》,主要負(fù)責(zé)十億級(jí)條目規(guī)模知識(shí)圖譜以及大數(shù)據(jù)知識(shí)管理和檢索平臺(tái)的構(gòu)建,助力該“高考機(jī)器人”能實(shí)現(xiàn)對(duì)類人答題原型系統(tǒng)的試題理解、常識(shí)記憶、語(yǔ)言運(yùn)用、知識(shí)關(guān)聯(lián)、知識(shí)推理、初等數(shù)學(xué)求解等各個(gè)智力維度進(jìn)行科學(xué)評(píng)價(jià)。該項(xiàng)目于2017年順利通過(guò)驗(yàn)收。
基于NLP技術(shù)的文本生成可以算作是AIGC中發(fā)展最早的一部分技術(shù)。2016年,拓爾思在浙江日?qǐng)?bào)報(bào)業(yè)集團(tuán)的融媒體智能傳播服務(wù)平臺(tái)中(簡(jiǎn)稱“媒立方”),率先推出了機(jī)器寫(xiě)作,主要根據(jù)拓爾思的全網(wǎng)資訊大數(shù)據(jù)自動(dòng)生成體育、氣象和財(cái)經(jīng)等領(lǐng)域的主題稿件,推送到浙報(bào)媒立方。
2019年,拓爾思提出以“語(yǔ)義智能+行業(yè)/領(lǐng)域”的營(yíng)銷(xiāo)策略。公司深耕自然語(yǔ)言處理,致力于以數(shù)據(jù)智能應(yīng)用為核心,賦能不同行業(yè)的數(shù)字化轉(zhuǎn)型與降本增效的場(chǎng)景應(yīng)用,并積極與客戶攜手,在AIGC相關(guān)領(lǐng)域,如機(jī)器寫(xiě)作、對(duì)話式AI、內(nèi)容人機(jī)協(xié)同和自動(dòng)報(bào)告生成等應(yīng)用場(chǎng)景已相繼打造出一批優(yōu)秀實(shí)踐案例。
三
拓爾思的AIGC發(fā)展路徑
AIGC的興起源自深度學(xué)習(xí)技術(shù)的快速突破和日益增長(zhǎng)的數(shù)字內(nèi)容供給需求,市場(chǎng)潛力逐漸顯現(xiàn)。一方面,技術(shù)進(jìn)步驅(qū)動(dòng)AIGC可用性不斷增強(qiáng);另一方面,大量需求牽引AIGC應(yīng)用落地。拓爾思認(rèn)為AIGC在數(shù)字化程度高及內(nèi)容需求豐富的領(lǐng)域?qū)⒂袕V闊應(yīng)用空間,個(gè)性化及自動(dòng)化內(nèi)容產(chǎn)出為AIGC產(chǎn)品的核心價(jià)值。
01 以“專業(yè)大模型+領(lǐng)域知識(shí)數(shù)據(jù)”為核,NLP技術(shù)突破推動(dòng)更多AIGC商業(yè)落地
拓爾思在AIGC技術(shù)方面有著長(zhǎng)期的投入和儲(chǔ)備,這與公司一直專注自然語(yǔ)言處理技術(shù)的研發(fā)和互聯(lián)網(wǎng)大數(shù)據(jù)的積累等優(yōu)勢(shì)一脈相承。2022年元宇宙Web3.0的概念為市場(chǎng)熱捧,其中拓爾思為服務(wù)型虛擬數(shù)字人賦能“有趣的靈魂”的能力與產(chǎn)品得到業(yè)界廣泛好評(píng)。AIGC是拓爾思數(shù)字人利用NLP與數(shù)據(jù)智能相結(jié)合的重要方向之一,并稱之為虛擬數(shù)字人的“創(chuàng)造力”。
公司將基于通用AIGC大模型,專注優(yōu)勢(shì)行業(yè)進(jìn)行專業(yè)大模型的研發(fā),融合學(xué)習(xí)行業(yè)特有的大數(shù)據(jù)和知識(shí),提升大模型對(duì)行業(yè)應(yīng)用的適配性。我們將以預(yù)訓(xùn)練大模型、In-Context Learning、instruction tuning等技術(shù)為基礎(chǔ),將文本生成、交互式生成、跨模態(tài)生成、小樣本學(xué)習(xí)、大模型與外部知識(shí)庫(kù)的融合等功能作為研發(fā)重點(diǎn),突破基于大模型的AIGC關(guān)鍵技術(shù),在問(wèn)答式AI、智能創(chuàng)作、搜索引擎等領(lǐng)域?qū)崿F(xiàn)成功應(yīng)用。
02 加快推進(jìn)拓爾思“智創(chuàng)”AIGC平臺(tái)的研發(fā)
拓爾思“智創(chuàng)”是一款專注文字生成類的內(nèi)容自動(dòng)生產(chǎn)平臺(tái),其依托公司長(zhǎng)期積累的自然語(yǔ)言處理技術(shù)和人工智能平臺(tái)產(chǎn)品為基礎(chǔ),融合開(kāi)源大模型,將專注在輔助型、應(yīng)用型、創(chuàng)作型等文本內(nèi)容的自動(dòng)生成研發(fā),以個(gè)性化、專業(yè)性的內(nèi)容自動(dòng)生成為壁壘,保持在AI領(lǐng)域的技術(shù)競(jìng)爭(zhēng)力。
03 精耕細(xì)分場(chǎng)景,從降本增效走向額外價(jià)值轉(zhuǎn)移
結(jié)合拓爾思的優(yōu)勢(shì)行業(yè)與客戶群體,公司將優(yōu)先關(guān)注以下行業(yè)的AIGC細(xì)分場(chǎng)景:
新聞出版
機(jī)器人寫(xiě)稿、內(nèi)容創(chuàng)作協(xié)助、基于媒體大數(shù)據(jù)的自動(dòng)報(bào)告生成(如熱點(diǎn)輿情報(bào)告、傳播力報(bào)告和榜單生成等)、多模態(tài)的自動(dòng)配圖(基于文本的圖片、視頻生成)。
政務(wù)服務(wù)
公文輔助創(chuàng)作、政民互動(dòng)服務(wù)(對(duì)話式AI的智能問(wèn)答)、政務(wù)新媒體的創(chuàng)新應(yīng)用(同新聞出版場(chǎng)景應(yīng)用)、政策大腦的摘要/數(shù)據(jù)解讀。
金融領(lǐng)域
自動(dòng)報(bào)告生成(企業(yè)報(bào)告、產(chǎn)業(yè)報(bào)告等)、證券研報(bào)的智能解讀和摘要生成、上市公司的信息檢索。
通用行業(yè)
知識(shí)圖譜構(gòu)建、人機(jī)協(xié)同的內(nèi)容生成(如水軍回復(fù)、考試答題等)、開(kāi)源報(bào)告的簡(jiǎn)報(bào)生成等。
元宇宙和云服務(wù)
虛擬人服務(wù)(靈魂大腦包羅萬(wàn)象、主要是虛擬人的“理解力”與“創(chuàng)作力”相結(jié)合,重點(diǎn)是對(duì)話式AI、智能創(chuàng)作與虛擬人+物+景的自動(dòng)生成);數(shù)家資訊云服務(wù)的報(bào)告生成、資訊信息精準(zhǔn)對(duì)話式檢索;網(wǎng)察云服務(wù)的自動(dòng)輿情報(bào)告生成等。