國產(chǎn)版 ChatGPT 大盤點(diǎn)

來源：奇酷教育發(fā)表于：2023-04-21 11:34:33

?　　國產(chǎn)版 ChatGPT 大盤點(diǎn)

　　3月16日，百度發(fā)布類ChatGPT產(chǎn)品「文心一言」，并開放測試。

　　3月29日，周鴻祎在某大會(huì)上，演示360版的ChatGPT產(chǎn)品。

　　4月7日，阿里版ChatGPT產(chǎn)品「通義千語」并開啟內(nèi)測邀請(qǐng)。

　　預(yù)約地址：https://tongyi.aliyun.com/

　　4月9日，360的大預(yù)言模型「360智腦」開放預(yù)約，即將在4月16日開放測試。預(yù)約地址：https://www.so.com/zt/invite.html#/

　　那在類ChatGPT賽道上，有哪些中國版的ChatGPT？

　　1、百度：文心一言

　　3月16日，百度正式推出國內(nèi)首款生成式AI產(chǎn)品“文心一言”，可支持文學(xué)創(chuàng)作、文案創(chuàng)作、數(shù)理推算、多模態(tài)生成等功能。

　　“文心一言”基于全棧自研的AI基礎(chǔ)設(shè)施進(jìn)行學(xué)習(xí)和訓(xùn)練：

　　①文心知識(shí)增強(qiáng)大模型：“文心一言”的模型層核心能力，該產(chǎn)品主要采用ERNIE系列文心NLP模型，擁有千億參數(shù)級(jí)別的ERNIE 3.0 Zeus為該系列最新模型，進(jìn)一步提升了模型對(duì)于不同下游任務(wù)的建模能力，大大拓寬了“文心一言”的應(yīng)用場景。

　　②飛槳深度學(xué)習(xí)平臺(tái)：“文心一言”的框架層核心能力，系業(yè)內(nèi)首個(gè)動(dòng)靜統(tǒng)一的框架、首個(gè) 通用異構(gòu)參數(shù)服務(wù)器架構(gòu)，支持端邊云多硬件和多操作系統(tǒng)，為文心大模型提供有效、快捷、完整的訓(xùn)練框架。

　　③昆侖芯2代AI芯片：“文心一言”的芯片層核心能力，采用自研XPU-R架構(gòu)，通用性和性能顯著提升；256 TOPS@INT8和128 TFLOPS@FP16的算力水平，較一代提升2-3倍，保障“文心一言”算力需求。

　　文心一言是國內(nèi)關(guān)注度極高的首款類ChatGPT產(chǎn)品，一經(jīng)發(fā)布便涌入了大量的用戶。雖然百度創(chuàng)始人李彥宏坦誠：文心一言并不完美，大開腦洞的文生圖也一度引起了大眾熱議。

　　此外，百度還推出了企業(yè)級(jí)大模型服務(wù)平臺(tái)“文心千帆”，不僅包括文心一言，還包括百度全套文心大模型、相應(yīng)的開發(fā)工具鏈。未來，文心千帆還會(huì)支持第三方的開源大模型。

　　2、騰訊：混元

　　3月30日，騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生向媒體表示，騰訊正在研發(fā)類ChatGPT聊天機(jī)器人。對(duì)于騰訊的聊天機(jī)器人是集成到QQ、微信，還是通過騰訊云向B端用戶服務(wù)，湯道生說：“都會(huì)有。”

　　騰訊在大模型領(lǐng)域的布局早已有之，其“混元”系列AI大模型覆蓋了NLP、CV、多模態(tài)等基礎(chǔ)大模型以及眾多行業(yè)/領(lǐng)域大模型。這成為了騰訊構(gòu)建類ChatGPT產(chǎn)品的堅(jiān)實(shí)技術(shù)儲(chǔ)備。

　　2022年5月，騰訊混元AI大模型在CLUE總排行榜、閱讀理解、大規(guī)模知識(shí)圖譜三個(gè)榜單同時(shí)登頂，一舉打破三項(xiàng)紀(jì)錄。

　　目前，混元AI大模型已經(jīng)廣泛應(yīng)用于騰訊微信搜索、騰訊廣告等業(yè)務(wù)場景，提升了搜索體驗(yàn)和廣告推薦精準(zhǔn)度。

　　據(jù)報(bào)道，騰訊針對(duì)ChatGPT對(duì)話式產(chǎn)品成立了“混元助手（HunyuanAide）”項(xiàng)目組，由騰訊首席科學(xué)家、騰訊AI Lab及Robotics X實(shí)驗(yàn)室主任張正友博士負(fù)責(zé)。

　　根據(jù)最新的騰訊內(nèi)部學(xué)習(xí)會(huì)議內(nèi)容：

　　1、在大模型進(jìn)展方面：騰訊AI大模型六個(gè)BG都有參與，其中TEG（技術(shù)工程事業(yè)群）在算法上更偏整體，其他BG更偏行業(yè)。

　　2、在水平方面：其萬億參數(shù)的水平，相比ChatGPT性能更強(qiáng)，但可能比GPT4比有所不足?；煸竽Ｐ湍壳捌匀徽Z言，而GPT4支持多模態(tài)。

　　3、在前景方面：后續(xù)在商業(yè)化推進(jìn)中，大模型可能會(huì)接入微信、游戲、短視頻、廣告、TOB端等業(yè)務(wù)。

　　在全球范圍內(nèi)，騰訊與谷歌、OpenAI等巨頭相比，在大語言模型AI的技術(shù)研究和應(yīng)用上仍存在差距。不過，憑借龐大的用戶基數(shù)、多元化的業(yè)務(wù)布局以及強(qiáng)大的技術(shù)實(shí)力，騰訊在大語言模型AI的發(fā)展中仍具有其獨(dú)特的競爭優(yōu)勢。

　　不久前騰訊發(fā)布財(cái)報(bào)后，騰訊總裁劉熾平也透露了騰訊聊天機(jī)器人的計(jì)劃，“不急于求成，先打好基礎(chǔ)，再追求新進(jìn)展，我們的第一款產(chǎn)品將會(huì)是多次迭代之后的產(chǎn)品，整個(gè)過程將是長期的”。

　　3、阿里：通義千言

　　4月7日，阿里版ChatGPT產(chǎn)品「通義千語」并開啟內(nèi)測邀請(qǐng)。

　　早在2月8日，阿里巴巴內(nèi)部一款標(biāo)名“預(yù)發(fā)布”的應(yīng)用被“打碼”曝光，被認(rèn)為是達(dá)摩院版的ChatGPT新品。從曝光截圖來看，阿里巴巴可能將AI大模型技術(shù)與釘釘生產(chǎn)力工具深度結(jié)合。

　　圖源：知乎

　　此外，這款傳說中的產(chǎn)品可以實(shí)現(xiàn)的功能不止于知識(shí)回答，還包括AI繪畫、代碼生成、小說續(xù)寫、文案撰寫、寫詩作詞。

　　媒體向阿里巴巴內(nèi)部人士證實(shí)，目前公司確實(shí)在研發(fā)相關(guān)產(chǎn)品，并已經(jīng)處于內(nèi)測階段。據(jù)透露，目前該款產(chǎn)品的命名還沒有最終確定。

　　早在2022年9月，達(dá)摩院曾發(fā)布過“通義”大模型系列。據(jù)透露，阿里版ChatGPT，正是基于通義大模型體系進(jìn)行融合升級(jí)。

　　據(jù)報(bào)道，推出的通義大模型底座基于統(tǒng)一學(xué)習(xí)范式OFA等底層技術(shù)打造，具備了能搞定多種任務(wù)的“大一統(tǒng)”能力：不引入新增結(jié)構(gòu)，單一模型即可同時(shí)處理圖像描述、視覺定位、文生圖、視覺蘊(yùn)含、文檔摘要等10余項(xiàng)單模態(tài)和跨模態(tài)任務(wù)。升級(jí)后，更是可以處理超過包括語音和動(dòng)作在內(nèi)的30多種跨模態(tài)任務(wù)。

　　但據(jù)知情人士透露，打造中文ChatGPT的生態(tài)，這個(gè)定義對(duì)于阿里來說可能窄了一點(diǎn)。相比之下，阿里更希望能引領(lǐng)中文大模型的發(fā)展趨勢。

　　4、字節(jié)：組建大模型團(tuán)隊(duì)

　　2月23日，從多個(gè)獨(dú)立信源處獲悉，字節(jié)跳動(dòng)在大模型上已有所布局，分別在語言和圖像兩種模態(tài)上發(fā)力。

　　字節(jié)跳動(dòng)相關(guān)技術(shù)負(fù)責(zé)人對(duì)此回應(yīng)：技術(shù)中臺(tái)在這些領(lǐng)域有探索，還很初期，不成熟。

　　一名知情人士透露，語言大模型團(tuán)隊(duì)由字節(jié)搜索部門牽頭，目前團(tuán)隊(duì)規(guī)模在十?dāng)?shù)人左右。

　　圖片大模型團(tuán)隊(duì)則由產(chǎn)品研發(fā)與工程架構(gòu)部下屬的智能創(chuàng)作團(tuán)隊(duì)牽頭。

　　值得注意的是，字節(jié)跳動(dòng)有不少AI產(chǎn)品，比如：剪映，就是一款視頻智能生成工具。

　　5、京東：ChatJD

　　2月10日，京東云官微發(fā)布，京東云將推出“產(chǎn)業(yè)版”ChatGPT，產(chǎn)品名字叫：ChatJD。并公布ChatJD的落地應(yīng)用路線圖“125”計(jì)劃。

　　· 1個(gè)平臺(tái)：ChatJD智能人機(jī)對(duì)話平臺(tái)

　　· 2個(gè)領(lǐng)域：零售、金融

　　· 5個(gè)應(yīng)用：內(nèi)容生成、人機(jī)對(duì)話、用戶意圖理解、信息抽取、情感分類

　　圖源：通信產(chǎn)業(yè)網(wǎng)

　　6、華為：盤古

　　華為近日宣布，4月8日將推出其最新的盤古大模型4，稱“將是超過任何其他類似應(yīng)用的最先進(jìn)、最強(qiáng)大的自然語言處理應(yīng)用”。

　　根據(jù)華為云官網(wǎng)顯示，華為即將上線的“盤古系列AI大模型”分別為：NLP大模型、CV大模型、以及科學(xué)計(jì)算大模型。

　　其中，盤古“NLP大模型”是被認(rèn)為最接近人類中文理解能力的AI大模型，而盤古“CV大模型”首次兼顧了圖像判別與生成能力。

　　01 大模型規(guī)模

　　華為盤古大模型的規(guī)模相對(duì)較小，僅擁有1200億個(gè)參數(shù)；而GPT-3則有1750億個(gè)參數(shù)，是目前最大的自然語言處理模型。因此，在某些任務(wù)上，GPT-3可能在表現(xiàn)上更為突出。

　　02 訓(xùn)練數(shù)據(jù)

　　雖然盤古模型擁有的參數(shù)少于GPT-3，但是華為在訓(xùn)練時(shí)使用了大量的中文文本，包括不同類型的文本數(shù)據(jù)，如百科、新聞、小說、行業(yè)專業(yè)文本等。這種多樣性的數(shù)據(jù)來源使得盤古模型擁有更廣泛的知識(shí)和語言能力，對(duì)于中文應(yīng)用來說具有很大的優(yōu)勢。

　　03 模型用途

　　華為盤古大模型主要應(yīng)用于中文的文本生成、問答、翻譯等任務(wù)。而GPT-3則可以應(yīng)用于英文和其他語言的文本生成、翻譯、自然語言推理、問題回答等任務(wù)。由于應(yīng)用領(lǐng)域不同，兩者在某些任務(wù)上的效果也有所不同。

　　7、網(wǎng)易：子曰

　　早在2月9日，網(wǎng)易有道方面透露，有道AI技術(shù)團(tuán)隊(duì)已投入到ChatGPT同源技術(shù)（AIGC）在教育場景的落地研發(fā)中，目前該團(tuán)隊(duì)已在AI口語老師、中文作文批改等細(xì)分學(xué)習(xí)場景中嘗試應(yīng)用。

　　同時(shí)，公司有望盡快推出相關(guān)的demo版產(chǎn)品，該產(chǎn)品的面世將標(biāo)志著AIGC技術(shù)在國內(nèi)互聯(lián)網(wǎng)教育場景的首次著陸。

　　網(wǎng)易有道專為教育類場景自研的類ChatGPT模型“子曰“將于近期開放內(nèi)測。

　?、僭诮逃齼?nèi)容的數(shù)據(jù)方面，網(wǎng)易有道在語言學(xué)習(xí)方面有著較為深厚的積累，2007年網(wǎng)易便推出了有道詞典，這讓網(wǎng)易積累了較多的語言學(xué)習(xí)數(shù)據(jù)，為“子曰”提供了良好的培育土壤。

　?、谠谒懔Ψ矫妫槍?duì)教育垂類，成本將有所下降。有道詞典筆P5產(chǎn)品已升級(jí)至NPU方案，相對(duì)CPU版本模型推理速度提高了數(shù)倍，實(shí)現(xiàn)了“一目十行”的識(shí)別效率；在模型大小增加15倍的基礎(chǔ)上，AI引擎的精確度也獲得了大幅提升。且網(wǎng)易有道在AI算法方面也處于國內(nèi)較為領(lǐng)先的地位，不過有道“子曰”的最終效果能夠達(dá)到何種程度目前尚不得而知。

　　8、360：360智腦

　　4月9日，360的大預(yù)言模型「360智腦」開放預(yù)約，即將在4月16日開放測試。

　　一經(jīng)上線，涌進(jìn)2萬多人預(yù)約。

　　“搭不上ChatGPT這班車的企業(yè)會(huì)被淘汰。”周鴻祎與張朝陽在一檔欄目中如是說，而日前，360版本的GPT已經(jīng)被紅衣教主“抱出來讓大家看看”。

　　早在3月29日，在數(shù)字安全與發(fā)展高峰論壇上，周鴻祎發(fā)布了360版“ChatGPT”。

　　從現(xiàn)場演示來看，360版GPT確實(shí)已經(jīng)具備一定的推理能力，但在回答問題時(shí)，仍需要多次提問、提醒才能得出讓人比較滿意的答案。

　　圖源：網(wǎng)絡(luò)

　　此外，周鴻祎還表示360很快便會(huì)推出智能辦公產(chǎn)品，并加上類 ChatGPT的能力，這一點(diǎn)和微軟office軟件的發(fā)展方向也是類似的。

　　此前，360稱，目前360搜索是中國搜索引擎的Top 2，市場份額為35%，但截至目前僅作為內(nèi)部業(yè)務(wù)自用的生產(chǎn)力工具使用，且投資規(guī)模及技術(shù)水平與當(dāng)前的ChatGPT 3相比還有較大差距，各項(xiàng)技術(shù)指標(biāo)只能做到略強(qiáng)于ChatGPT 2。由于訓(xùn)練數(shù)據(jù)源及應(yīng)用方向的原因，在中文環(huán)境下的實(shí)際效果強(qiáng)于ChatGPT 2。

　　同時(shí)，360在數(shù)據(jù)資源端有豐富的多模態(tài)大數(shù)據(jù)積累和相關(guān)語料、尤其是中文語料，相較于國外同行落后的是預(yù)訓(xùn)練大模型和有效的多模態(tài)數(shù)據(jù)清洗與融合技術(shù)。公司有充足的資金儲(chǔ)備可用于購買大規(guī)模算力，在繼續(xù)深入自行研發(fā)的同時(shí)，不排除尋找強(qiáng)有力的合作伙伴，以開放的心態(tài)搭建多方共享平臺(tái)、補(bǔ)足短板，快速縮小差距。

　　周鴻祎曾表示，360的人工智能戰(zhàn)略用四個(gè)字形容就是“兩翼齊飛”，先占據(jù)應(yīng)用場景，同步全力發(fā)展核心算法技術(shù)。

　　9、光年之外：廣納AI人才

　　2月13日，原美團(tuán)聯(lián)合創(chuàng)始人王慧文，發(fā)了一條“英雄帖”，稱要出資5000萬美元，打造中國的OpenAI（ChatGPT主體公司），同時(shí)為自己的新事業(yè)招募人才。