ChatGPT浪潮下大型語言模型發(fā)展，屬于AIGC的時(shí)代來了？

日前，知乎在北京召開“2023知乎發(fā)現(xiàn)大會”，首次公開旗下與面壁智能共建的大模型產(chǎn)品“知海圖AI”。官方表示，在熱榜上抽取、聚合知乎用戶回答的41條內(nèi)容，“知海圖AI”的表現(xiàn)基本接近ChatGPT-4。

在OpenAI推出ChatGPT之后，近幾個(gè)月，國內(nèi)外科技企業(yè)陸續(xù)推出自己的大模型，包括百度的文心一言，商湯科技的商量SenseChat，阿里云的通義千問，昆侖萬維的“天工”3.5，以及亞馬遜的Titan，還有360、騰訊、搜狐，王慧文的光年之外等都傳出相關(guān)消息。

目前都發(fā)布了哪些大型語言模型

OpenAI在2022年11月30日發(fā)布的ChatGPT，在短短幾個(gè)月時(shí)間風(fēng)靡全球。今年3月14日，OpenAI再次發(fā)布更強(qiáng)大的多模態(tài)大模型GPT-4。其最大股東微軟公司不僅宣布推出由ChatGPT支持的搜索引擎Bing和Edge瀏覽器。還宣布將GPT-4全面接入所有辦公軟件。

在ChatGPT的帶動下，全球科技公司掀起研究大型語言模型的熱潮。國內(nèi)最新跟上的要數(shù)百度了，3月16日，百度正式發(fā)布新一代大語言模型、生成式 AI 產(chǎn)品文心一言。在發(fā)布會上，李彥宏還展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成等使用場景中的綜合能力。

除了百度，最近還有多個(gè)大型語言模型密集發(fā)布。4月10日，昆侖萬維宣布，其和奇點(diǎn)智源合作自研、中國第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)的國產(chǎn)大語言模型——“天工”3.5發(fā)布在即，并將于4月17日啟動邀請測試。該公司表示，“天工”大模型已經(jīng)非常接近OpenAI ChatGPT的智能水平。

4月11日，在2023阿里云峰會上，阿里云也正式發(fā)布了旗下的類ChatGPT大模型——通義千問。阿里巴巴集團(tuán)董事會主席兼CEO、阿里云智能集團(tuán)CEO張勇表示，阿里巴巴所有產(chǎn)品未來將接入“通義千問”大模型，進(jìn)行全面改造，釘釘、天貓精靈已率先接入通義千問測試，并會在評估認(rèn)證后正式發(fā)布新功能。

4月12日，商湯科技發(fā)布“日日新SenseNova”大模型體系，推出語言大模型“商量SenseChat”、內(nèi)容生成、自動化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種大模型及能力。據(jù)悉，作為千億級參數(shù)的自然語言處理模型，“商量SenseChat”使用大量數(shù)據(jù)訓(xùn)練，并充分考慮了中文語境，能夠更好地理解和處理中文文本。

4月13日，亞馬遜推出一項(xiàng)名為“Bedrock”的云服務(wù)，允許開發(fā)者使用類似于ChatGPT聊天機(jī)器人的人工智能系統(tǒng)。通過Bedrock生成式人工智能服務(wù)，亞馬遜旗下云服務(wù)AWS將向開發(fā)者提供自家的語言模型“Titan”，以及來自初創(chuàng)公司AI21和谷歌支持的Anthropic的語言模型。這其中，一個(gè)Titan模型可以為博客帖子、電子郵件或其他文檔生成文本，而另一個(gè)可以幫助搜索和實(shí)現(xiàn)個(gè)性化。

此外，華為、騰訊也在大模型方面有所積累，華為最早于2021年便發(fā)布了華為云盤古基礎(chǔ)大模型，包括NLP、CV和科學(xué)計(jì)算大模型。最近有消息稱，華為云官網(wǎng)即將上線盤古系列AI大模型，分別為NLP大模型、CV等。不過華為云方面，并沒有對此做出回應(yīng)。騰訊很早就已經(jīng)進(jìn)行AI大模型的研究——混元AI大模型覆蓋NLP（自然語言處理）、CV（計(jì)算機(jī)視覺）、多模態(tài)等基礎(chǔ)模型和眾多行業(yè)/領(lǐng)域模型。

騰訊不久前表示，近期混元AI大模型團(tuán)隊(duì)也推出了萬億中文NLP預(yù)訓(xùn)練模型HunYuan-NLP-1T，實(shí)現(xiàn)在中文語言理解能力上的新突破，而且得益其低成本、普惠等特點(diǎn)，目前HunYuan-NLP-1T大模型已成功落地于騰訊廣告、搜索、對話等內(nèi)部產(chǎn)品并通過騰訊云服務(wù)外部客戶。

除了科技大廠，也有創(chuàng)業(yè)團(tuán)隊(duì)宣布加入大模型研究大軍。4月10日，搜狗創(chuàng)始人王小川正式宣布入場大模型創(chuàng)業(yè)，和前搜狗COO茹立云聯(lián)合創(chuàng)立人工智能公司——百川智能，要做的事情是打造中國版的Open AI基礎(chǔ)大模型及顛覆性上層應(yīng)用。王小川表示，有信心在年底發(fā)布國內(nèi)最好的語言大模型。

另外，還有之前很受關(guān)注的創(chuàng)業(yè)項(xiàng)目，美團(tuán)聯(lián)合創(chuàng)始人王慧文設(shè)立的光年之外科技公司。以及前商湯科技副總裁、通用智能技術(shù)負(fù)責(zé)人閆俊杰創(chuàng)辦的Minimax。

大模型的訓(xùn)練和運(yùn)行，離不開算力支持

然而，大模型的訓(xùn)練和運(yùn)行，需要強(qiáng)大的算力基礎(chǔ)。阿里云、商湯科技、騰訊等，在研究推進(jìn)大模型研究的同時(shí)，也在構(gòu)建算力基礎(chǔ)設(shè)施，供公司自身或其他公司使用。

大模型背后的算力基礎(chǔ)，包括高性能計(jì)算硬件、分布式計(jì)算框架、高效的算法和優(yōu)化技術(shù)以及大量的訓(xùn)練數(shù)據(jù)和存儲資源。這些因素共同支撐著大模型的成功運(yùn)行。

阿里云在這方面做了充足準(zhǔn)備，張勇表示，十多年來，阿里云已經(jīng)累積了從飛天云操作系統(tǒng)、芯片到智算平臺的“AI+云計(jì)算”的全棧技術(shù)實(shí)力，并在IaaS（基礎(chǔ)設(shè)施即服務(wù)）和PaaS（平臺即服務(wù)）的基礎(chǔ)上，建立了第三層MaaS（模型即服務(wù)）的體系。

具體而言，“飛天智算基礎(chǔ)設(shè)施”智算IaaS服務(wù)涵蓋了一系列卓越特性，包括能夠支持高達(dá)十萬卡GPU的單集群規(guī)模、可讓多個(gè)萬億參數(shù)大模型同時(shí)在線訓(xùn)練的強(qiáng)大智算集群，以及為萬卡規(guī)模AI集群提供無擁塞通訊的自主研發(fā)RDMA網(wǎng)絡(luò)架構(gòu)等；

智算PaaS服務(wù)則以機(jī)器學(xué)習(xí)平臺PAI為核心，可支持萬卡的單任務(wù)分布式訓(xùn)練規(guī)模，AI訓(xùn)練效率提升可達(dá)10倍，推理效率提升可達(dá)6倍，覆蓋全鏈路AI開發(fā)工具與大數(shù)據(jù)服務(wù)，深度支持了通義大模型的研發(fā)。

智算MaaS服務(wù)包括通義大模型系列和以之為基礎(chǔ)的企業(yè)定制大模型。

憑借這些能力，阿里云不僅可以為自家大模型“通義千問”提供支持，還能夠把豐富的算力資源和大模型能力分享給更多企業(yè)和社會各界，共同推動AI技術(shù)的發(fā)展。

商湯科技在這方面也有積累，當(dāng)前業(yè)界訓(xùn)練大模型對大算力的需求非常旺盛，并且真正好用的基礎(chǔ)設(shè)施十分稀缺。商湯歷時(shí)五年，建設(shè)了業(yè)界領(lǐng)先的AI大裝置，大裝置上總共有27000塊的GPU芯片卡，可以輸出5.0 exaFLOPS的總算力，是亞洲目前最大的智能計(jì)算平臺之一。

基于大裝置的能力，商湯目前已構(gòu)建了計(jì)算機(jī)視覺、自然語言處理、AI內(nèi)容生成、多模態(tài)、決策智能等多個(gè)領(lǐng)域的大模型，持續(xù)演進(jìn)能力并廣泛支持各種應(yīng)用。

面向大模型訓(xùn)練，4月14日，騰訊云正式發(fā)布了新一代HCC(High-Performance Computing Cluster)高性能計(jì)算集群。該集群采用騰訊云星星海自研服務(wù)器，國內(nèi)首發(fā)搭載英偉達(dá)最新代次H800 GPU，能夠提供高性能、高帶寬、低延遲的算力支撐。根據(jù)官方數(shù)據(jù)，新的HCC計(jì)算集群能夠?qū)⒋竽Ｐ偷挠?xùn)練時(shí)間從上一代的11天壓縮至4天，可以有效節(jié)省大量時(shí)間。

全民AIGC時(shí)代要來了

從目前的情況來看，國內(nèi)外科技企業(yè)巨頭都已經(jīng)加入到大模型的研究大軍中，在過去短短幾個(gè)月時(shí)間，各種大模型產(chǎn)品密集發(fā)布。與此同時(shí)，作為大模型訓(xùn)練和部署重要的支撐，算力基礎(chǔ)設(shè)施的構(gòu)建也在加速推進(jìn)。

另外，日前消息，微軟宣布開源了Deep Speed Chat，可以幫助用戶輕松訓(xùn)練類ChatGPT等大語言模型，使得人人都能擁有自己的ChatGPT。也就是說，用戶通過Deep Speed Chat提供的“傻瓜式”操作，能以最短的時(shí)間、最高效的成本訓(xùn)練類ChatGPT大語言模型，這標(biāo)志著人手一個(gè)ChatGPT的時(shí)代要來了。

當(dāng)然，當(dāng)前ChatGPT等大模型還處于初期發(fā)展階段，人們不免對安全隱患、數(shù)據(jù)隱私、道德問題存在擔(dān)心。不過，最近多個(gè)國家已經(jīng)開始著手制定AI相關(guān)的規(guī)則和政策。這意味著，大模型在經(jīng)歷了過去幾個(gè)月的野蠻生長之后，將會逐步向規(guī)范化發(fā)展。

昵稱：

驗(yàn)證碼：

聯(lián)系電話 : 0755-83234805

傳真：0755-83234805

郵箱：cy.lu@qianxidianzi.com

地址：深圳市龍崗區(qū)吉華街道甘坑社區(qū)甘李二路8號華通大廈1907-1908、813室

ChatGPT浪潮下大型語言模型發(fā)展，屬于AIGC的時(shí)代來了？

ChatGPT浪潮下大型語言模型發(fā)展，屬于AIGC的時(shí)代來了？