4月10日,商湯科技董事長(zhǎng)兼CEO徐立在商湯技術(shù)交流日上發(fā)布“日日新”大模型體系,取自《禮記·大學(xué)》,湯之盤銘:茍日新,日日新,又日新?!叭杖招隆贝竽P腕w系包含自然語(yǔ)言生成、照片生成服務(wù)、感知模型預(yù)標(biāo)注、模型研發(fā)。商湯發(fā)布中文語(yǔ)言大模型應(yīng)用平臺(tái)“商量”,1800億參數(shù)中文大語(yǔ)言模型支持超長(zhǎng)文本知識(shí)理解,支持問答、理解與生成等中文語(yǔ)言能力,可實(shí)現(xiàn)多輪對(duì)話、邏輯推理、語(yǔ)言糾錯(cuò)、內(nèi)容創(chuàng)作、情感分析等。
現(xiàn)場(chǎng)演示了中文語(yǔ)言大模型寫作廣告語(yǔ)、續(xù)寫兒童故事、編程等。編程核心功能包括代碼補(bǔ)全、擴(kuò)寫、翻譯、重構(gòu)、修正,以及注釋生成代碼、復(fù)雜度分析、測(cè)試用例生成等。徐立表示,內(nèi)部實(shí)測(cè)代碼編寫效率提升62%,HumanEval測(cè)試集一次通過率40.2%。下一代軟件開發(fā)范式是AI for AI,代碼=80% AI生成 20%人工。
超10億參數(shù)自研文生圖生成模型“秒畫”,支持二次元等多種生成風(fēng)格。單卡A100支持,2秒生成1張512K分辨率的圖片。用戶可基于單卡A100自訓(xùn)練。基于平臺(tái)發(fā)布的模型,可設(shè)置toB服務(wù)API(應(yīng)用程序編程接口),結(jié)合商湯大算力對(duì)外提供服務(wù)。
此外,商湯科技對(duì)外發(fā)布3D內(nèi)容生成平臺(tái)“瓊宇”(場(chǎng)景生成)、“格物”(物體生成),基于3D內(nèi)容生成技術(shù)對(duì)空間和物體的復(fù)刻與交互。100平方公里城市級(jí)生成,“瓊宇”用時(shí)2天,具有厘米級(jí)重建精度,還原場(chǎng)景的真實(shí)細(xì)節(jié)和光照效果,應(yīng)用場(chǎng)景涵蓋城市及園區(qū)數(shù)字孿生、建筑設(shè)計(jì)、影視創(chuàng)作、文旅和電商等。
徐立對(duì)澎湃科技(www.thepaper.cn)表示,在這個(gè)時(shí)間點(diǎn)推出大模型體系,是希望吸引更多下游用戶,自然語(yǔ)言模型能夠把各種垂直類的任務(wù)串聯(lián)起來(lái),用多模態(tài)混合的模式迭代行業(yè)場(chǎng)景。通過提供新的多模態(tài)訓(xùn)練框架,訓(xùn)練下一個(gè)階段的多模態(tài)大模型,通過細(xì)分場(chǎng)景端到端的迭代和應(yīng)用,幫助多模態(tài)大模型的發(fā)展。目前已有8家商業(yè)客戶使用商湯多模態(tài)訓(xùn)練框架進(jìn)行大模型訓(xùn)練。“我們希望我們的大模型體系能夠幫助行業(yè)生產(chǎn)出下一代最領(lǐng)先的多模態(tài)模型,并且升級(jí)性能?!?