“國(guó)產(chǎn)全自研、中文能力比肩GPT-4”
多知網(wǎng)1月17日消息,智譜AI16日舉辦首屆技術(shù)開(kāi)放日(Zhipu DevDay)?,F(xiàn)場(chǎng),智譜AI團(tuán)隊(duì)全面展示了其投身于大模型事業(yè)三年多來(lái)所積累的技術(shù)成果,并重磅發(fā)布了新一代基座大模型GLM-4。
根據(jù)此次GLM-4的發(fā)布及上線,是智譜AI大模型研發(fā)上的關(guān)鍵突破。智譜AI首席執(zhí)行官?gòu)堸i介紹,GLM-4的整體性能相比上一代大幅提升,逼近GPT-4。它可以支持更長(zhǎng)的上下文,具備更強(qiáng)的多模態(tài)能力。同時(shí),它的推理速度更快,支持更高的并發(fā),大大降低推理成本。除此之外,GLM-4大幅提升了智能體能力,GLM-4 All Tools 實(shí)現(xiàn)自主根據(jù)用戶意圖,自動(dòng)理解、規(guī)劃復(fù)雜指令,自由調(diào)用網(wǎng)頁(yè)瀏覽器、Code Interpreter代碼解釋器和多模態(tài)文生圖大模型以完成復(fù)雜任務(wù)。GLMs 個(gè)性化智能體定制功能亦同時(shí)上線,用戶用簡(jiǎn)單的提示詞指令就能創(chuàng)建屬于自己的 GLM 智能體。
具體來(lái)說(shuō),GLM-4可以支持128k的上下文窗口長(zhǎng)度,單次提示詞可以處理的文本可以達(dá)到300頁(yè)。同時(shí),在needle test(大海撈針)測(cè)試中,128K文本長(zhǎng)度內(nèi)GLM-4 模型均可做到幾乎100%的精度召回,并未出現(xiàn)長(zhǎng)上下文全局信息因?yàn)槭Ы苟鴮?dǎo)致的精度下降問(wèn)題。同時(shí),多模態(tài)能力方面,文生圖和多模態(tài)理解都得到了增強(qiáng)。
此外,GLM-4的All Tools能力全新發(fā)布。得益于GLM模型的強(qiáng)大Agent能力,GLM-4實(shí)現(xiàn)了自主根據(jù)用戶意圖,自動(dòng)理解、規(guī)劃復(fù)雜指令,自由調(diào)用網(wǎng)頁(yè)瀏覽器、Code Interpreter代碼解釋器和文生圖CogView3模型。同時(shí),GLM-4 通過(guò)代碼解釋器,會(huì)自動(dòng)調(diào)用代碼解釋器進(jìn)行復(fù)雜的方程或者微積分求解。對(duì)比GSM8K、Math以及Math23K三個(gè)數(shù)據(jù)集上的結(jié)果,GLM-4 All Tools取得和GPT-4 All Tools相當(dāng)?shù)男Ч?。GLM-4的All Tools能力完全自動(dòng),而且可以處理各種任務(wù),比如包括文件處理、數(shù)據(jù)分析、圖表繪制等復(fù)雜任務(wù),支持處理 Excel、PDF、PPT 等格式的文件。
GLMs個(gè)性化智能體定制能力也同步上線?;贕LM-4模型的強(qiáng)大能力,用戶只要登錄智譜清言官方網(wǎng)站,用簡(jiǎn)單的提示詞指令就能創(chuàng)建屬于自己的GLM智能體。并且,用戶可以通過(guò)全新上線的智能體中心分享自己創(chuàng)建的各種智能體。GLM模型智能體的推出標(biāo)志著任何人都能夠自由運(yùn)用GLM-4模型并挖掘它的潛力,沒(méi)有任何編程基礎(chǔ)也能夠?qū)崿F(xiàn)大模型的便捷開(kāi)發(fā)。這是智譜AI為降低大模型使用門(mén)檻所做的最新努力。
此前,智譜AI分別聯(lián)合CCF中國(guó)計(jì)算機(jī)學(xué)會(huì)、中國(guó)中文信息學(xué)會(huì)社會(huì)媒體處理專委會(huì)發(fā)起了CCF-智譜大模型基金、SMP-智譜大模型交叉學(xué)科基金,用于支持大模型理論、算法、模型、應(yīng)用等相關(guān)研究和跨領(lǐng)域交叉創(chuàng)新。去年兩支基金為來(lái)自全國(guó)三十余所高校參與的41個(gè)研究項(xiàng)目累計(jì)提供了超1000萬(wàn)元現(xiàn)金和算力資源的科研支持。
2024年,智譜AI也將發(fā)起開(kāi)源開(kāi)放的大模型開(kāi)源基金,該計(jì)劃包括三個(gè)“一千”:智譜AI將為大模型開(kāi)源社區(qū)提供一千張卡,助力開(kāi)源開(kāi)發(fā);提供1000萬(wàn)元的現(xiàn)金用來(lái)支持與大模型相關(guān)的開(kāi)源項(xiàng)目;為優(yōu)秀的開(kāi)源開(kāi)發(fā)者提供1000億免費(fèi)API tokens。張鵬表示,大模型開(kāi)源基金的目的在于推動(dòng)大模型研發(fā)的大進(jìn)展,促進(jìn)大模型整個(gè)開(kāi)源生態(tài)的大繁榮。面對(duì)全球的大模型創(chuàng)業(yè)者,智譜AI也將“Z計(jì)劃”進(jìn)一步升級(jí),聯(lián)合生態(tài)伙伴發(fā)起總額10億人民幣的大模型創(chuàng)業(yè)基金用于支持大模型原始創(chuàng)新,覆蓋大模型算法、底層算子、芯片優(yōu)化、行業(yè)大模型和超級(jí)應(yīng)用等方向。
2024年被業(yè)界普遍認(rèn)為是人工智能發(fā)展歷史上的又一重要年份。張鵬認(rèn)為,2024將是AGI元年。他表示:“大模型創(chuàng)新研發(fā)是一條長(zhǎng)征路,一枝獨(dú)秀不是春,我們希望與人工智能行業(yè)所有的參與者、產(chǎn)業(yè)鏈上下游合作伙伴、開(kāi)發(fā)者社區(qū)、學(xué)術(shù)界一同努力,為中國(guó)AI新未來(lái)貢獻(xiàn)綿薄之力。”
智譜AI于2020年底開(kāi)始研發(fā)GLM預(yù)訓(xùn)練架構(gòu),2021年訓(xùn)練完成百億參數(shù)模型GLM-10B,同年利用MoE架構(gòu)成功訓(xùn)練出收斂的萬(wàn)億稀疏模型,2022年合作研發(fā)了中英雙語(yǔ)千億級(jí)超大規(guī)模預(yù)訓(xùn)練模型GLM-130B。2023年,智譜AI推出了基于千億基座的對(duì)話模型ChatGLM,并開(kāi)源單卡版模型ChatGLM-6B,使得研究者和個(gè)人開(kāi)發(fā)者進(jìn)行本地微調(diào)和部署成為可能。
目前,針對(duì)B端企業(yè)的模型訓(xùn)練、微調(diào)、部署等服務(wù),是智譜AI的主要業(yè)務(wù)形式,其合作伙伴包括有道、火山引擎等。
公開(kāi)資料顯示,智譜AI是國(guó)內(nèi) AI 領(lǐng)域獨(dú)角獸企業(yè),其背后的投資方包括美團(tuán)、阿里、螞蟻集團(tuán)、高瓴資本等多家投資機(jī)構(gòu)。(多知網(wǎng) Penny)