當(dāng)大模型有了眼睛,教育場景有了更多可能。
來源|多知
作者|王上
2月21日,騰訊AI助手“騰訊元寶”上新,現(xiàn)在騰訊元寶的DeepSeek能夠理解圖片信息。這是繼2月13日騰訊元寶接入Deepseek-R1滿血版以來的又一進(jìn)展。
此前,DeepSeek主要支持掃描圖片中的文字。升級(jí)后,在騰訊元寶,關(guān)閉聯(lián)網(wǎng)搜索后,用戶發(fā)送任意圖片,元寶都能結(jié)合圖片內(nèi)容給出自己的分析和理解。
據(jù)了解,這項(xiàng)功能結(jié)合了混元的多模態(tài)理解能力,也是元寶雙模型特征的體現(xiàn)。
當(dāng)大模型有了眼睛,教育場景有了更多可能,如知識(shí)即拍即得、作業(yè)批改等,以及未來有視覺能力的大模型和硬件結(jié)合將有更大的想象空間。
然而,多知體驗(yàn)發(fā)現(xiàn),以教育場景中的一個(gè)痛點(diǎn)場景“作業(yè)批改”為例,通用大模型的深度思考模式未必是高效的模式。
多知開啟騰訊元寶“深度思考”模式,體驗(yàn)數(shù)學(xué)口算批改,上傳了一張四年級(jí)口算題目圖片,共48道,系統(tǒng)會(huì)逐一核對題目的計(jì)算過程和結(jié)果,全部思考用時(shí)90秒,給出結(jié)果還需要60秒。
而用教育領(lǐng)域的拍照答疑軟件隨時(shí)問和小猿AI 識(shí)別同一張圖片,一兩秒即可。
從正確率來看,騰訊元寶的識(shí)別率很低,48道計(jì)算題,系統(tǒng)給出的判斷是3道錯(cuò)誤,6道未答。而教育領(lǐng)域的拍照答疑軟件,識(shí)別所有題目的答案都作答正確,且也能給出詳盡的解析。
可以看到,對于作業(yè)批改來說,題目的識(shí)別是通用模型需要跨越的第一道坎。
再以批改作文為例,多知開啟騰訊元寶“深度思考”模式,上傳了一篇小學(xué)四年級(jí)的手寫作文照片,首先學(xué)生作文題目中有錯(cuò)別字,騰訊元寶沒有給予提醒。
并且,學(xué)生作文中書寫的“簡直”、“地獄”兩個(gè)詞中的“簡”和“獄”是用拼音代替的,騰訊元寶則認(rèn)為這是學(xué)生書寫的錯(cuò)別字。實(shí)際上,小學(xué)四年級(jí)的孩子是允許在作文中使用一兩個(gè)拼音的。
由此可以看到,騰訊元寶不是專有的教育App,是通用的思維,是按成年人的模式進(jìn)行思考的。這也從側(cè)面反映了教育領(lǐng)域垂類大模型針對不同年齡段分層的重要性,這也是其壁壘所在。
多知開啟上傳了一些與學(xué)習(xí)內(nèi)容關(guān)聯(lián)性不高的照片,發(fā)現(xiàn)識(shí)別率很高,拍照通過騰訊元寶識(shí)別后就能學(xué)習(xí)到相關(guān)知識(shí)。
比如,上傳一盆綠蘿的照片,它很快能識(shí)別出是綠蘿,還給出了判斷依據(jù)、養(yǎng)護(hù)小貼士等,信息全面,語言通俗易通。
多知再上傳了一張照片,這是山西博物院的鎮(zhèn)館之寶之一“趙卿鳥尊”,并詢問元寶“趙卿”是誰?
元寶僅思考了30秒,就給出了“趙卿”是春秋時(shí)期晉國正卿趙鞅(即趙簡子),并且對趙卿的身份考證、歷史地位以及鳥尊的象征意義都解釋的詳盡無遺,甚至還給出了延伸知識(shí)。
可以看到,借助騰訊元寶來探索通識(shí)知識(shí),或是讓它充當(dāng)指引旅游的導(dǎo)游,都是頗為適宜的選擇。
過去一周,騰訊元寶迎來一系列快速迭代和功能更新。騰訊方面表示,未來將持續(xù)優(yōu)化產(chǎn)品能力,提升模型性能,為用戶提供更優(yōu)質(zhì)的AI使用體驗(yàn)。
目前,在騰訊元寶,用戶可以使用DeepSeek-R1滿血版、推理模型混元T1進(jìn)行深度思考,也可通過DeepSeek-V3、騰訊混元Turbo快速輸出答案。
并且,騰訊元寶內(nèi)的所有模型,都已支持理解圖片、解析文件、聯(lián)網(wǎng)搜公眾號(hào)、從微信上傳文件。與公眾號(hào)和微信的打通是其獨(dú)特之處。