騰訊元寶讓DeepSeek長眼睛了，能用于學(xué)習(xí)嗎？

2025-02-22 10:37:20發(fā)布來源：多知作者：王上

　　來源|多知

　　作者|王上

　　2月21日，騰訊AI助手“騰訊元寶”上新，現(xiàn)在騰訊元寶的DeepSeek能夠理解圖片信息。這是繼2月13日騰訊元寶接入Deepseek-R1滿血版以來的又一進(jìn)展。

　　此前，DeepSeek主要支持掃描圖片中的文字。升級(jí)后，在騰訊元寶，關(guān)閉聯(lián)網(wǎng)搜索后，用戶發(fā)送任意圖片，元寶都能結(jié)合圖片內(nèi)容給出自己的分析和理解。

　　據(jù)了解，這項(xiàng)功能結(jié)合了混元的多模態(tài)理解能力，也是元寶雙模型特征的體現(xiàn)。

　　當(dāng)大模型有了眼睛，教育場景有了更多可能，如知識(shí)即拍即得、作業(yè)批改等，以及未來有視覺能力的大模型和硬件結(jié)合將有更大的想象空間。

　　然而，多知體驗(yàn)發(fā)現(xiàn)，以教育場景中的一個(gè)痛點(diǎn)場景“作業(yè)批改”為例，通用大模型的深度思考模式未必是高效的模式。

　　多知開啟騰訊元寶“深度思考”模式，體驗(yàn)數(shù)學(xué)口算批改，上傳了一張四年級(jí)口算題目圖片，共48道，系統(tǒng)會(huì)逐一核對題目的計(jì)算過程和結(jié)果，全部思考用時(shí)90秒，給出結(jié)果還需要60秒。

　　而用教育領(lǐng)域的拍照答疑軟件隨時(shí)問和小猿AI 識(shí)別同一張圖片，一兩秒即可。

　　從正確率來看，騰訊元寶的識(shí)別率很低，48道計(jì)算題，系統(tǒng)給出的判斷是3道錯(cuò)誤，6道未答。而教育領(lǐng)域的拍照答疑軟件，識(shí)別所有題目的答案都作答正確，且也能給出詳盡的解析。

　　可以看到，對于作業(yè)批改來說，題目的識(shí)別是通用模型需要跨越的第一道坎。

　　再以批改作文為例，多知開啟騰訊元寶“深度思考”模式，上傳了一篇小學(xué)四年級(jí)的手寫作文照片，首先學(xué)生作文題目中有錯(cuò)別字，騰訊元寶沒有給予提醒。

　　并且，學(xué)生作文中書寫的“簡直”、“地獄”兩個(gè)詞中的“簡”和“獄”是用拼音代替的，騰訊元寶則認(rèn)為這是學(xué)生書寫的錯(cuò)別字。實(shí)際上，小學(xué)四年級(jí)的孩子是允許在作文中使用一兩個(gè)拼音的。

　　由此可以看到，騰訊元寶不是專有的教育App，是通用的思維，是按成年人的模式進(jìn)行思考的。這也從側(cè)面反映了教育領(lǐng)域垂類大模型針對不同年齡段分層的重要性，這也是其壁壘所在。

　　多知開啟上傳了一些與學(xué)習(xí)內(nèi)容關(guān)聯(lián)性不高的照片，發(fā)現(xiàn)識(shí)別率很高，拍照通過騰訊元寶識(shí)別后就能學(xué)習(xí)到相關(guān)知識(shí)。

　　比如，上傳一盆綠蘿的照片，它很快能識(shí)別出是綠蘿，還給出了判斷依據(jù)、養(yǎng)護(hù)小貼士等，信息全面，語言通俗易通。

　　多知再上傳了一張照片，這是山西博物院的鎮(zhèn)館之寶之一“趙卿鳥尊”，并詢問元寶“趙卿”是誰?

　　元寶僅思考了30秒，就給出了“趙卿”是春秋時(shí)期晉國正卿趙鞅(即趙簡子)，并且對趙卿的身份考證、歷史地位以及鳥尊的象征意義都解釋的詳盡無遺，甚至還給出了延伸知識(shí)。

　　可以看到，借助騰訊元寶來探索通識(shí)知識(shí)，或是讓它充當(dāng)指引旅游的導(dǎo)游，都是頗為適宜的選擇。

　　過去一周，騰訊元寶迎來一系列快速迭代和功能更新。騰訊方面表示，未來將持續(xù)優(yōu)化產(chǎn)品能力，提升模型性能，為用戶提供更優(yōu)質(zhì)的AI使用體驗(yàn)。

　　目前，在騰訊元寶，用戶可以使用DeepSeek-R1滿血版、推理模型混元T1進(jìn)行深度思考，也可通過DeepSeek-V3、騰訊混元Turbo快速輸出答案。

　　并且，騰訊元寶內(nèi)的所有模型，都已支持理解圖片、解析文件、聯(lián)網(wǎng)搜公眾號(hào)、從微信上傳文件。與公眾號(hào)和微信的打通是其獨(dú)特之處。

騰訊元寶讓DeepSeek長眼睛了，能用于學(xué)習(xí)嗎？