好未來正在聚焦五大場景重構教育科技。

學而思宣布開放三項核心AI能力,CTO田密:教育大模型終極形態(tài)是AI老師

2024-07-08 16:28:48發(fā)布     來源:多知    作者:Penny  

  來源|多知

  作者|Penny

  7月6日,在2024世界人工智能大會的分論壇上,學而思CTO田密在《教育大模型,構建未來個性化學習藍圖》的演講中,對大模型對教育行業(yè)的應用和影響以及九章大模型的研發(fā)過程和落地產(chǎn)品進行了分享。

  在演講中,田密認為,在教育中,個性化、高質(zhì)量和大規(guī)模很難同時做到,而大模型是打破教育不可能三角的一縷曙光。

  “隨著大模型時代的到來,所有的教育AI技術都值得用大模型重做一遍。好未來正在聚焦五大場景重構教育科技,分別是解題、對話、批改、講題和推薦。”田密說。

  田密坦陳,今天大模型發(fā)展非常迅速,但是還是在非常早期的階段。

  田密還在演講中宣布:“學而思將向全行業(yè)開放三項最重要的核心AI能力解題、講題和批改,各界硬件廠商,像AIPC、手機、Pad、汽車等行業(yè)都可以合作,我們希望為整個教育的數(shù)字化轉(zhuǎn)型貢獻需要自己的一份力量。”

  同時,在2024世界人工智能大會上,田密接受了多知的訪談,他說:“教育大模型最終目標是AI老師,即對學生24小時陪伴的老師,AI 老師可以分解為很多能力,他要自己會解題,會講題,隨時隨地解答學生問題。”

  “AI老師是終極形態(tài),但整個過程中會可能演變出很多階段性的產(chǎn)品。”田密說。

  今年9月全國即將全面落實新課標,田密對多知說:“新課標對大模型是利好,因為新課標要求跨學科學習,大模型天然是跨學科的,九章大模型也是一個全科的大語言模型,可以做到融合各科知識去講解。”

  大模型在教育領域的應用最大的阻礙就在于它的幻覺問題,田密提到,學而思正通過搜索召回增強技術(RAG),比較有效地緩解幻覺問題,不能去消除,但是可以緩解,這使得大模型能夠比較有效應用在實際的產(chǎn)品中去。

  RAG也就是用大模型生成之前先搜索召回相關的context拼裝到program里面去做提示詞工程,輸出就會有約束,不會胡說八道,按照指引生成對應上下文回答。

  對于大模型在教育科技的應用,田密對多知說:“我覺得趨勢還是逐步過渡,逐漸賦能,然后慢慢提升,潛移默化的一個過程,很難一下子到終局。”

  以下為田密分享全文:

  01

  大模型可以打破教育的不可能三角

  很多人覺得大模型對教育行業(yè)會有顛覆性影響,像Sora出來的時候很多人會問你們將來還需要輔導班老師嗎?我覺得今天大模型發(fā)展非常迅速,但是還沒有到徹底替換老師的地步。

  大家知道在教育行業(yè)一直有一個所謂的不可能三角理論,就是說個性化、高質(zhì)量和大規(guī)模很難同時做到,以學而思為例,最早推出了學而思培優(yōu),小班的方式可以做到高質(zhì)量和個性化,但是做不到大規(guī)模,后來做了學而思網(wǎng)校,大班的方式可以做到大規(guī)模和高質(zhì)量,但是沒有做到個性化,一個老師同時給成千上萬的孩子授課,再后來我們做了各種AI課,勉強可以做到個性化和大規(guī)模,但是教學質(zhì)量和真人老師還是有很大的差距。

  

  所以我們的目標一直是沿著個性化和大規(guī)模前提下做更好的質(zhì)量,我覺得AI技術發(fā)展使得質(zhì)量提升不斷有了可能性,而大模型技術出現(xiàn)更是一縷曙光。

  學而思一直在投入做教育科技研發(fā),我們從2003年成立開始就在積累題庫數(shù)據(jù),這些都是訓練大模型寶貴的原材料;2017年成立了AI Lab,在像語音、圖像、NLP方向做了深積累,形成教育全環(huán)節(jié)解決方案;2019年獲批承建科技部智慧教育國家新一代開放創(chuàng)新平臺;2023年推出國內(nèi)教育大模型——九章大模型。

  

  其實在大模型技術出現(xiàn)之前,整個AI技術已經(jīng)賦能了教育各個環(huán)節(jié),像備、教、練、評、管各個環(huán)節(jié)。比如說備課的時候可以用AI技術幫老師自動組講義、組卷,授課環(huán)節(jié)幫老師做授課助手,給孩子做智能答題器,幫助老師做智能提醒和個性化的學情畫像等等。比如說練習階段做自適應練習還有中文作業(yè)批改還有整頁批改,評環(huán)節(jié)做口語評測等等,管的環(huán)節(jié)對老師生活質(zhì)量進行各個分級評估,還有包括解決方案等等。

  教育行業(yè)已經(jīng)基于AI做了很多應用,但是我認為隨著大模型時代的到來,所有的教育AI技術都值得用大模型重做一遍。因為大家知道當年人工智能是從系統(tǒng)開始誕生的,主要靠規(guī)則,再到后來的機器學習,主要以汲取做大規(guī)模數(shù)據(jù)訓練為代表,然后再到2012年深度學習所有算法轉(zhuǎn)向深度的神經(jīng)網(wǎng)絡,取得了很好的結果,再到今天大模型,今天大模型的話核心基礎是Transformer和Attention都是2017年谷歌提出了,到今年大約七年之后終于有了大爆發(fā)。

  

  大模型這種本身也是AI技術,它和傳統(tǒng)的深度學習技術有什么本質(zhì)差異呢?我覺得有三點,對于教育行業(yè)來說:

  第一,大模型更加通用了,大家知道過去做AI服務需要上百個小模型,工作量非常大,現(xiàn)在一個大模型可以搞定所有任務,訓練成本極大地降低,訓練效率很大提升,通用性得到很大保障。

  第二,大模型有了通用大模型作為基座,過去教育大模型只能學會教育相關的語料,今天讓通用大模型作為基座,學到更多世界知識和教育知識相融合之后會變得更加聰明,情商更高。

  第三,大模型生成式可以做多輪交互方式,使得人機交互或者師生交互更加容易、便捷、自然,Attention機制隨著語義理解也更加Robust(魯棒,即系統(tǒng)強壯)。

  所以今天教育技術都可以使用大模型技術全部重做一遍。

  02

  教育大模型是如何訓練出來的?

  教育大模型到底怎么訓練出來的,訓練模型方式和通用大模型沒有什么本質(zhì)差別。

  我以九章大模型數(shù)據(jù)大模型為例來講它怎么訓練的,可以發(fā)現(xiàn),大模型跟人類孩子一樣學知識的方式、手段和人類也是很相似的,比如說我們把訓練過程分為三個階段:

  1.預訓練(Pre-training)。它和孩子學習是什么呢?一個孩子看大量的書去學,自己看學,學到基本知識和理論框架。

  2.有監(jiān)督微調(diào)(Supervised Fine-Tuning)。相當于請了一個老師給孩子講解標準的解題套路,孩子知道說這個題目該怎么解,向老師學習。

  3.強化學習(Reinforcement learning)。這個相當于孩子不斷做多輪練習,每練習一次大模型對它進行批改和反饋,相當于不斷進階提升。

  

  經(jīng)過三段訓練之后,大模型像孩子一樣學會了一個學科,比如說數(shù)學。

  其中最關鍵的是什么?是數(shù)據(jù)。你有什么樣的數(shù)據(jù)才能訓練什么模型,所以在不同訓練階段都需要不同的數(shù)據(jù)。比如預訓練需要海量的題庫、講義、教輔書,有監(jiān)督微調(diào)(SFT)階段需要海量步驟清晰的解題數(shù)據(jù),強化學習階段需要用獎勵模型做結果進行反饋。

  我們名稱叫做九章大模型,本身布局不僅僅是數(shù)學,是全學科的大模型,但是大模型和人類一樣,文科生和理科生是有區(qū)別的,我們發(fā)現(xiàn)很難在一個大模型里頭同時學好數(shù)學、語文和英語,最終我們是用多專家模型方式,有專門的數(shù)學模型、語模型、英語模型等等,最終以MoE方式組合起來做全科的服務。

  值得一提的是大模型今天應用最大的阻礙就在于它的幻覺問題,到今天通過搜索召回增強技術(RAG),可以比較有效地緩解幻覺問題,不能去消除,但是可以緩解,使得大模型能夠比較有效應用在實際的產(chǎn)品中去。

  

  RAG也就是用大模型生成之前先搜索召回相關的context拼裝到program里面去做提示詞工程,輸出就會有約束,不會胡說八道,按照你的指引生成對應上下文回答。比如,把學生的學習畫像放進去,就可以生成個性化的回答,這是今天大模型要落地應用的關鍵點。

  03

  聚焦五大場景重構教育科技

  我前面說大模型它教育AI所有場景都用教育大模型做一遍,直到今天到底學而思在哪些場景下已經(jīng)用大模型重構了教育科技呢?目前我們分為五大場景,分別是解題、對話、批改、講題和推薦。

  解題即給一個題目實時解出來,我們做題庫生產(chǎn)也可以做拍搜,如果拍不到的話實施大模型解題作為兜底。

  第二個對話很容易理解,比較常見的對話能力。

  第三批改,中文、英文作業(yè)批改,比如數(shù)學題批改,現(xiàn)在有大模型之后我們數(shù)學批改可以細致到步驟級別,知道你答案是否對,還知道你錯在哪一步。

  第四個是AI大模型講題能力,很有用,AI一對一老師有了實現(xiàn)的可能性。

  最后是推薦能力,過去我們有很多地方使用了“推薦”,但是現(xiàn)在大模型前提下可以做到步驟級,使得制定標簽更加精準、推薦效果更加好。

  逐步看一下幾個過程,第一是自動解題,左邊這是一個網(wǎng)站,是非常專業(yè)的對數(shù)學能進行評測的網(wǎng)站,目前我們九章大模型在榜單里排名第一,但是它的總分只有80多分,離100分還有比較大的差距。

  

  右邊就是我們網(wǎng)站官網(wǎng),這是一張高中的函數(shù)題,不知道大家還有多少人能做出來,大模型會自動解,它會先分析一下題目,是考什么地方、考什么知識點再做一步步詳解,可以觀測到我們對公式處理非常到位,可以做流式的渲染。

  最終解完之后還有“點睛”,知道這個題考點是什么,考察什么,為什么?因為我們學而思老師都喜歡做“點睛”,所以大模型也學會了這一點。

  第二是口語對話練習,這一系列比較常見,在我們ABC英語角里頭有這樣的功能,讓孩子像在游戲中學習的過程。我們會對學生的回答進行口語評測,對流利度和發(fā)音進行評測。

  第三個例子是批改,批改其實是非常剛需功能,對于老師和家長都一樣,比如說孩子做完之后到底做得好不好,比如說左邊是我們語文的中文作文批改,會先對字詞做判斷,到底有沒有錯別字和用法錯誤,對段落進行批改,對文章進行批改,對內(nèi)容進行建議最后還有潤色方法,這是AI批改的五步法。右邊是英文作文也是一樣,分為三步,首先做批改,再做建議,還有最后潤色。

  

  這是數(shù)學的批改,數(shù)學批改比英文、語文更難,因為數(shù)學題是相對更難解的,過去只能批改填空題、選擇題,到今天的話,大數(shù)據(jù)發(fā)展的話,我們批改這種大題,也就是主觀題,涉及到步驟批改,大家可以看到演示,這是已經(jīng)上到學期上了,實際過程。職業(yè)對準確進行拍批,它會對每道題進行批改,錯誤題標出來進行個性化講解。這工作非常有用,在于說學習機上有一個精準學,需要對孩子進行診斷,但是孩子并不希望在學校再做一遍題目,可以把校內(nèi)試卷拿過來掃描一下,拍一下直接做冷啟動,更好做精準學。

  批改功能已經(jīng)上線到學而思學習機上了,大家有興趣可以體驗一下。

  再往下是剛剛說的講題功能,講題是大模型帶來的全新能力,在大模型之前很難做到這一點,今年我們推出一個叫九章隨時問小程序,APP版也可以下載了,大家可以微信上搜索九章隨時問可以體驗小程序,它是數(shù)學AI老師,不是直接給孩子答案,而是一步步講解,任何不懂過程中可以隨時打斷它做追問,可以問問題。也是拍照,自動識別題目進行講解,它會做各種設問引導孩子回答,可以直接語音輸出不用敲字了,不懂的話可以直接提問為什么要進行平方呢?如果你問了不相關的東西它會把你拉回來。最后總結要點,還會舉一反三給你更多拓展問題。

  大家可以看到AI老師像真人老師一樣,不想孩子直接拿到答案還是逐步講解,任何不懂的問題可以做追問、做回答,可以舉一反三,大家可以微信搜索九章隨時問小程序進行體驗。

  最后還有一個應用藏在后面叫推薦,其實精準學或者個性化學習最核心就是做題目推薦。過去我們做診斷,只能精確到題目級別,比如這道題考察的是二次根式的化簡求值,一個知識點,但是實際上這個題目我們拆成三個步驟解答,每個步驟會考察更細的知識點,做了第一步、做第二步錯法是不一樣的,大模型對每個步驟打標簽,使得對題目錯因判斷更加精準,從而使得推薦效果也是更加精準。

  

  比如這個例子,錯的第一步可能是對不等式本身不了解,對定義與性質(zhì)包括對去括號不了解,這是做了更加細致的推薦過程。

  04

  向全行業(yè)開放“解題、講題和批改”三大核心AI能力

  到今天學而思我們借著WAIC現(xiàn)場,也宣布我們會把學而思打造的三項最重要的核心AI能力解題、講題和批改,向全行業(yè)做開放,為什么這樣做呢?實際上我覺得今天整個AI大模型對教育行業(yè)的影響也好、賦能也好還是非常早期的階段。

  我覺得基于這樣的AI能力,到底能打造出什么樣好的AI產(chǎn)品在培訓機構、公立校、家內(nèi)的學習場景下到底有什么好的產(chǎn)品和效果出現(xiàn),都還是很早期的階段,所以今天我們希望把核心能力開放給行業(yè)的所有參與者,包括像各界硬件廠商,像AIPC、手機、Pad、汽車,都可以和我們談合作,包括我們的一些公立學校2B2C應用,希望把大模型應用能力真正用到教育行業(yè)方面,也為整個教育的數(shù)字化轉(zhuǎn)型貢獻需要自己的一份力量。

  最后我覺得教育大模型還是有一個終極夢想,很多人擔心AI大模型會不會顛覆教育行業(yè),會不會讓AI老師真正代替真人老師,我答案是不會的。我們認為大模型會給每個老師配備一個AI助教,每個孩子配備一個AI學伴,但是老師有很多固定工作,比如說備課、作業(yè)批改,這些重復工作都可以用AI大模型替代它,老師可以把精力更加集中在對孩子的關愛上、喚醒激發(fā)鼓舞上,孩子配備AI學伴,24小時在線陪伴他學習成長,他有任何問題都可以向AI學伴進行詢問,因為他沒有任何壓力,孩子不用擔心問的問題很愚蠢,也不用擔心AI講幾遍才能聽明白,也不擔心孩子問的問題是不是超綱或者有些跨學科的問題, AI都可以搞定這個事情。

  讓孩子會更加保持對學習的樂趣,對學習的自信心,我覺得這才是教育行業(yè)為大模型賦能的終極意義所在。

  今天我的演講到這兒,謝謝大家!

  相關閱讀:

  大模型重構學習機:學而思學習機全面披露“小思”AI功能

  學而思推出數(shù)學答疑原生AI工具九章隨時問,“AI將重新定義教育行業(yè)”

  學而思迭代其首款學習機:配備10大AI神器,支持新課標內(nèi)容

  暴走WAIC:跟AI+教育有關的,都在這兒↑

  END

  本文作者:Penny