學而思宣布開放三項核心AI能力，CTO田密：教育大模型終極形態(tài)是AI老師

2024-07-08 16:28:48發(fā)布來源：多知作者：Penny

　　來源|多知

　　作者|Penny

　　7月6日，在2024世界人工智能大會的分論壇上，學而思CTO田密在《教育大模型，構建未來個性化學習藍圖》的演講中，對大模型對教育行業(yè)的應用和影響以及九章大模型的研發(fā)過程和落地產(chǎn)品進行了分享。

　　在演講中，田密認為，在教育中，個性化、高質(zhì)量和大規(guī)模很難同時做到，而大模型是打破教育不可能三角的一縷曙光。

　　“隨著大模型時代的到來，所有的教育AI技術都值得用大模型重做一遍。好未來正在聚焦五大場景重構教育科技，分別是解題、對話、批改、講題和推薦。”田密說。

　　田密坦陳，今天大模型發(fā)展非常迅速，但是還是在非常早期的階段。

　　田密還在演講中宣布：“學而思將向全行業(yè)開放三項最重要的核心AI能力解題、講題和批改，各界硬件廠商，像AIPC、手機、Pad、汽車等行業(yè)都可以合作，我們希望為整個教育的數(shù)字化轉(zhuǎn)型貢獻需要自己的一份力量。”

　　同時，在2024世界人工智能大會上，田密接受了多知的訪談，他說：“教育大模型最終目標是AI老師，即對學生24小時陪伴的老師，AI 老師可以分解為很多能力，他要自己會解題，會講題，隨時隨地解答學生問題。”

　　“AI老師是終極形態(tài)，但整個過程中會可能演變出很多階段性的產(chǎn)品。”田密說。

　　今年9月全國即將全面落實新課標，田密對多知說：“新課標對大模型是利好，因為新課標要求跨學科學習，大模型天然是跨學科的，九章大模型也是一個全科的大語言模型，可以做到融合各科知識去講解。”

　　大模型在教育領域的應用最大的阻礙就在于它的幻覺問題，田密提到，學而思正通過搜索召回增強技術(RAG)，比較有效地緩解幻覺問題，不能去消除，但是可以緩解，這使得大模型能夠比較有效應用在實際的產(chǎn)品中去。

　　RAG也就是用大模型生成之前先搜索召回相關的context拼裝到program里面去做提示詞工程，輸出就會有約束，不會胡說八道，按照指引生成對應上下文回答。

　　對于大模型在教育科技的應用，田密對多知說：“我覺得趨勢還是逐步過渡，逐漸賦能，然后慢慢提升，潛移默化的一個過程，很難一下子到終局。”

　　以下為田密分享全文：

　　大模型可以打破教育的不可能三角

　　很多人覺得大模型對教育行業(yè)會有顛覆性影響，像Sora出來的時候很多人會問你們將來還需要輔導班老師嗎?我覺得今天大模型發(fā)展非常迅速，但是還沒有到徹底替換老師的地步。

　　大家知道在教育行業(yè)一直有一個所謂的不可能三角理論，就是說個性化、高質(zhì)量和大規(guī)模很難同時做到，以學而思為例，最早推出了學而思培優(yōu)，小班的方式可以做到高質(zhì)量和個性化，但是做不到大規(guī)模，后來做了學而思網(wǎng)校，大班的方式可以做到大規(guī)模和高質(zhì)量，但是沒有做到個性化，一個老師同時給成千上萬的孩子授課，再后來我們做了各種AI課，勉強可以做到個性化和大規(guī)模，但是教學質(zhì)量和真人老師還是有很大的差距。

　　所以我們的目標一直是沿著個性化和大規(guī)模前提下做更好的質(zhì)量，我覺得AI技術發(fā)展使得質(zhì)量提升不斷有了可能性，而大模型技術出現(xiàn)更是一縷曙光。

　　學而思一直在投入做教育科技研發(fā)，我們從2003年成立開始就在積累題庫數(shù)據(jù)，這些都是訓練大模型寶貴的原材料;2017年成立了AI Lab，在像語音、圖像、NLP方向做了深積累，形成教育全環(huán)節(jié)解決方案;2019年獲批承建科技部智慧教育國家新一代開放創(chuàng)新平臺；2023年推出國內(nèi)教育大模型——九章大模型。

　　其實在大模型技術出現(xiàn)之前，整個AI技術已經(jīng)賦能了教育各個環(huán)節(jié)，像備、教、練、評、管各個環(huán)節(jié)。比如說備課的時候可以用AI技術幫老師自動組講義、組卷，授課環(huán)節(jié)幫老師做授課助手，給孩子做智能答題器，幫助老師做智能提醒和個性化的學情畫像等等。比如說練習階段做自適應練習還有中文作業(yè)批改還有整頁批改，評環(huán)節(jié)做口語評測等等，管的環(huán)節(jié)對老師生活質(zhì)量進行各個分級評估，還有包括解決方案等等。

　　教育行業(yè)已經(jīng)基于AI做了很多應用，但是我認為隨著大模型時代的到來，所有的教育AI技術都值得用大模型重做一遍。因為大家知道當年人工智能是從系統(tǒng)開始誕生的，主要靠規(guī)則，再到后來的機器學習，主要以汲取做大規(guī)模數(shù)據(jù)訓練為代表，然后再到2012年深度學習所有算法轉(zhuǎn)向深度的神經(jīng)網(wǎng)絡，取得了很好的結果，再到今天大模型，今天大模型的話核心基礎是Transformer和Attention都是2017年谷歌提出了，到今年大約七年之后終于有了大爆發(fā)。

　　大模型這種本身也是AI技術，它和傳統(tǒng)的深度學習技術有什么本質(zhì)差異呢?我覺得有三點，對于教育行業(yè)來說：

　　第一，大模型更加通用了，大家知道過去做AI服務需要上百個小模型，工作量非常大，現(xiàn)在一個大模型可以搞定所有任務，訓練成本極大地降低，訓練效率很大提升，通用性得到很大保障。

　　第二，大模型有了通用大模型作為基座，過去教育大模型只能學會教育相關的語料，今天讓通用大模型作為基座，學到更多世界知識和教育知識相融合之后會變得更加聰明，情商更高。

　　第三，大模型生成式可以做多輪交互方式，使得人機交互或者師生交互更加容易、便捷、自然，Attention機制隨著語義理解也更加Robust(魯棒，即系統(tǒng)強壯)。

　　所以今天教育技術都可以使用大模型技術全部重做一遍。

　　教育大模型是如何訓練出來的?

　　教育大模型到底怎么訓練出來的，訓練模型方式和通用大模型沒有什么本質(zhì)差別。

　　我以九章大模型數(shù)據(jù)大模型為例來講它怎么訓練的，可以發(fā)現(xiàn)，大模型跟人類孩子一樣學知識的方式、手段和人類也是很相似的，比如說我們把訓練過程分為三個階段：

　　1.預訓練（Pre-training）。它和孩子學習是什么呢?一個孩子看大量的書去學，自己看學，學到基本知識和理論框架。

　　2.有監(jiān)督微調(diào)（Supervised Fine-Tuning）。相當于請了一個老師給孩子講解標準的解題套路，孩子知道說這個題目該怎么解，向老師學習。

　　3.強化學習（Reinforcement learning）。這個相當于孩子不斷做多輪練習，每練習一次大模型對它進行批改和反饋，相當于不斷進階提升。

　　經(jīng)過三段訓練之后，大模型像孩子一樣學會了一個學科，比如說數(shù)學。

　　其中最關鍵的是什么？是數(shù)據(jù)。你有什么樣的數(shù)據(jù)才能訓練什么模型，所以在不同訓練階段都需要不同的數(shù)據(jù)。比如預訓練需要海量的題庫、講義、教輔書，有監(jiān)督微調(diào)(SFT)階段需要海量步驟清晰的解題數(shù)據(jù)，強化學習階段需要用獎勵模型做結果進行反饋。

　　我們名稱叫做九章大模型，本身布局不僅僅是數(shù)學，是全學科的大模型，但是大模型和人類一樣，文科生和理科生是有區(qū)別的，我們發(fā)現(xiàn)很難在一個大模型里頭同時學好數(shù)學、語文和英語，最終我們是用多專家模型方式，有專門的數(shù)學模型、語模型、英語模型等等，最終以MoE方式組合起來做全科的服務。

　　值得一提的是大模型今天應用最大的阻礙就在于它的幻覺問題，到今天通過搜索召回增強技術(RAG)，可以比較有效地緩解幻覺問題，不能去消除，但是可以緩解，使得大模型能夠比較有效應用在實際的產(chǎn)品中去。

　　RAG也就是用大模型生成之前先搜索召回相關的context拼裝到program里面去做提示詞工程，輸出就會有約束，不會胡說八道，按照你的指引生成對應上下文回答。比如，把學生的學習畫像放進去，就可以生成個性化的回答，這是今天大模型要落地應用的關鍵點。

　　聚焦五大場景重構教育科技

　　我前面說大模型它教育AI所有場景都用教育大模型做一遍，直到今天到底學而思在哪些場景下已經(jīng)用大模型重構了教育科技呢?目前我們分為五大場景，分別是解題、對話、批改、講題和推薦。

　　解題即給一個題目實時解出來，我們做題庫生產(chǎn)也可以做拍搜，如果拍不到的話實施大模型解題作為兜底。

　　第二個對話很容易理解，比較常見的對話能力。

　　第三批改，中文、英文作業(yè)批改，比如數(shù)學題批改，現(xiàn)在有大模型之后我們數(shù)學批改可以細致到步驟級別，知道你答案是否對，還知道你錯在哪一步。

　　第四個是AI大模型講題能力，很有用，AI一對一老師有了實現(xiàn)的可能性。

　　最后是推薦能力，過去我們有很多地方使用了“推薦”，但是現(xiàn)在大模型前提下可以做到步驟級，使得制定標簽更加精準、推薦效果更加好。

　　逐步看一下幾個過程，第一是自動解題，左邊這是一個網(wǎng)站，是非常專業(yè)的對數(shù)學能進行評測的網(wǎng)站，目前我們九章大模型在榜單里排名第一，但是它的總分只有80多分，離100分還有比較大的差距。

　　右邊就是我們網(wǎng)站官網(wǎng)，這是一張高中的函數(shù)題，不知道大家還有多少人能做出來，大模型會自動解，它會先分析一下題目，是考什么地方、考什么知識點再做一步步詳解，可以觀測到我們對公式處理非常到位，可以做流式的渲染。

　　最終解完之后還有“點睛”，知道這個題考點是什么，考察什么，為什么?因為我們學而思老師都喜歡做“點睛”，所以大模型也學會了這一點。

　　第二是口語對話練習，這一系列比較常見，在我們ABC英語角里頭有這樣的功能，讓孩子像在游戲中學習的過程。我們會對學生的回答進行口語評測，對流利度和發(fā)音進行評測。

　　第三個例子是批改，批改其實是非常剛需功能，對于老師和家長都一樣，比如說孩子做完之后到底做得好不好，比如說左邊是我們語文的中文作文批改，會先對字詞做判斷，到底有沒有錯別字和用法錯誤，對段落進行批改，對文章進行批改，對內(nèi)容進行建議最后還有潤色方法，這是AI批改的五步法。右邊是英文作文也是一樣，分為三步，首先做批改，再做建議，還有最后潤色。

　　這是數(shù)學的批改，數(shù)學批改比英文、語文更難，因為數(shù)學題是相對更難解的，過去只能批改填空題、選擇題，到今天的話，大數(shù)據(jù)發(fā)展的話，我們批改這種大題，也就是主觀題，涉及到步驟批改，大家可以看到演示，這是已經(jīng)上到學期上了，實際過程。職業(yè)對準確進行拍批，它會對每道題進行批改，錯誤題標出來進行個性化講解。這工作非常有用，在于說學習機上有一個精準學，需要對孩子進行診斷，但是孩子并不希望在學校再做一遍題目，可以把校內(nèi)試卷拿過來掃描一下，拍一下直接做冷啟動，更好做精準學。

　　批改功能已經(jīng)上線到學而思學習機上了，大家有興趣可以體驗一下。

　　再往下是剛剛說的講題功能，講題是大模型帶來的全新能力，在大模型之前很難做到這一點，今年我們推出一個叫九章隨時問小程序，APP版也可以下載了，大家可以微信上搜索九章隨時問可以體驗小程序，它是數(shù)學AI老師，不是直接給孩子答案，而是一步步講解，任何不懂過程中可以隨時打斷它做追問，可以問問題。也是拍照，自動識別題目進行講解，它會做各種設問引導孩子回答，可以直接語音輸出不用敲字了，不懂的話可以直接提問為什么要進行平方呢?如果你問了不相關的東西它會把你拉回來。最后總結要點，還會舉一反三給你更多拓展問題。

　　大家可以看到AI老師像真人老師一樣，不想孩子直接拿到答案還是逐步講解，任何不懂的問題可以做追問、做回答，可以舉一反三，大家可以微信搜索九章隨時問小程序進行體驗。

　　最后還有一個應用藏在后面叫推薦，其實精準學或者個性化學習最核心就是做題目推薦。過去我們做診斷，只能精確到題目級別，比如這道題考察的是二次根式的化簡求值，一個知識點，但是實際上這個題目我們拆成三個步驟解答，每個步驟會考察更細的知識點，做了第一步、做第二步錯法是不一樣的，大模型對每個步驟打標簽，使得對題目錯因判斷更加精準，從而使得推薦效果也是更加精準。

　　比如這個例子，錯的第一步可能是對不等式本身不了解，對定義與性質(zhì)包括對去括號不了解，這是做了更加細致的推薦過程。

　　向全行業(yè)開放“解題、講題和批改”三大核心AI能力

　　到今天學而思我們借著WAIC現(xiàn)場，也宣布我們會把學而思打造的三項最重要的核心AI能力解題、講題和批改，向全行業(yè)做開放，為什么這樣做呢？實際上我覺得今天整個AI大模型對教育行業(yè)的影響也好、賦能也好還是非常早期的階段。

　　我覺得基于這樣的AI能力，到底能打造出什么樣好的AI產(chǎn)品在培訓機構、公立校、家內(nèi)的學習場景下到底有什么好的產(chǎn)品和效果出現(xiàn)，都還是很早期的階段，所以今天我們希望把核心能力開放給行業(yè)的所有參與者，包括像各界硬件廠商，像AIPC、手機、Pad、汽車，都可以和我們談合作，包括我們的一些公立學校2B2C應用，希望把大模型應用能力真正用到教育行業(yè)方面，也為整個教育的數(shù)字化轉(zhuǎn)型貢獻需要自己的一份力量。

　　最后我覺得教育大模型還是有一個終極夢想，很多人擔心AI大模型會不會顛覆教育行業(yè)，會不會讓AI老師真正代替真人老師，我答案是不會的。我們認為大模型會給每個老師配備一個AI助教，每個孩子配備一個AI學伴，但是老師有很多固定工作，比如說備課、作業(yè)批改，這些重復工作都可以用AI大模型替代它，老師可以把精力更加集中在對孩子的關愛上、喚醒激發(fā)鼓舞上，孩子配備AI學伴，24小時在線陪伴他學習成長，他有任何問題都可以向AI學伴進行詢問，因為他沒有任何壓力，孩子不用擔心問的問題很愚蠢，也不用擔心AI講幾遍才能聽明白，也不擔心孩子問的問題是不是超綱或者有些跨學科的問題， AI都可以搞定這個事情。

　　讓孩子會更加保持對學習的樂趣，對學習的自信心，我覺得這才是教育行業(yè)為大模型賦能的終極意義所在。

　　今天我的演講到這兒，謝謝大家!

　　相關閱讀：

　　大模型重構學習機：學而思學習機全面披露“小思”AI功能

　　學而思推出數(shù)學答疑原生AI工具九章隨時問，“AI將重新定義教育行業(yè)”

　　學而思迭代其首款學習機：配備10大AI神器，支持新課標內(nèi)容

　　暴走WAIC：跟AI+教育有關的，都在這兒↑

　　END

　　本文作者：Penny

商學院

Open Talk

學而思宣布開放三項核心AI能力，CTO田密：教育大模型終極形態(tài)是AI老師

相關閱讀

商學院

Open Talk

學而思宣布開放三項核心AI能力，CTO田密：教育大模型終極形態(tài)是AI老師

相關閱讀

學而思宣布開放三項核心AI能力，CTO田密：教育大模型終極形態(tài)是AI老師