“加速探索C端應(yīng)用?!?/p>
多知網(wǎng)12月15日消息,網(wǎng)易有道在日前宣布推出虛擬人口語教練Hi Echo的2.0版,從官方信息來看,2.0主要圍繞四個(gè)層面進(jìn)行了升級:口語難度分級,虛擬人形象更加豐富,對話場景更加豐富,個(gè)性化對話評價(jià)報(bào)告。
今年7月,網(wǎng)易有道推出教育大模型“子曰”后接連發(fā)布大模型落地產(chǎn)品,Hi Echo便是其中之一,其以1對1口語對話模式為用戶提供貼近真實(shí)場景的口語練習(xí),有道稱為“隨時(shí)隨地的口語教練”。
“中國人在說英語時(shí)往往面臨開口難、不敢說、不知道該從何說起的困境,其中的關(guān)鍵就在于缺乏語言環(huán)境。” 相關(guān)業(yè)務(wù)負(fù)責(zé)人曾在發(fā)布會(huì)上稱“Hi Echo能為用戶帶來貼合實(shí)際的語境。”
作為國內(nèi)最早一批將大模型能力實(shí)現(xiàn)落地到教育場景的產(chǎn)品,除了虛擬人口語教練app,有道還將子曰教育大模型能力陸續(xù)落地到智能硬件、及詞典等App中。
周楓之前在三季度財(cái)報(bào)會(huì)表示,大模型落地初步初期獲得用戶積極反饋,并預(yù)告將盡快發(fā)布一系列基于“子曰”的創(chuàng)新產(chǎn)品及應(yīng)用。
據(jù)官方信息,上線兩個(gè)月來Hi Echo注冊用戶在幾十萬,這一次的更新又透露出有道在大模型落地上的哪些新可能?
01
新增口語定級,零基礎(chǔ)也能大膽開口?
過往國內(nèi)外曾有公司在探索“AI口語陪練”,只是彼時(shí)的AI并不真、也并不聰明。當(dāng)時(shí)的AI要靠標(biāo)簽得出答復(fù),對話也要框在限定的主題中,一旦學(xué)習(xí)者的新奇感消失,且沒有感受到明顯的效果,這類應(yīng)用的用戶留存一直面臨著巨大挑戰(zhàn)。
但生成式AI的學(xué)習(xí)能力卻是常學(xué)常新——這是機(jī)會(huì),也是壓力。
以同樣處于發(fā)展期的Call Annie和Paradot為例:Call Annie的用戶同樣可以直接與這個(gè)名為Annie的虛擬人進(jìn)行視頻,她的角色更接近助手;Paradot會(huì)記住用戶說的每一句話,喜歡什么、不喜歡什么,甚至?xí)聹y哪些東西可能會(huì)討用戶歡心……
網(wǎng)易有道CEO周楓曾對外解讀,市面上已經(jīng)出現(xiàn)了同類型產(chǎn)品,但“大家的切入點(diǎn)不同,有道垂直聚焦學(xué)習(xí)產(chǎn)品”。
沉浸的語言環(huán)境如何建立?
如何讓用戶大膽開口?
多知曾在Hi Echo上線第一時(shí)間體驗(yàn)了該產(chǎn)品,簡單來說,用戶只需要打一通電話即可實(shí)現(xiàn)口語練習(xí),電話的聊天內(nèi)容并沒有限制,可以選擇當(dāng)下最想聊的內(nèi)容自由發(fā)揮,也可以基于其內(nèi)置的多個(gè)場景進(jìn)行練習(xí)。
電話前,頁面上設(shè)計(jì)了兩種口語對練形式,一是Chat with Echo,用戶可以與虛擬人進(jìn)行自由英語對話;一是場景對話,系統(tǒng)內(nèi)置了興趣、考試話題、生活經(jīng)歷、社會(huì)話題等8種場景,同時(shí)還有最愛的電影、藝術(shù)和博物館、書籍和文學(xué)、娛樂和媒體等68個(gè)話題任由選擇。
這些話題基本覆蓋英語的日常用語。而除了具體的場景練習(xí),虛擬人老師的情感理解能力,也比想象中更加細(xì)膩。
距離官宣上線不到兩個(gè)月,此次Hi Echo在1.0版本基礎(chǔ)上也進(jìn)行了更加精細(xì)化的更新。
具體來看:
新增的“口語定級”能力,可以根據(jù)用戶的學(xué)習(xí)階段和英語水平,將其實(shí)際口語能力劃分為“小學(xué)、初中、高中、大學(xué)、工作中”五個(gè)階段以及初級、中級、高級三個(gè)等級。
據(jù)介紹,不同能力等級的用戶可以根據(jù)自己的需求和實(shí)際水平獲取相對應(yīng)的對話練習(xí),從單詞難度、句子長度到語法技巧,Hi Echo能夠提供差異化的對話語句。
這也意味著,沒有口語基礎(chǔ)的用戶,也能在Hi Echo上找到自己對應(yīng)的等級,避免啞巴英語——這也更符合差異化的用戶學(xué)習(xí)需求。
新版本的對話過程中,每句話都將被完整保留,在對話結(jié)束后系統(tǒng)會(huì)提供詳盡個(gè)性化口語分析報(bào)告。
除了此前所具備的發(fā)音及語法打分、潤色外,Hi Echo 2.0還提供音素級別的單詞發(fā)音指導(dǎo)。
無論英音還是美音,都能給予用戶發(fā)音糾正,使用戶對自己的薄弱環(huán)節(jié)和不足之處有更清晰的了解。
有意思的是,Hi Echo創(chuàng)新設(shè)置了具備標(biāo)準(zhǔn)MBTI人格模型系統(tǒng)的虛擬人口語教練。
本次升級版本中,除了用戶已熟知的北京姑娘Echo外,新增了英國紳士Daniel和中加混血Sherry兩個(gè)虛擬形象,他們有各自的人格特點(diǎn),用戶可以選擇自己喜歡的形象無限暢聊。
對話場景這個(gè)部分也有了一些新的變化,Hi Echo本次拓展至10個(gè)主題、88個(gè)子場景的對話方向,同時(shí)支持用戶自定義話題……
此次升級意味著有道對虛擬人口語教練的精細(xì)化設(shè)計(jì)在易用性、功能性、情感鏈接和創(chuàng)新性上再進(jìn)一步。
02
開口說,不是最終目的
就像是生成式大模型需要大量高質(zhì)量語料喂養(yǎng),虛擬人漫長成長的過渡期對于每個(gè)公司來說,都并不容易。
網(wǎng)易有道相關(guān)業(yè)務(wù)負(fù)責(zé)人曾向多知表示,做口語教練一直是有道團(tuán)隊(duì)的多年夢想。
聚焦口語教練的底層支持,第一來自于龐大的用戶群體對口語提升的需求;第二則是有道技術(shù)、數(shù)據(jù)、用戶的沉淀。
“這些用戶在口語學(xué)習(xí)上究竟有什么樣的需求,我們會(huì)比別的公司更了解”,該業(yè)務(wù)負(fù)責(zé)人補(bǔ)充。在有道看來,真正的口語教練已經(jīng)約等于口語老師的角色,要循循善誘、也要個(gè)性化、針對性輔助。
只讓用戶開口說英語,似乎并不是有道對這款產(chǎn)品的全部期待。
一切的選擇只取決于有道價(jià)值觀。
1、要有共情能力:Echo是一個(gè)有外語背景的24歲中國女性形象。區(qū)別于國外老師,有道認(rèn)為一個(gè)中國老師更知道中國的孩子在口語練習(xí)時(shí)會(huì)遇到什么問題、會(huì)需要哪些幫助。
2、要有親和力:有道做調(diào)研時(shí)發(fā)現(xiàn),一些孩子并不是那么喜歡與外教的互動(dòng),“有些外教口語很好、語音語調(diào)都很好,但是對孩子沒有那么多的耐心,孩子跑神說幾句話就煩了。”
“永遠(yuǎn)不會(huì)怪你、會(huì)在你身邊一直鼓勵(lì)你的口語老師,這才是有道想要的”,周楓說到。
3、科技感:Echo的生活背景最終脫離了日常生活,有道定義她是來自未來的老師。
4、內(nèi)容的安全感:無論是面對孩子還是成年人,與Echo的對話能說什么、不能說什么、什么會(huì)給對方帶來負(fù)面影響,這些都是有道一直在考量的問題。
要極小心地篩選數(shù)據(jù),要有完備的檢測機(jī)制,還要有可控的對話數(shù)。
5、流程極簡:Echo的界面并不是通用聊天界面,極簡界面的背景是有道認(rèn)為練口語這件事并不需要過多的功能與設(shè)計(jì),同時(shí)也更容易上手。
6、專業(yè):有道希望Echo在與用戶對話時(shí),什么話題都可以接住,隨時(shí)服務(wù);當(dāng)用戶無法繼續(xù)時(shí)能夠通過內(nèi)容幫助用戶再次調(diào)動(dòng)起來;有錯(cuò)誤的地方既要給鼓勵(lì)也要給具體修正方案。
“一位好的老師一定對學(xué)生有尊重、有引導(dǎo)、有鼓勵(lì)、有幫助。所以Echo要能在用戶悲傷時(shí)安慰陪伴,遇到難題時(shí)一起找到辦法,在無聊時(shí)一起開心”,周楓曾對多知解讀“這些就是我們和其他同類型產(chǎn)品的區(qū)別。”
多知了解到,目前虛擬人口語教練包含三項(xiàng)核心技術(shù),即語音識別能力、虛擬人驅(qū)動(dòng)技術(shù)和內(nèi)容生成及對話能力。
在教育領(lǐng)域,很早就有AI形式的口語練習(xí),但是預(yù)設(shè)好的場景,基本是劇本式的對話,比較一板一眼,不太符合真實(shí)的口語環(huán)境,不能很好地解決用戶練口語的需求,而大語言模型或許可以帶來開放式的對話,幫用戶練習(xí)實(shí)際的場景口語。
此外,以往的對話練習(xí)是單一形態(tài),而基于“子曰”模型打造的AI口語練習(xí)產(chǎn)品,用戶可以直接輸入語音或者文字,進(jìn)行多輪對話。
某種程度上看,這是更具個(gè)性化的一對一陪練。
Hi Echo目前也已經(jīng)正式推出獨(dú)立APP,連續(xù)包月68元/月,年度會(huì)員698元/年,連續(xù)包年498元/年,這個(gè)定價(jià)區(qū)別于真人口語教練也在性價(jià)比上給出了足夠的誠意。
03
首批通過備案后:“加速探索C端應(yīng)用”
11月初,多知了解到,有道旗下大模型首批通過了由國家七部委聯(lián)合公布的相關(guān)備案——作為首批通過備案的教育大模型,意味著有道在大模型方面的應(yīng)用產(chǎn)品將可對公眾開放。
教育垂直大模型通過備案,到底意味著什么?
一方面,通過備案的大模型將有機(jī)會(huì)直接面向公眾提供多元服務(wù),也有了推出更多面向C端用戶產(chǎn)品的能力;反之,也將有更多來自C端的自由、活躍用戶進(jìn)行體驗(yàn),甚至是B端與G端的具體解決方案需求。
教育垂直大模型通過備案的另一個(gè)可能性,在于參與者將更有精力與能力投入到各自競爭力的升級迭代,包括但不限于基座、數(shù)據(jù)、商業(yè)化、專業(yè)人才和場景落地等。
持證上崗才敢大展拳腳。
同時(shí),基于備案制度的要求,也讓大模型團(tuán)隊(duì)必須建立安全管理制度、完善內(nèi)容審核機(jī)制;通過公示關(guān)鍵信息等方式提高透明度增加外部了解;維護(hù)數(shù)據(jù)質(zhì)量、算法可靠性及隱私保護(hù)等,進(jìn)而隨時(shí)評估風(fēng)險(xiǎn)因素……
尤其是教育大模型的用戶大多為學(xué)生,對其合法權(quán)益的保護(hù)也更加必要。
此時(shí)再討論國產(chǎn)大模型如何以及何時(shí)完成商業(yè)閉環(huán),也更有意思。
周楓曾在9月于自己的公眾號推文中指出,“來自大模型的行業(yè)推動(dòng)很可能將持續(xù)多年,而且大機(jī)會(huì)將從基礎(chǔ)設(shè)施逐漸過渡到上層應(yīng)用;找到“大模型原生”的產(chǎn)品形態(tài)是關(guān)鍵”,同時(shí)強(qiáng)調(diào)“我們也需要思考哪些是’大模型原生’的應(yīng)用的特點(diǎn),才能在創(chuàng)新中把握先機(jī)。”
“至少有這樣6個(gè)領(lǐng)域的產(chǎn)品,都是可以有大模型原生的創(chuàng)新機(jī)會(huì)的。”
“ChatGPT這樣的超級入口,MidJourney這樣的垂直領(lǐng)域大App,有道詞典筆這樣的基于大模型的硬件,以及HuggingFace這樣云平臺(tái)和行業(yè)應(yīng)用,每個(gè)領(lǐng)域都有創(chuàng)新機(jī)會(huì)。”
“有道虛擬人口語教練Hi Echo的APP和小程序?qū)⒃谙轮苷缴暇€,這當(dāng)然也是“垂直大模型App”的一個(gè)案例。為了實(shí)現(xiàn)高質(zhì)量、場景化的聊天對話,以及高擬真度的虛擬人驅(qū)動(dòng),團(tuán)隊(duì)投入了大量精力。”
……
幾個(gè)月過去,現(xiàn)在再回看這幾段話,意義也多了不少。