林遠東向多知網展示了其中的一個即將完成的項目,可以看出,人機交互的一些想法已經成型。他表示,馳聲現在也在做這樣的解決方案,通過與教育機構的提供的內容相結合,探索更多技術與教育碰撞之后的可能性。

馳聲科技林遠東:評測將推動語言培訓將走向人機交互

2015-03-30 08:21:47發(fā)布     來源:多知網    作者:初驪禹  

  多知網3月30日消息,無論是不是再教育行業(yè),你一定聽說過這些名字:新東方、環(huán)球雅思、外研社、51Talk……但“馳聲科技”這個名字,對大多數人來說,還是陌生的。其實,馳聲科技,是站在這些知名公司背后,為他們提供語音評測技術的公司。有了語音評測技術,學生對著電腦說英語,并得到相應分數的場景才能得以實現。

  多知網采訪了馳聲科技CEO林遠東,他闡述了語音評測技術的應用及未來發(fā)展方向。

   一個工科生的教育夢想——基于教育的語言技術公司

  其實,從介紹上看,馳聲科技是一個年輕的公司,2014年5月成立,公司的前身是思必馳口語事業(yè)部。

  最初,在劍橋教書的時候,林遠東做了一個叫做Speachi的口語作業(yè)系統(tǒng),這個是針對發(fā)音系統(tǒng)評測和與學生互動的軟件,思必馳來源于就是Speachi的發(fā)音。后來,演變到Audio course plus,再到后來的AI-Chinese,這是林遠東想的是能夠幫助老師在教育上做一些事情,不僅可以降低老師的工作量,同時,也能夠提高教學的效率。

  那時的林遠東和他的團隊在推廣上的思路類似現在的一起作業(yè)網,主要是想通過和學校的合作,將產品推廣鋪開。但是,那時他們經歷了一個艱難的長期過程。因為針對學校的銷售通常周期很長,加上學校使用和等學校預算到位的時間,已經過去了一、兩年。同時,他們發(fā)現,在對外漢語這個市場上,英國只有50個學校在開這個課,市場并沒有想象中大。

  到2010年,公司戰(zhàn)略調整,林遠東決定專注做擅長的語音評測技術,因為做產品涉及的面比較廣,不僅有內容還要有市場營銷,使得公司對于語音評測技術本身關注不足。至此,思必馳確定定位是要做語音技術公司。

  之后,思必馳賣掉對外漢語的部分,轉向國內做語音評測技術的授權,不再直接做產品,而是希望To C的公司做內容,和英語聽說方面的事情。

  2011年,思必馳正式轉向國內,并靠新東方的一單,敲開語音評測技術大門,但其中經歷的過程,卻并不輕松。

  在林遠東帶著他的團隊轉向國內的時候,國內已經有比較成熟公司的先入為主,林遠東希望通過搶占山頭,和新東方這樣的知名公司的合作,進而以和合作案例,去獲取更多公司的訂單。

  當時,新東方在線有一個叫口語風暴的頻道,已經在和與馳聲業(yè)務類似的思昂教育合作。幾輪接觸下來,新東方在線方面不愿意放棄已有的成熟合作伙伴選擇馳聲科技的技術。

  林遠東想了一個辦法,建議新東方在線開始另一個欄目的籌劃。最終,馳聲科技靠“無插件解決方案”勝過了當時的思昂教育,“其實,‘無插件解決方案’聽起來挺玄乎,其實就是基于當時瀏覽器上的flash插件集成了語音評測技術,最終實現不需要插件就可以做語音的評測。”林遠東坦言。

  在一個月趕工后,馳聲科技與新東方的合作項目上線,并取得了不錯的反響。

  對于2011年,林遠東表示對每一個項目都印象頗深,對于馳聲來說,2011年是破局的一年。這一年,馳聲共完成了15項合作,合作方涵蓋新東方、環(huán)球雅思、外研社、雅信達、海云天等。這些公司都是在各自領域里,做的比較領先的公司。

  同年,馳聲獲得了清華啟迪和聯想的投資。

  后來,2012和2013年,馳聲均實現了三倍的增長,2014年也實現了超過兩倍的增長。林遠東介紹說,現在市場上每10個用到語音評測技術的應用,就有4個使用了馳聲的技術。2014年,一天有1000萬人次在使用馳聲的語音評測技術,總用戶數量接近2000萬。

  林遠東坦言,公司發(fā)展過程中,一共有兩次,他面臨是否要只做教育相關語音評測技術的選擇,選擇的結果是,第一次,他選擇在思必馳建立口語事業(yè)部,并主導了所有項目的推進。第二次,他選擇將思必馳交給合伙人,將馳聲剝離出來,并繼續(xù)帶領馳聲做教育領域的語音評測技術公司。

   語音評測技術到底是什么?

  說到語音評測技術,林遠東打開了話匣子??梢愿杏X到,他對技術和教育這兩方面的問題,格外感興趣,神情就像足球運動員馬上就要破門得分般興奮。他結合馳聲科技的發(fā)展,向多知網解釋了語音評測技術的四個發(fā)展階段??梢钥闯?,這些階段與馳聲的發(fā)展是緊密相連的。

  第一個階段是對語音層面的評測。“這就好比有人說‘你好’,計算機原來并不知道漢語的‘你好’要怎么說,所以需要教給計算機‘你好’這個詞的發(fā)音是怎樣的。收集了足夠多各種人說“你好”的語料后,計算機會識別出那些和‘你好’這個發(fā)音無關的發(fā)音,從而鎖定‘你好’這個詞本身的發(fā)音,而剔除掉由于說話者的年齡、性別等產生的發(fā)音音色、聲音大小等因素的差異”林遠東說。

  第二個階段是半開放的語音評測。也就相當于是選擇題。主要圍繞口語表達能力分為三個部分,這三個部分分別是表意、表達法和發(fā)音。同樣基于大量語料,通過這三個維度的評測,計算機不僅可以判斷學生在發(fā)音上是否準確、還能夠在句子意思和表達是否正確方面給出評測。

  第三個階段就是表達能力評估。在這一階段,語音評測技術可以對用戶自由表達的的所有語義進行評分。在這一點上,各家公司的思路是不一樣的。

  有一種思路是,先用語音識別的技術將語音轉換為文字,然后用作文批改的思路去對這段文字打分。有一部分公司現在也在用這樣的思路,但是在具體實施的過程中,這樣的思路卻是有問題的。因為這個過程一共包含兩步,假設第一步的識別率是30%-40%,第二步的批改正確率是50%—60%,這兩者相乘后,結果只能達到10%多一點。

  而馳聲的思路,是利用語音評測技術直接打分。林遠東表示,對于這種主觀題的評分,即使是老師評分,他對于同一份試卷兩次不同的打分都是有差異的。在一次大規(guī)模的實驗中,將馳聲的數據與人的數據對比,馳聲的評分容差一致度與PS相關系數均超過老師。這兩項因素也是判定一個評測是否有效的重要指標。

   語音評測技術還會有哪些發(fā)展?

  林遠東認為,現在教育市場中普遍采用的是第一階段的技術,還僅僅停留在語音評測的技術上,主要以作業(yè)評測為主,現在市面上的一起作業(yè)、口語100,基本上都是這個思路。但是他認為,接下來的教育還有很大的發(fā)展的空間。

  在第一代評測技術應用的基礎上,可以延伸至語音的糾錯和指導反饋。當語料庫的數據足夠大了以后,可以知道學生在某個單詞或者某個句子中,都會犯什么樣的錯誤,進而為學生推送相應的知識點。

  之后,知識的傳遞和技能的習得將變的非常廉價,重要的是主觀反饋的閉環(huán)。未來,老師將不再主要承擔傳遞知識和教授技能的任務。隨著,主觀評估的可觀化和標準化,無論是知識的傳遞還是技能的習得,可以更多地通過人機交互來實現。

  林遠東認為,之后學生的學習過程,會集中在大數據挖掘和學習形式模式識別上,在考試和學習過程中,對學生的行為進行分析,并由老師最終對他們進行指導。

  現在,馳聲也在探索第四代語音技術,并在今年會有一些成果出來。同時,馳聲也嘗試做了一些教育的解決方案。馳聲科技有一個研究小組,負責設法實現各種教育的想法,這些想法很多來自林遠東本人,另外還有一些教育行業(yè)內的人士,負責提供想法,這個小組,則負責實現。

  林遠東向多知網展示了其中的一個即將完成的項目,可以看出,人機交互的一些想法已經成型。他表示,馳聲現在也在做這樣的解決方案,通過與教育機構的提供的內容相結合,探索更多技術與教育碰撞之后的可能性。(多知網 初驪禹)