AI音頻的價(jià)值被持續(xù)挖掘。

谷歌NotebookLM帶火AI播客,人人可學(xué)口語、聽課本內(nèi)容

2024-12-04 23:23:24發(fā)布     來源:多知    作者:王上  

  來源|多知

  作者|王上

  12月3日,谷歌旗下最火爆得大模型產(chǎn)品NotebookLM團(tuán)隊(duì)負(fù)責(zé)人宣布離職創(chuàng)業(yè)的消息引發(fā)關(guān)注。而其背后的AI播客領(lǐng)域正在持續(xù)走紅。

  NotebookLM原本是AI云筆記軟件,讓其出圈的是其今年10月推出的AI播客功能,僅需一個(gè)鏈接或文檔,它幾分鐘就能轉(zhuǎn)成像說相聲一樣的男女英語對談,俗稱“AI播客”。AI大佬Andrej Karpathy曾稱贊NotebookLM“點(diǎn)亮了LLM的新交互范式”。

  在很多網(wǎng)友看來,“NotebookLM是一款非常適合學(xué)習(xí)的AI應(yīng)用。”

  

  到現(xiàn)在,根據(jù)NotebookLM團(tuán)隊(duì)負(fù)責(zé)人Raiza Martin透露,NotebookLM已經(jīng)有數(shù)百萬用戶。

  雖然NotebookLM團(tuán)隊(duì)離職創(chuàng)業(yè),但是,NotebookLM這款產(chǎn)品將繼續(xù)在谷歌發(fā)揮作用。根據(jù)techradar報(bào)道,NotebookLM即將被集成到手機(jī)中的谷歌大模型Gemini中。

  與此同時(shí),AI播客越來越火,語音 AI 初創(chuàng)公司ElevenLabs近日推出了一項(xiàng)類似于NotebookLM的AI播客功能;在中國也有一款類似應(yīng)用,名為“PodLM”,可以將URL、文本或文檔轉(zhuǎn)化為中文播客。

  可以看到,在文生文、文生圖之后,AI音頻領(lǐng)域開始火爆,而這將極大方便內(nèi)容創(chuàng)作者、營銷人員和教育工作者等。對于傳統(tǒng)音頻類的平臺來說,機(jī)遇與挑戰(zhàn)并存。

  對教育領(lǐng)域而言,AI教育播客可以支持多樣化的學(xué)習(xí)風(fēng)格并提高學(xué)習(xí)效率;多語言 AI 播客將是語言習(xí)得和練習(xí)的新方法;還可以把課本上的內(nèi)容提煉成播客給孩子做熏聽。

  

  

  

  01

  AI音頻的價(jià)值被持續(xù)挖掘

  12月3日,NotebookLM團(tuán)隊(duì)負(fù)責(zé)人Raiza Martin自爆將離職引發(fā)熱議,這背后則是對AI音頻領(lǐng)域的關(guān)注。

  Raiza Martin在自己的社交媒體上發(fā)布:

  “在谷歌干了 5.5 年,今天是我的 Last day。領(lǐng)導(dǎo)見證 NotebookLM 從一個(gè)想法,演變?yōu)榉?wù)數(shù)百萬人的產(chǎn)品,這是令人一生難忘的經(jīng)歷。

  而最棒的一點(diǎn)是,我在戰(zhàn)壕中找到了創(chuàng)業(yè)旅途上的聯(lián)合創(chuàng)始人們。”

  

  和Raiza Martin一起離職創(chuàng)業(yè)的還有 NotebookLM 設(shè)計(jì)師 Jason Spielman和核心工程師 Stephen Hughes。

  Raiza Martin新的創(chuàng)業(yè)項(xiàng)目還未揭曉,但根據(jù)她回復(fù)的信息看到,依然是大模型相關(guān)方向。

  NotebookLM于2023年7月推出,最初是一款A(yù)I云筆記軟件,基于用戶上傳的文檔內(nèi)容(包括Google文檔、幻燈片、PDF、文本文件、網(wǎng)頁鏈接等),可以生成長文本摘要、多語言會話、提綱、常見問題解答、學(xué)習(xí)指南等內(nèi)容。

  NotebookLM原本在AI筆記方面比較平淡,在今年10月推出AI播客功能后大火,用它可以對論文、書籍、故事等轉(zhuǎn)化成AI短音頻。

  AI音頻的價(jià)值正在被持續(xù)挖掘。

  曾在特斯拉、OpenAI任職,現(xiàn)在正創(chuàng)辦AI原生學(xué)校的AI大神Andrej Karpathy 曾這樣總結(jié):NotebookLM 消除了人們享用大模型的兩大障礙。

  第一,聊天有門檻。跟 Chatbot 聊天還得掌握一些技巧,不停地提問、追問。

  有了 NotebookLM,自動生成的播客中,自然會有一方替你扮演提問、引導(dǎo)的角色,用戶只要負(fù)責(zé)聽就可以了。

  第二,閱讀不是件容易的事情。聽播客比看文字輕松多了。

  可以說,NotebookLM是ChatGPT之外的另一種AI范式。

  02

  人人可以做AI播客的時(shí)代來了

  當(dāng)前,做AI音頻的企業(yè)也多了起來,可以說,人人可以做AI播客的時(shí)代來了。

  初創(chuàng)公司ElevenLabs被視為NotebookLM最大的對手。

  一周前,AI初創(chuàng)公司ElevenLabs推出了一項(xiàng)類似于NotebookLM的功能,可讓用戶上傳不同類型的內(nèi)容來創(chuàng)建播客。

  該功能名為 GenFM,可在該公司的 ElevenLabs Reader iOS 應(yīng)用程序中使用。目前,GenFM 支持 32 種語言,包括英語、印地語、葡萄牙語、中文、西班牙語、法語、德語、日語等。

  要使用 GenFM,用戶首先要上傳 YouTube 視頻、文本或文檔。然后,可以應(yīng)用自動挑選兩個(gè)聲音來創(chuàng)建播客。該公司指出,有十幾種聲音可供選擇。

  值得注意的是,當(dāng)應(yīng)用程序準(zhǔn)備GenFM生成的播客時(shí),用戶還可以添加一些“嗯”和“啊”等語氣詞,甚至可以添加笑聲和呼吸等元素,強(qiáng)調(diào)人類真實(shí)對話的狀態(tài)。

  

  ElevenLabs 成立于2022年,核心團(tuán)隊(duì)主要包括來自谷歌、微軟、亞馬遜等知名科技公司的前員工,他們在人工智能領(lǐng)域具有深厚的專業(yè)知識和實(shí)踐經(jīng)驗(yàn)。公司目前擁有約40名遠(yuǎn)程辦公員工,分布在全球各地,并計(jì)劃到2025年底將團(tuán)隊(duì)擴(kuò)大至100人。

  2024年1月,ElevenLabs在最新一輪融資中成功籌集了8000萬美元,使其估值急速飆升至11億美元,正式躋身獨(dú)角獸行列,并入選福布斯AI 50強(qiáng)。ElevenLab得投資方包括Andreessen Horowitz、Nat Friedman、Daniel Gross共、紅杉資本、Smash Capital、SV Angel、BroadLight Capital以及Credo Ventures等。

  在中國,也有一款A(yù)I播客生成平臺——PodLM.ai,它能夠?qū)⑽谋?、文檔或網(wǎng)址內(nèi)容轉(zhuǎn)換為播客音頻。它官網(wǎng)上說是“NotebookLM的替代品”,據(jù)了解,這是由獨(dú)立開發(fā)者idoubi開發(fā)的。目前還在比較早期的階段,使用上還不算流暢,但優(yōu)點(diǎn)在于支持中文。

  

  一個(gè)有關(guān)“聽”的新領(lǐng)域被打開了。