小米將重點(diǎn)投入AI。

消息稱雷軍千萬(wàn)年薪招攬95后AI天才少女,大模型人才轉(zhuǎn)向場(chǎng)景應(yīng)用?

2024-12-30 13:24:29發(fā)布     來(lái)源:多知    作者:Penny  

  多知12月30消息,今日,“雷軍千萬(wàn)年薪招攬95后AI天才少女”沖上熱搜。據(jù)證券時(shí)報(bào)報(bào)道,小米創(chuàng)始人雷軍親自出手,以千萬(wàn)年薪招攬DeepSeek開(kāi)源大模型DeepSeek-V2的關(guān)鍵開(kāi)發(fā)者之一羅福莉,領(lǐng)導(dǎo)小米AI大模型團(tuán)隊(duì),羅福莉?qū)⒕吐氂谛∶譇I實(shí)驗(yàn)室。對(duì)此,小米暫未回應(yīng)。

  公開(kāi)資料顯示,羅福莉出生在四川小城一個(gè)普通家庭,本科畢業(yè)于北師大計(jì)算機(jī)專業(yè),后保研至北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所。碩士畢業(yè)后,她因是“ACL 8篇論文作者”火爆網(wǎng)絡(luò),隨后加入了阿里達(dá)摩院機(jī)器智能實(shí)驗(yàn)室。

  2022年,羅福莉離開(kāi)阿里達(dá)摩院,加入幻方量化(量化對(duì)沖基金公司)從事深度學(xué)習(xí)相關(guān)策略建模和算法研究。此后,羅福莉加入北京深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(旗下有DeepSeek大模型),擔(dān)任深度學(xué)習(xí)研究員,并參與了MoE大模型DeepSeek-V2的研發(fā)。

  今年5月,在DeepSeek-V2發(fā)布以后,羅福莉在知乎撰文,發(fā)表了對(duì)于DeepSeek-V2的看法。她表示,“單論DeepSeek-V2模型的中文水平,是真實(shí)處在國(guó)內(nèi)外閉源模型的第一梯隊(duì)”,“外加1元/百萬(wàn)輸入Tokens的價(jià)格,只有GPT4價(jià)格的1/100,性價(jià)比之王”。

  12月26日,Deepseek通過(guò)官方公眾號(hào)稱,全新系列模型DeepSeek-v3首個(gè)版本上線并同步開(kāi)源,該模型的多項(xiàng)評(píng)測(cè)成績(jī)超越了Qwen2.5-72B和Llama-3.1-405B等其他開(kāi)源模型,并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

  比如,在百科知識(shí)、長(zhǎng)文本、代碼、數(shù)學(xué)、中文能力上的表現(xiàn),超越其他模型,尤其是在數(shù)學(xué)上,在美國(guó)數(shù)學(xué)競(jìng)賽(AIME 2024, MATH)和全國(guó)高中數(shù)學(xué)聯(lián)賽(CNMO 2024)上,DeepSeek-V3 大幅超過(guò)了所有開(kāi)源閉源模型。

WechatIMG3.jpg

  同時(shí),通過(guò)算法和工程上的創(chuàng)新,DeepSeek-V3 的生成吐字速度從20 TPS大幅提高至 60 TPS,相比 V2.5 模型實(shí)現(xiàn)了3倍的提升。

  該模型的訓(xùn)練成本僅600萬(wàn)美元,成本降低10倍,資源運(yùn)用效率極高。

  相比一個(gè)大模型公司,小米則是有很多應(yīng)用終端,手機(jī)、汽車等。根據(jù)2024年Q3財(cái)報(bào)顯示,小米集團(tuán)的AIoT平臺(tái)已連接的IoT設(shè)備數(shù)超8.61億,同比增長(zhǎng)23.2%。

  雷軍親自挖人,意味著小米將重點(diǎn)投入AI。