消息稱雷軍千萬(wàn)年薪招攬95后AI天才少女，大模型人才轉(zhuǎn)向場(chǎng)景應(yīng)用？

2024-12-30 13:24:29發(fā)布來(lái)源：多知作者：Penny

　　多知12月30消息，今日，“雷軍千萬(wàn)年薪招攬95后AI天才少女”沖上熱搜。據(jù)證券時(shí)報(bào)報(bào)道，小米創(chuàng)始人雷軍親自出手，以千萬(wàn)年薪招攬DeepSeek開(kāi)源大模型DeepSeek-V2的關(guān)鍵開(kāi)發(fā)者之一羅福莉，領(lǐng)導(dǎo)小米AI大模型團(tuán)隊(duì)，羅福莉?qū)⒕吐氂谛∶譇I實(shí)驗(yàn)室。對(duì)此，小米暫未回應(yīng)。

　　公開(kāi)資料顯示，羅福莉出生在四川小城一個(gè)普通家庭，本科畢業(yè)于北師大計(jì)算機(jī)專業(yè)，后保研至北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所。碩士畢業(yè)后，她因是“ACL 8篇論文作者”火爆網(wǎng)絡(luò)，隨后加入了阿里達(dá)摩院機(jī)器智能實(shí)驗(yàn)室。

　　2022年，羅福莉離開(kāi)阿里達(dá)摩院，加入幻方量化(量化對(duì)沖基金公司)從事深度學(xué)習(xí)相關(guān)策略建模和算法研究。此后，羅福莉加入北京深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(旗下有DeepSeek大模型)，擔(dān)任深度學(xué)習(xí)研究員，并參與了MoE大模型DeepSeek-V2的研發(fā)。

　　今年5月，在DeepSeek-V2發(fā)布以后，羅福莉在知乎撰文，發(fā)表了對(duì)于DeepSeek-V2的看法。她表示，“單論DeepSeek-V2模型的中文水平，是真實(shí)處在國(guó)內(nèi)外閉源模型的第一梯隊(duì)”，“外加1元/百萬(wàn)輸入Tokens的價(jià)格，只有GPT4價(jià)格的1/100，性價(jià)比之王”。

　　12月26日，Deepseek通過(guò)官方公眾號(hào)稱，全新系列模型DeepSeek-v3首個(gè)版本上線并同步開(kāi)源，該模型的多項(xiàng)評(píng)測(cè)成績(jī)超越了Qwen2.5-72B和Llama-3.1-405B等其他開(kāi)源模型，并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

　　比如，在百科知識(shí)、長(zhǎng)文本、代碼、數(shù)學(xué)、中文能力上的表現(xiàn)，超越其他模型，尤其是在數(shù)學(xué)上，在美國(guó)數(shù)學(xué)競(jìng)賽(AIME 2024, MATH)和全國(guó)高中數(shù)學(xué)聯(lián)賽(CNMO 2024)上，DeepSeek-V3 大幅超過(guò)了所有開(kāi)源閉源模型。

　　同時(shí)，通過(guò)算法和工程上的創(chuàng)新，DeepSeek-V3 的生成吐字速度從20 TPS大幅提高至 60 TPS，相比 V2.5 模型實(shí)現(xiàn)了3倍的提升。

　　該模型的訓(xùn)練成本僅600萬(wàn)美元，成本降低10倍，資源運(yùn)用效率極高。

　　相比一個(gè)大模型公司，小米則是有很多應(yīng)用終端，手機(jī)、汽車等。根據(jù)2024年Q3財(cái)報(bào)顯示，小米集團(tuán)的AIoT平臺(tái)已連接的IoT設(shè)備數(shù)超8.61億，同比增長(zhǎng)23.2%。

　　雷軍親自挖人，意味著小米將重點(diǎn)投入AI。

商學(xué)院

Open Talk

消息稱雷軍千萬(wàn)年薪招攬95后AI天才少女，大模型人才轉(zhuǎn)向場(chǎng)景應(yīng)用？

相關(guān)閱讀

商學(xué)院

Open Talk

消息稱雷軍千萬(wàn)年薪招攬95后AI天才少女，大模型人才轉(zhuǎn)向場(chǎng)景應(yīng)用？

相關(guān)閱讀

消息稱雷軍千萬(wàn)年薪招攬95后AI天才少女，大模型人才轉(zhuǎn)向場(chǎng)景應(yīng)用？