“萬物皆可大模型”成為今年各個產(chǎn)業(yè)都逃不開的話題。
年初以來,能夠代寫論文、寫報告甚至寫新聞的ChatGPT,徹底引爆了社會各方對大模型的關(guān)注。在大眾紛紛擔(dān)心自己是否會被AI所取代時,自動駕駛產(chǎn)業(yè)已經(jīng)瞄準(zhǔn)大模型的商業(yè)價值,紛紛推出大模型。近日,理想汽車在理想家庭科技日發(fā)布會上宣布,理想采用大模型算法,自研MindGPT。多方吹捧的大模型,能否為自動駕駛產(chǎn)業(yè)帶來“第二春”?
01大模型成新寵
“自動駕駛技術(shù)正進(jìn)入以數(shù)據(jù)和知識雙驅(qū)動的多模態(tài)感知和認(rèn)知理解為代表的新階段。”中科院雄安創(chuàng)新研究院認(rèn)知智能實(shí)驗(yàn)室副主任黃武陵在接受《中國汽車報》記者采訪時表示,大語言模型(LLM)、跨模態(tài)大模型的出現(xiàn),為自動駕駛產(chǎn)業(yè)的發(fā)展帶來突破口。目前,行業(yè)對大模型的定義是只有在參數(shù)達(dá)到千億以上才能夠被稱為大模型。當(dāng)AI模型足夠大,經(jīng)過不斷地訓(xùn)練與學(xué)習(xí),就有可能實(shí)現(xiàn)智能化。因此,被看作能夠改變世界的大模型,成為自動駕駛的新希望。
在數(shù)據(jù)閉環(huán)和仿真環(huán)節(jié),大模型將賦能自動駕駛。商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示,在人工智能1.0時代,大量的人工標(biāo)注導(dǎo)致數(shù)據(jù)標(biāo)注時間長、成本高、挖掘難度大。但在人工智能2.0時代,基于大模型可以實(shí)現(xiàn)自動標(biāo)注,大大降低成本,可快速進(jìn)行優(yōu)化和迭代。另外,還可通過AIGC利用人工智能做內(nèi)容生成,模擬生成高度真實(shí)的場景,助力自動駕駛技術(shù)更好地進(jìn)行測試和優(yōu)化。“在大模型的輔助下,研發(fā)人員可以更多集中在關(guān)鍵算法及其提升體驗(yàn)上,集中打磨出更多滿足用戶體驗(yàn)、效果良好的產(chǎn)品。”黃武陵說道。
在王曉剛看來,多模態(tài)大模型的應(yīng)用還可實(shí)現(xiàn)從感知到?jīng)Q策、規(guī)劃、控制,端到端一體化的優(yōu)化。“當(dāng)前大多是感知輸出一個結(jié)果,基于規(guī)則做一些判斷,做出決策,然后再基于手動規(guī)則,實(shí)現(xiàn)規(guī)劃控制。”他認(rèn)為,未來大模型通過人工智能,可以實(shí)現(xiàn)端到端自動駕駛,提供更加可靠、像人開車一樣的體驗(yàn)。
目前行業(yè)普遍認(rèn)為,在技術(shù)方面,自動駕駛的底層架構(gòu)和大部分技術(shù)問題已得到解決,但由于現(xiàn)實(shí)道路場景復(fù)雜,即便現(xiàn)有技術(shù)已實(shí)現(xiàn)90%以上場景的自動駕駛,剩下10%的長尾場景始終無法覆蓋。黃武陵表示,隨著大模型在垂直領(lǐng)域的應(yīng)用逐漸成熟,成本可控且性能效率良好的前提下,大模型有望在環(huán)境認(rèn)知理解、智能決策等算法功能上得到應(yīng)用,將交通指示和駕駛經(jīng)驗(yàn)得以沉淀和應(yīng)用,緩解自動駕駛的“長尾問題”。
此外,大模型還能為自動駕駛“拋棄”高精地圖提供助力。要想實(shí)現(xiàn)高級別自動駕駛,高精度地圖不可或缺,但實(shí)時更新難度大、法規(guī)風(fēng)險高、成本極高三座“大山”始終難以跨越。擺脫高精地圖,成為不少企業(yè)的選擇。隨著大模型漸受關(guān)注,安信證券研報指出,AI大模型將助力企業(yè)實(shí)現(xiàn)“脫高精度地圖”。BEV感知算法通過將不同視角的攝像頭采集到的圖片統(tǒng)一轉(zhuǎn)換,相當(dāng)于車輛實(shí)時生成地圖,補(bǔ)足自動駕駛后續(xù)決策所需的道路拓?fù)湫畔ⅲ瑢?shí)現(xiàn)“脫圖”。
02產(chǎn)品接連發(fā)布
受到各界追捧的Chat-GPT,全稱為“Generative Pretrained Transformer”,其采用了谷歌在2017年提出的Transformer架構(gòu)。對于自動駕駛領(lǐng)域而言,Transformer架構(gòu)則并不陌生。早在2021年,特斯拉便將Transformer架構(gòu)引入自動駕駛領(lǐng)域,推出基于Transformer的BEV感知方案。這是大模型技術(shù)在自動駕駛行業(yè)的首次亮相,也成為特斯拉實(shí)現(xiàn)純視覺自動駕駛方案的關(guān)鍵所在。隨后,華為、商湯科技、百度Apollo等企業(yè)相繼在“BEV+Transformer”上展開布局。中信證券研報指出,隨著小鵬城市NGP、華為城區(qū)NCA功能、毫末智行城市NOH等城市領(lǐng)航功能的相繼落地,“BEV+Transformer”將引領(lǐng)自動駕駛感知范式。
如今,大模型絕不僅限于自動駕駛感知領(lǐng)域。今年4月,毫末智行正式發(fā)布自動駕駛生成式大模型DriveGPT“雪湖·海若”。據(jù)毫末智行首席執(zhí)行官顧維灝介紹,毫末DriveGPT通過引入駕駛數(shù)據(jù)建立RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù),對自動駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化,現(xiàn)階段主要用于解決自動駕駛的認(rèn)知決策問題,終極目標(biāo)是實(shí)現(xiàn)端到端自動駕駛。顧維灝表示,毫末DriveGPT將率先探索智能駕駛、駕駛場景識別、駕駛行為驗(yàn)證、困難場景脫困四大應(yīng)用場景,首先將開放智能駕駛、駕駛場景識別兩大應(yīng)用場景。
在自動駕駛領(lǐng)域,商湯科技開發(fā)了業(yè)界首個感知決策一體化的端到端自動駕駛解決方案——UniAD,在多目標(biāo)跟蹤準(zhǔn)確率、車道線預(yù)測準(zhǔn)確率等多項(xiàng)關(guān)鍵技術(shù)指標(biāo)上超越SOTA方法,整體系統(tǒng)和性能得到大幅提升。“未來,我們將利用多模態(tài)大模型,進(jìn)一步推動自動駕駛技術(shù)發(fā)展,如通過AIGC產(chǎn)生大量困難樣本,用環(huán)視感知的數(shù)據(jù),和多模態(tài)數(shù)據(jù)作為多模態(tài)大模型的輸入,實(shí)現(xiàn)感知和決策一體化的集成。”王曉剛表示。
于不久前正式亮相的Mind GPT,則是屬于理想汽車自研的認(rèn)知大模型。理想現(xiàn)已用1.3萬億個token為其進(jìn)行基座模型訓(xùn)練,讓其對話生成、語言理解、知識問答、邏輯推理等多項(xiàng)能力更安全、更準(zhǔn)確、更有邏輯。在Mind GPT的賦能下,理想汽車所搭載的智能語音助手——理想同學(xué),將像人一樣主動感知環(huán)境和他人、學(xué)習(xí)和思考、表達(dá)和互動。此外,在智能駕駛方面,理想AD Max 3.0可通過大模型AI算法,擺脫對高精地圖的依賴,實(shí)時感知、決策、規(guī)劃,識別準(zhǔn)確度相當(dāng)高。理想汽車智能駕駛副總裁郎咸朋表示:“在先進(jìn)的技術(shù)架構(gòu)和高效的訓(xùn)練平臺共同推動下,智能駕駛將會很快在家庭出行中實(shí)現(xiàn)大規(guī)模普及,AI駕駛員替代人類駕駛員的時代也不再遙遠(yuǎn)。”
此外,百度此前也表示,要將文心一言大模型應(yīng)用在自動駕駛上,以加深A(yù)pollo自動駕駛車輛對復(fù)雜城市路況的理解,進(jìn)一步提升其自動駕駛安全性和可靠性。斑馬智行則基于阿里巴巴通義千問大模型,打造了第三代汽車AI能力體系Banma Co-Pilot,構(gòu)建云端一體的全棧AI能力。日前,特斯拉首席執(zhí)行官馬斯克也表示,特斯拉會迎來自己的“ChatGPT時刻”,如果不是今年,肯定也不會遲于明年。一系列大模型產(chǎn)品的相繼發(fā)布,可見大模型在自動駕駛領(lǐng)域的“受寵”程度。
03商業(yè)化為時過早
“目前大模型究竟能給行業(yè)帶來什么影響尚不明晰,一些有能力、有資金的企業(yè)只是處于率先探索階段,商業(yè)化還為時過早。”全聯(lián)車商投資管理(北京)有限公司總裁曹鶴表示。
聚焦自動駕駛大模型,就此前發(fā)布的幾款大模型產(chǎn)品究竟含金量幾何,自動駕駛行業(yè)從業(yè)者呂兆波并沒有太大信心。他直言:“DriveGPT很不現(xiàn)實(shí),就算大企業(yè)投資研發(fā),沒有5~10年很難見到成果。這個大模型的概念很大,他們可能就是做一個簡單的數(shù)據(jù)融合。”
在呂兆波看來,大模型的優(yōu)點(diǎn)就是能夠?qū)⒏鹘M數(shù)據(jù)融合在一起,對外界環(huán)境的感知更為準(zhǔn)確。但是,要想使用大模型,首先就面臨部署問題。“如果大模型部署在云端,延遲問題很難解決;而如果部署在車端,如此龐大的數(shù)據(jù)量,延遲問題同樣不容小覷。”他說道。上不上車,成為困擾自動駕駛大模型商業(yè)化的首要問題。
對此,地平線創(chuàng)始人兼首席執(zhí)行官余凱在參加2023中國電動汽車百人會論壇時提出,車端的能量供給與散熱等現(xiàn)實(shí)困難,使得自動駕駛無法采用類似ChatGPT云端計算中那樣龐大的模型與計算量。顧維灝在接受媒體采訪時則表示,云端模型與車端模型的大小并不是完全等同的關(guān)系,目前DriveGPT參數(shù)規(guī)模已達(dá)1200億,但并不意味著把這1200億的參數(shù)大模型都上到車端,關(guān)鍵是留住核心能力。
此外,成本問題也是困擾之一。有業(yè)內(nèi)人士指出,自動駕駛系統(tǒng)如果要上大模型,至少要增加5萬美元成本,隨著大模型進(jìn)一步變大,成本或許會進(jìn)一步增加。對此,呂兆波稱,成本問題可通過云端部署解決,但前提是解決云端的延遲問題。即便是大模型自身,也認(rèn)為成本問題是一大重要考慮因素。在回答“如果將ChatGPT應(yīng)用到自動駕駛中,是否會成本過高?”這一問題時,Chat-GPT給出的回復(fù)表示,將ChatGPT應(yīng)用于自動駕駛系統(tǒng)會涉及一定的成本,主要涉及計算資源、數(shù)據(jù)收集和訓(xùn)練、模型開發(fā)和集成等幾方面。
04輿論火熱 資本冷靜
前有創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù)宣布籌辦全球化公司Project AI 2.0,后有搜狗創(chuàng)始人王小川投資5000萬美元成立百川智能。此前,紅杉中國種子基金也表示正在密切關(guān)注并開始布局AIGC領(lǐng)域的早期企業(yè)。一方是資本盛宴,另一方則略顯冷清。2022年以來,裁員、倒閉、關(guān)停的消息充斥自動駕駛產(chǎn)業(yè),不少人感嘆自動駕駛進(jìn)入“寒冬期”。雖說大模型在自動駕駛領(lǐng)域的應(yīng)用還為時過早,但不可否認(rèn),大模型的出現(xiàn)給正處于寒冬的自動駕駛產(chǎn)業(yè)重新燃起一把火。這波與大模型的聯(lián)動,能讓漸失熱度的自動駕駛重獲資本寵愛嗎?
中國生產(chǎn)力促進(jìn)中心協(xié)會常務(wù)副理事長兼秘書長、研究員王羽認(rèn)為,大模型的出現(xiàn)提供了一個群體性的突破機(jī)會,能夠提振行業(yè)信心,重塑單車智能技術(shù)路線。不過,在汽車行業(yè)分析師邵元駿看來,盡管資本對于大模型熱情高漲,但經(jīng)過多年發(fā)展,資本已經(jīng)認(rèn)清自動駕駛產(chǎn)業(yè)的發(fā)展現(xiàn)狀,不會在大模型萌芽期貿(mào)然進(jìn)行大手筆投資。
據(jù)王曉剛介紹,ChatGPT這樣的大模型僅訓(xùn)練一次便需要上千萬美元的成本投入,商湯科技近幾年在AI研發(fā)中已累計投入上百億元,僅臨港AIDC基礎(chǔ)設(shè)施投入便超50億元。動輒成百上千億元的投入,在自動駕駛領(lǐng)域卻很難短時間實(shí)現(xiàn)盈利。
“現(xiàn)在受經(jīng)濟(jì)形勢影響,整個資本行業(yè)本身就面臨寒冬,錢不多,出手就會更加謹(jǐn)慎。”邵元駿說。如此看來,炙手可熱的大模型似乎也難解當(dāng)前自動駕駛產(chǎn)業(yè)之寒。
原標(biāo)題:賦能自動駕駛,大模型是真旺還是虛火?