從ChatGPT 熱看中美人工智能競爭
信息來源:人民郵電網 發布時間:2023-02-14
五天超過百萬用戶,兩個月獲得上億用戶。ChatGPT的火爆肉眼可見,這家企業的創始團隊包括馬斯克和彼得·蒂爾等知名大佬,后又背靠微軟,從微軟獲得了數據(比如微軟小冰采集的對話數據、GitHub的開源代碼庫)、算力(微軟Azure是全球前三的云服務供應商)、資本(微軟數輪入資,今年還將投資幾十億美元)等方面的支持,可以說整個硅谷的資源都被調動起來,聚焦到ChatGPT身上。
ChatGPT的優勢在于,它真的有用。之前很多人將人工智能叫做“人工智障”,因為其他人工智能往往答非所問,或者你要按照人工智能習慣的方式來提問才能得到正確答案,而ChatGPT具備上下文語義理解能力和邏輯能力。如果你問的問題它不懂,它就會向你反問,要你補充問題的信息,最終通過一問一答找到你真正需要的答案。
在文本創作、知識數據搜索和代碼書寫等方面,ChatGPT都有優于谷歌等搜索引擎的用戶體驗,這讓在AI領域深耕多年的谷歌艷羨不已,也讓其他一眾聊天機器人黯然失色。而一旦用戶數量達到一定規模,通過用戶的提問,在線數據將支持ChatGPT的數據訓練集進一步豐富。可以說ChatGPT讓AI達到了一個奇點,而這個奇點之后有可能是一輪AI領域的“宇宙大爆炸”。
國內也有很多聊天機器人,但與ChatGPT相比,還有很大差距,大多數國內的AI應用是一問一答,且有的時候還會誤解用戶的意思,讓人啼笑皆非。國內的AI應用為什么會和美國的ChatGPT拉開差距呢?原因是多方面的:
其一,從技術資本層面,最大的限制來自算力、算法、數據。
算力方面,我國的數據中心多面向軟件應用環境,比如游戲服務器外包,真正面向AI的算力非常少。而算力本身是非常昂貴的,模型越大,數據越多,數據訓練AI所要消耗的費用就越多,一次集中算力訓練需要幾百萬美元的算力,這是國內AI公司不能負擔的。
數據方面,國內數據的質量普遍不高,一方面是因為數據本身積累上的問題,比如小冰用免費AI對話來積累數據,比如GitHub這樣的代碼開源網站比較缺乏。另一方面是因為數據管理較為嚴格,部分數據文本需要審批才可以被人工智能企業使用,減慢了數據價值的釋放。
算法方面,我國AI 開發者有思維慣性,過度依賴開源內容,對大模型缺乏探索創新。當然,算力、算法、數據的問題有些也是資本問題,沒錢導致沒辦法進行大模型、大數據量的訓練,但有些也是管理需要改進的地方。
從管理層面來看,數據要素流通需要進一步打通,除此之外,我國對AIGC的內容創作也要采取開放包容的態度。AIGC作為技術黑箱,其產出的內容往往是不可知的,在輸出內容方面要允許AIGC犯錯誤,讓AI企業敢于在技術上突破。
綜上,一方面要堆錢,算力、算法、數據都要錢。另一方面要松綁,寬松的環境能夠讓技術的生長速度更快。但短期內比較迫切要做的事情是,如果ChatGPT 開源,當然皆大歡喜,國產勢必跟上;如果ChatGPT不開源,我們是否應該引進ChatGPT。引進ChatGPT的理由有兩個:一個是看ChatGPT是否在國內存在合規障礙,如果ChatGPT可行,國內企業就可以模仿;另一個是ChatG-PT對代碼寫作和內容創作來說是一種生產力工具,能夠提高內容產量。
當然,實事求是地說,中國人工智能近些年的進步是巨大的。當前,全球人工智能發展呈現出中美兩國引領、主要國家激烈競爭的總體格局。中國人工智能發展成效顯著,人工智能創新水平已經進入世界第一梯隊,與美國的差距進一步縮小。但中國在人工智能人才方面仍落后于美國,中國在人工智能基礎學科建設方面不及美國。
而ChatGPT熱潮席卷全球的背后,也帶給我們深刻的思考,人工智能作為未來產業、經濟社會發展中的一項變革性技術與關鍵性力量,深刻影響著未來世界的競爭格局。于中國而言,在人工智能發展領域并非到了“刀槍入庫,馬放南山”的階段,反而恰恰如中國的一句俗話所說:“逆水行舟,不進則退。”所以,我們在人工智能技術及產業發展上依然任重而道遠,須臾松懈不得。