隨著DeepSeek以開源模式引發(fā)行業(yè)變革,開源迅速成為大模型主流開發(fā)模式。
4月2日,全球最大AI開源社區(qū)HuggingFace發(fā)布最新榜單,排在前三的開源大模型分別來自阿里通義千問、DeepSeek和群核科技,領先于英偉達、谷歌等公司。
榜單發(fā)布后,杭州再次引起業(yè)界矚目。因為杭州包攬了前三,成為全球少有的、同時擁有3個世界頂級開源模型的城市,因此被譽為“開源大模型之城”。
開源大模型對AI普及應用、構(gòu)建AI產(chǎn)業(yè)生態(tài)至關重要。目前,北京等地都在積極打造“全球開源之都”,而杭州走在了前列。杭州“開源大模型之城”是如何煉成的?
深厚土壤
在軟件領域,開源與閉源兩種路線之爭由來已久。此前大模型以閉源為主,硅谷已寫好了全球AI競賽的劇本:閉源模式,限制技術擴散;算力堆砌,抬高追趕壁壘;壟斷優(yōu)勢,獲得高昂商業(yè)利潤。
然而,DeepSeek反其道而行之,憑借開源和低成本兩大“法寶”改寫了游戲規(guī)則,一舉推動了全球AI產(chǎn)業(yè)的發(fā)展。
開源,簡單來說就是把軟件的源代碼公開,讓更多人參與進來,共同去創(chuàng)造一個復雜軟件。對于AI初創(chuàng)公司來說,開源可以輕松“站到巨人的肩膀上”。開源不僅讓高高在上的AI技術變得觸手可及,也讓整個AI產(chǎn)業(yè)生態(tài)發(fā)生翻天覆地的變化。
科技界有句名言:當你慷慨地打開技術大門后,全世界最聰明的大腦都會帶著禮物來敲門。開源模式更易吸引開發(fā)者與中小企業(yè)參與,激發(fā)上下游活力,加速產(chǎn)業(yè)成熟。
在DeepSeek之前,通義千問是國內(nèi)首個的開源大模型,2023年8月首次開源。目前,阿里已向全球開源200多款模型,千問衍生模型數(shù)量突破10萬,成為全球最大的開源模型族群。
群核科技作為“杭州六小龍”之一,主要從事空間智能領域,開發(fā)大模型相對較晚,但從發(fā)布、開源到登上榜單只用了不到10天的時間。可謂是厚積薄發(fā)、后來居上,在空間理解模型領域占據(jù)領先優(yōu)勢。
從行業(yè)層面看,阿里通義千問是“全能型選手”,底蘊深厚;DeepSeek是顛覆行業(yè)格局的“后起之秀”,創(chuàng)新能力強;而群核科技則是細分領域龍頭。三者不僅涵蓋了幾種代表性的大模型類型,而且都是世界級標桿。它們同時出現(xiàn)在同一個城市,確實罕見。
一切偶然的背后都有其必然性。杭州作為“互聯(lián)網(wǎng)之城”和世界著名旅游城市,程序員的開源精神和開放包容的城市精神,為“開源大模型之城”的誕生提供了深厚的土壤。
在互聯(lián)網(wǎng)時代,阿里秉持“讓天下沒有難做的生意”的使命,通過提供免費的產(chǎn)品和服務等方式,開創(chuàng)了全新的電商生態(tài)。開源理念一脈相承,阿里也提出,“讓天下沒有難做的AI應用”。阿里為杭州帶來了濃厚的程序員文化和開源精神。
杭州開放包容的城市精神與開源精神相得益彰。早在2002年,杭州就率先免費開放西湖景區(qū)。在決策前,杭州市政府算過一筆賬,得出了“241算法”,即游客多停留24小時,可以增加100億元綜合收入。這與開源里的流量思維和生態(tài)思維不謀而合。
在政策層面,杭州也展現(xiàn)出的高度包容性。早在AI發(fā)展初期,杭州就前瞻性地出臺一系列鼓勵創(chuàng)新的政策舉措。其中,在監(jiān)管上采取靈活且開明的態(tài)度,鼓勵企業(yè)大膽嘗試新技術、新模式,為AI創(chuàng)新營造了寬松的環(huán)境;在政府考核中設有“創(chuàng)新免責條款”,在支持新興技術時決策失誤可減免追責。
寬松的政策環(huán)境,讓企業(yè)能夠放下心中的顧慮,全身心地投入創(chuàng)新中,從而加快AI技術的研發(fā)和應用進程。
“黃金三角”
AI產(chǎn)業(yè)競爭不僅僅是技術之爭,更重要的是產(chǎn)業(yè)生態(tài)的競爭。杭州構(gòu)建了良好的產(chǎn)業(yè)生態(tài),主要包括算力基建、算法研發(fā)和場景落地,也被稱為AI生態(tài)建設“黃金三角”。
大模型的演進對算力需求爆發(fā)式增長。針對算力成本高企問題,杭州構(gòu)建“1+N”公共算力網(wǎng)絡,即1個超算中心+N個行業(yè)算力平臺,使企業(yè)單位算力成本下降40%。2023年創(chuàng)新推出“算力券”制度,降低中小企業(yè)成本。
算法研發(fā)層面,杭州擁有技術研發(fā)的多層次協(xié)同網(wǎng)絡。第一層是以浙江大學、之江實驗室為代表的原始創(chuàng)新層,每年輸出約1500項相關專利;第二層是阿里云、海康威視等技術轉(zhuǎn)化層,通過設立開放實驗室將技術模塊化;第三層是夢想小鎮(zhèn)、人工智能小鎮(zhèn)等載體構(gòu)成的產(chǎn)業(yè)孵化層,提供從原型測試到市場驗證的全鏈條服務。這種“學研用”深度耦合機制,使技術商業(yè)化周期縮短至9個月,較傳統(tǒng)模式效率提升3倍。
與北京、上海等傳統(tǒng)科創(chuàng)高地不同,杭州并非單純依賴頂尖高校或科研院所的原始創(chuàng)新積累,而是以企業(yè)為主體,實現(xiàn)企業(yè)主導的科技創(chuàng)新與產(chǎn)業(yè)創(chuàng)新深度融合,激發(fā)科技型企業(yè)內(nèi)生活力。
場景應用是大模型發(fā)展的主要驅(qū)動力。杭州將人工智能場景開放作為核心競爭力,按照“需求牽引—技術迭代—市場擴展”的實踐路徑,通過場景開放創(chuàng)造技術試驗場,為技術創(chuàng)新提供試驗平臺,推動技術不斷升級。
2023年,杭州“城市大腦”率先向大模型企業(yè)開放相關場景應用,形成“123N”的整體謀劃,即構(gòu)建1個“智能中樞”支撐大模型生產(chǎn)體系;從服務側(cè)應用、治理側(cè)工具入手,打造“城市大腦GPT”和“數(shù)智公務員”兩大數(shù)智產(chǎn)品;通過數(shù)據(jù)治理、模型訓練、賦能場景這3個步驟,為“三個一網(wǎng)”培育N個行業(yè)大模型,全面“提智賦能”亞運、交通、住房、旅游等領域場景。
低成本的算力基礎、多層次的算法研發(fā)體系和高效的場景應用,共同構(gòu)成了充滿活力的AI產(chǎn)業(yè)生態(tài)。數(shù)據(jù)顯示,杭州人工智能企業(yè)存活率達68%,高于全國平均水平23個百分點。
要保障AI生態(tài)系統(tǒng)的良好運行,組織能力也很重要。杭州構(gòu)建了“龍頭企業(yè)+隱形冠軍+初創(chuàng)企業(yè)”的共生網(wǎng)絡,通過產(chǎn)業(yè)聯(lián)盟實現(xiàn)產(chǎn)業(yè)組織與資源配置。
杭州市人工智能產(chǎn)業(yè)聯(lián)盟以海康威視、阿里云等龍頭企業(yè)為引領,發(fā)揮其在技術研發(fā)、市場拓展等方面的優(yōu)勢,搭建起人工智能技術的基礎架構(gòu)與平臺。在特定領域具備專長的企業(yè),憑借其在細分領域的技術積累,為聯(lián)盟提供多樣化的技術支持與補充。而初創(chuàng)企業(yè)則不斷帶來新的創(chuàng)意和想法,為整個生態(tài)注入了創(chuàng)新活力。
產(chǎn)業(yè)聯(lián)盟通過定期組織技術交流會議、項目對接會等活動,打破企業(yè)間的壁壘,實現(xiàn)資源的動態(tài)配置。從實踐來看,組織能力越強,越能發(fā)揮產(chǎn)業(yè)生態(tài)的效能。
“三圈合一”
開發(fā)大模型需要耗費巨大人力、物力和財力。世界頂級開源大模型之所以能在杭州不斷涌現(xiàn),關鍵在于其擁有活躍、充足的要素資源。
根據(jù)《人工智能頂尖人才數(shù)據(jù)圖鑒》,杭州的人工智能人才儲備僅次于北京,位列全國第二。杭州不僅AI人才多,而且特征明顯,即浙大系和阿里系。
阿里巴巴不僅讓杭州成為“電商之都”,更重要的是培養(yǎng)出10萬量級的數(shù)字經(jīng)濟人才,形成了“阿里系”創(chuàng)業(yè)軍團。作為全國最早研究AI的大學之一,浙江大學為杭州的AI生態(tài)提供了大量人才,“杭州六小龍”中有三家都出自浙大系。
2017年,浙江省、浙江大學和阿里巴巴共同舉辦的之江實驗室在杭州成立,聚焦人工智能和網(wǎng)絡信息兩大領域,高校與企業(yè)間的協(xié)同創(chuàng)新機制日趨成熟。浙大系和阿里系人才各有所長、相互交融,共同構(gòu)成了杭州活躍豐富的AI人才圈。
在AI三要素中,算力是基礎。杭州不僅在算力建設上處于領跑地位,更重要的是以算力為牽引構(gòu)建產(chǎn)學研生態(tài)圈,以生態(tài)圈思維運營智算中心。
2024年7月,杭州人工智能計算中心聯(lián)合昇騰AI,聯(lián)合發(fā)布了杭州人工智能計算中心生態(tài)鏈。作為杭州市首個公共服務性質(zhì)的AI智能算力平臺,杭州人工智能計算中心在解決單點算力需求之外,嘗試整合研、造、用、服等領域的研究機構(gòu)和企業(yè)單位,通過打造創(chuàng)新聯(lián)合體等形式,構(gòu)建從技術孵化到成果落地的完整閉環(huán)。
在具體操作中,以多模態(tài)大模型項目為例,杭州人工智能計算中心整合了“硬件—軟件—算法—應用”全鏈條資源。首先聯(lián)合浙江大學、之江實驗室及行業(yè)龍頭企業(yè),共建創(chuàng)新聯(lián)合體;其次,為項目對接了新能源、電網(wǎng)電力等亟待智能化升級的行業(yè)場景;同時,針對項目私有化部署、開發(fā)高效的優(yōu)勢,進一步挖掘面向數(shù)據(jù)安全、開發(fā)效率有明確需求的企業(yè),使創(chuàng)新成果與行業(yè)需求精準對接。
由此,上下游企業(yè)、高校、院所等創(chuàng)新要素得以深度集聚聯(lián)動,形成合力攻克關鍵技術,打造集基礎研究、試驗驗證、成果轉(zhuǎn)化于一體的AI產(chǎn)業(yè)生態(tài)圈。
大模型訓練成本高昂,動輒上億美金,資本對大模型行業(yè)發(fā)展尤為重要。
過去五年,杭州的AI領域累計融資額超過1200億元,位居全國第二,僅次于北京。杭州形成了多元開放的資本圈,其中既有實力雄厚的國有資本,也有阿里戰(zhàn)投、螞蟻金服這樣的產(chǎn)業(yè)資本,還有銀杏谷、元璟等專注硬科技的基金,更有大量從傳統(tǒng)制造業(yè)溢出的民間資本。
其中,國有資本的引導作用十分重要。杭州國有資本直投比例僅占12%,主要通過基金矩陣撬動社會資本。它的定位十分明確,致力于成為發(fā)掘優(yōu)秀項目的“伯樂”,以彌補市場信心的不足,而不是取代市場自身的決策。這種定位體現(xiàn)了杭州的城市態(tài)度:若偉大難以預測,便任其自由發(fā)展。
活躍豐富的AI人才圈、以算力為牽引的產(chǎn)業(yè)生態(tài)圈、多元開放的資本圈,當三圈合一、齊聚在同一個城市,“開源大模型之城”的誕生便水到渠成。
(作者單位:浙江財經(jīng)大學新經(jīng)濟研究中心)