国产一区二区三区在线-国产一区二区三区在线观看免费-国产一区二区三区在线观看视频-国产一区二区三区在线看-国产一区二区三区在线免费

網站首頁 | 網站地圖

每日推薦
首頁 > 理論前沿 > 深度原創(chuàng) > 正文

中國大模型密集開源的原因及可能影響

【摘要】當開源精神的火種點燃人工智能的星辰大海,人類正見證一場關乎數智文明重構的認知革命。開源大模型不僅重構技術生態(tài),而且重塑人類對知識生產與再分配的傳統(tǒng)認知范式。當前,這場看似溫和的大模型開源技術運動,實質上是中國科技企業(yè)突破算力封鎖、實現產業(yè)轉型與生態(tài)博弈共同催生的戰(zhàn)略選擇,其行動早已超越單純的技術選擇,直指知識與技術的壟斷與解放。

【關鍵詞】人工智能 大模型 DeepSeek 開源 重構 【中圖分類號】F49 【文獻標識碼】A

自2023年以來,阿里巴巴陸續(xù)開源通義千問(Qwen)系列大語言模型,其在自然語言理解、多模態(tài)交互等領域具有突破性表現,在多項基準測試中可與全球頂尖大模型并駕齊驅。中國人工智能企業(yè)深度求索(DeepSeek)在2024年底和2025年初,相繼推出DeepSeek-V3與DeepSeek-R1兩大開源引擎,前者以媲美GPT-4的千億參數架構構筑智能基座,后者則在復雜邏輯推理的深水區(qū)開辟新航道,將人機協(xié)作的邊界推向更遼闊的疆域。美國CNBC電視臺網站發(fā)表《中國對開源的擁抱顛覆了圍繞人工智能的傳統(tǒng)看法》一文,認為中國正在積極擁抱人工智能開源大模型,這一趨勢正推動中國人工智能技術的普及與創(chuàng)新。當前,中國已構建出參數規(guī)模橫跨十億至萬億級、應用場景覆蓋智能制造至數智政務的開源生態(tài)網絡。人工智能的技術演進與產業(yè)需求如齒輪般精密咬合,塑造出獨具特色的應用需求牽引創(chuàng)新、開源生態(tài)反哺產業(yè)的發(fā)展范式。中國工業(yè)和信息化部數據顯示,截至2024年6月,中國人工智能企業(yè)數量已超4500家,核心產業(yè)規(guī)模接近6000億元。中國軟件開發(fā)者數量已經突破940萬。中國已經成為全球開源參與者數量排名第二,增長速度最快的國家。①這不僅是數字的躍遷,更是創(chuàng)新范式的質變,中國運用開源開放與協(xié)同創(chuàng)新的群體智慧,從代碼倉庫到產業(yè)應用,從實驗室到生產線,在全球人工智能競爭中激起層層漣漪。

開源之潮:智能時代的星星之火

“開源”一詞最初來源于軟件領域,原指可以訪問源代碼且對程序的使用或發(fā)行沒有限制,所有人均可查看、修改和分發(fā)。截至2025年1月1日,全球97%的軟件開發(fā)者和99%的企業(yè)已使用開源軟件,70%以上的新立項軟件項目采用開源模式②?,F階段,受限于大模型的技術復雜性與海量數據規(guī)模,機構或公司往往難以實現全方位開源,這既源于商業(yè)機密保護與合規(guī)性審查的多重風險管控,又涉及完全開放可能導致的技術濫用隱患。然而,采用開源策略仍具顯著價值:通過展現技術透明度與研發(fā)規(guī)范性,開發(fā)者能夠有效提升品牌可信度,在爭取開發(fā)者社區(qū)支持與社會公眾認同等方面獲得實質性效益③。

通常來說,中小型創(chuàng)新主體構建的人工智能大模型,往往比大科技公司構建的大模型更傾向采用開源模式。這種差異,主要源于初創(chuàng)機構對協(xié)作創(chuàng)新的迫切需求,以及資源限制之間的動態(tài)平衡機制。國際上,在微軟、谷歌、蘋果和亞馬遜等構建的平臺與算力壁壘之中,中小型創(chuàng)新主體面臨雙重鎖定效應:上游受限于平臺與算力寡頭的定價權,下游被困于專利叢林形成的創(chuàng)新堰塞湖。開源運動正在創(chuàng)造技術民主和技術平權的新秩序,這種秩序呈現出量子化組織特征:既保持個體創(chuàng)新的離散性,又通過相互合作實現量子糾纏般的協(xié)同效應。開源不是烏托邦式的理想主義,而是以透明性換取信任、用協(xié)作對抗壟斷。開源運動正在創(chuàng)造技術史上的悖論:當每個局部創(chuàng)新都來自分布式個體,整體卻涌現出超越中心化系統(tǒng)的智慧。這種群體智慧暗示著知識生產的范式革命。中小型創(chuàng)新主體通過開源構建的量子化創(chuàng)新網絡,本質上是將技術創(chuàng)新從牛頓式的機械論與確定性范式,轉向量子力學的概率云范式——既保持個體自由,又通過協(xié)作實現相干疊加。

近年來,國際上許多聲稱開放或者開源的大模型,包括Meta公司的Llama和谷歌公司的Gemma,實際上只是“開放權重”,而非嚴格意義上的開源。這些大模型的許可證限制某些使用和修改權限,而且它們的訓練數據集并不公開。而DeepSeek的R1在“MIT許可證”下分發(fā),促進不受限制的使用、修改和分發(fā),包括用于商業(yè)目的,其從軟硬件的適配到應用推廣甚至產品宣傳,均由全球廠商和開發(fā)者共同完成,極大降低其生態(tài)建設成本。正是由于低建設成本和高性價比,反過來進一步幫助DeepSeek拓展大模型生態(tài),快速提升用戶數量和市場占有率。

破繭之因:技術困局與戰(zhàn)略突圍

芯片封鎖下的自主創(chuàng)新。面對美國芯片禁運,中國科技型企業(yè)以算法創(chuàng)新突破物質桎梏,將算力劣勢轉化為算法創(chuàng)新的催化劑。華為“盤古”大模型通過動態(tài)稀疏訓練技術,依托開源大模型提升算法效率,彌補硬件短板,在算力受限下實現大模型效率躍升,在8192張昇騰NPU構建的大規(guī)模集群上,將算力利用率提升至50%④。這種“以軟補硬”的智慧,宛如在芯片封鎖的鐵幕上鑿開一道微光。開源社區(qū)中涌現的量化壓縮工具鏈,讓千億參數大模型得以在國產昇騰等芯片上流暢運行,創(chuàng)造出屬于中國人工智能的“納米空間折疊術”。

閉源鐵幕中的開源星窗。當GPT-4、Claude 3等閉源大模型筑起技術鐵幕時,Qwen、DeepSeek等開源力量正以“否定性實踐”重構知識生產范式。這種閉源與開源的張力,既是資本邏輯與技術民主化的對抗,又是人類認知范式革命的先聲。閉源大模型通過算法封裝構建“技術壟斷的認知鴻溝”,形成知識權力不對稱的新型技術壟斷,持續(xù)強化大模型開發(fā)者與使用者之間的信息勢差,而DeepSeek-R1的開源,引發(fā)了全世界開源社區(qū)的“羊群效應”,開源社區(qū)通過持續(xù)的技術否定實現躍遷。雖然DeepSeek尚未公布訓練該大模型的全部成本,但據估算,其算力租賃費用約是Meta公司Llama 3.1 405B的十分之一,且使用DeepSeek-R1界面的用戶成本僅是ChatGPT o1的三十分之一⑤。這使更多的研究人員和企業(yè)能夠輕松使用人工智能技術服務,推動人工智能技術的普及和應用。

產業(yè)實踐上的技術涌現。我國擁有全球最完整的工業(yè)體系。截至2025年1月,全球“燈塔工廠”累計數量達到189家,中國有79家,占比約42%,總量位居世界首位⑥。工業(yè)和信息化部數據顯示,2023年,我國重點工業(yè)企業(yè)數字化研發(fā)設計工具普及率達到80.1%,關鍵工序數控化率達到62.9%⑦。2024年11月,《中國互聯網發(fā)展報告2024》顯示,全國已建成近萬家數字化車間和智能工廠。當全球最完整的工業(yè)體系、數智化程度日益遞增的行業(yè),與超11億網民的數字足跡,在960多萬平方公里土地上交織時,這片沃土正在演繹大模型技術革命的獨特路徑——數據、產業(yè)、場景、市場多維共振的技術涌現。當前,中國開源技術的“生態(tài)賦能”效應已覆蓋制造、金融、醫(yī)療等多個核心領域,形成“技術開源—場景迭代—生態(tài)培育—市場驗證”的良性循環(huán)。DeepSeek的涌現,充分說明創(chuàng)新要素與產業(yè)場景深度融合的必要性。

中國的產業(yè)實踐表明:中國開辟了產業(yè)需求牽引開源創(chuàng)新的獨特路徑,開源大模型技術不僅是工具創(chuàng)新,更是重構生產關系的系統(tǒng)性變革。這種轉變背后,是數智化轉型需求激增、數據要素市場化改革深化,以及產學研用協(xié)同機制創(chuàng)新等多重因素驅動的結果。

漣漪效應:技術哲學的范式重構

全球技術平權的精神遠征。開源模式打破巨頭或寡頭壟斷,通過社區(qū)協(xié)作優(yōu)化大模型性能,推動全球開發(fā)者參與技術迭代。開源大模型較閉源大模型的優(yōu)勢主要體現在三點⑧:更好地分配權力——開源大模型創(chuàng)造新的社會經濟權力形式,下游用戶可以更好地自行做出決策;更快地促進創(chuàng)新——開源大模型更加可定制,并提供更深的訪問權限,可更好地促進創(chuàng)新;更高的透明性——開源大模型相比閉源大模型,平均透明度更高,可幫助避免過去因數智技術不透明而造成的危害。

技術發(fā)展至今,人類對技術平權的追求已超越工具理性的邊界,演變?yōu)橐粓鲇绊懳拿靼l(fā)展的精神遠征。這場遠征的終極目標,不是算力的均分,而是認知主權的覺醒。DeepSeek作為中國人工智能開源大模型的代表之一,正在為工業(yè)智能賽道注入“超級大腦”,推動工業(yè)母機領域的顛覆性變革。這是對“技術主權”的深層詮釋,中國開源生態(tài)正用分布式算力破解“算力霸權”的困境。

知識生產范式的認知革命。開源與開放,無論是對技術創(chuàng)新還是科學發(fā)展而言,均尤為重要。傳統(tǒng)的閉源大模型構筑算力高墻,以億級美元研發(fā)投入與超萬卡集群的準入門檻,將人工智能創(chuàng)新禁錮于少數科技巨頭的認知堡壘,高校和中小型創(chuàng)新主體被拒之門外而“望卡興嘆”⑨。這種資本密集型的研發(fā)范式雖然推動技術迭代,卻在無形中加劇全球科技創(chuàng)新的“馬太效應”,也會在一定程度上阻礙知識和技術的傳播與創(chuàng)新。開源的浪潮沖破了上述知識或技術的壟斷,算法民主化讓思維的火種在技術平權中爆發(fā)鏈式反應:原本深藏于壟斷機構的認知框架,如今在分布式協(xié)作的開源社區(qū)里重組知識DNA;過往可控理想條件下,邊界清晰且線性遞進的研究范式,蛻變?yōu)榭稍陂_放復雜環(huán)境下實現交叉融合,且呈現出涌現式進化的認知生態(tài),每一次開源社區(qū)中的模型微調,均帶來技術迭代。知識生產的終極命題,從“占有真理”轉向“開放交互”。人工智能時代,開源社區(qū)中每天產生的數萬次模型微調請求,正在孵化出模型即服務(MaaS)的新模式——知識成為主體間協(xié)作生成的流動智慧。近期中國密集發(fā)布的開源大模型,其高性能和低成本吸引全球眾多科學家的關注,正驅動多學科交叉的新型科研范式涌現:來自高校和中小型創(chuàng)新主體的人工智能專家,依托其超參數優(yōu)化引擎突破技術邊界,數學家借助大模型解決組合優(yōu)化難題,認知科學家運用神經仿生框架構建腦網絡動態(tài)模型,多學科交叉的智慧激流共同解碼智能本質與思維本源的科學密碼⑩。我們正在進入一個人工智能重構科研流程的時代,而開源技術使得人工智能已成諸多領域的研究引擎?。

安全與創(chuàng)新的量子糾纏。‌開源基礎大模型在推動科技創(chuàng)新、促進競爭和權力分配方面具有巨大潛力,在透明度和可定制性上相比閉源大模型具有優(yōu)勢。而圍繞開源大模型的許多擔憂,源于大模型權重一旦發(fā)布,開發(fā)者便失去對其下游使用的控制,容易被部分用戶濫用。而閉源大模型則可以限制訪問,上述風險相對可控。因此,如何在推動開源大模型技術創(chuàng)新的同時,對開源大模型技術進行適度監(jiān)管,成為關鍵挑戰(zhàn)之一。不同的政策可能會對創(chuàng)新生態(tài)系統(tǒng)產生不均衡的影響,我們需要平衡開源與閉源大模型的發(fā)展,可以通過提高經濟效益、支持關鍵基礎模型發(fā)展,以及促進大模型的復用性、魯棒性和可控性,并通過持續(xù)廣泛的同行審核以及智能巡檢等手段,提高大模型的可靠性和安全性,從而在促進創(chuàng)新的同時有效管理其潛在的社會風險?。

燎原之勢:中國自主的技術星圖

中國開源大模型技術的發(fā)展,是在政策引導與市場機制的雙輪驅動下,探索出“政府搭臺、市場運作、科研攻堅”的中國特色發(fā)展路徑,既能保障技術自主可控,又可通過開源社區(qū)激活全球創(chuàng)新網絡,構建起有效的技術生態(tài)體系,為全球人工智能創(chuàng)新與發(fā)展提供中國方案。

中國可綜合運用政策、立法和技術等手段確立數據主權邊界,通過加快算力基礎設施建設降低創(chuàng)新門檻,用產學研協(xié)同機制打通技術轉化動脈。在數據確權方面,可通過智能合約、內容指紋或數字水印等方式,實現數據采集時的權屬聲明、數據流轉時的收益分配,以及數據銷毀時的連帶清除等。在算力基礎設施建設方面,可通過“東數西算”工程、智算中心布局及算力調度平臺優(yōu)化等,建設全國一體化算力網絡;通過發(fā)放“算力券”等優(yōu)惠政策,提供一定額度的免費或者低成本的算力支持,可顯著降低高校、科研院所以及中小型企業(yè)獲取高性能計算能力的成本,讓更多創(chuàng)新主體能夠深度參與技術創(chuàng)新。在產學研協(xié)同方面,在國家人工智能發(fā)展戰(zhàn)略的指導下,構建靈活的政府、企業(yè)與用戶多方協(xié)同機制,高校的基礎研究成果、科研院所的前沿技術突破與企業(yè)的市場化需求形成高效對接,通過建立聯合實驗室、技術轉移中心和產業(yè)創(chuàng)新聯盟等載體,快速縮短大模型的科研成果轉化周期,實現基座大模型的公共品屬性,與領域或行業(yè)大模型的商業(yè)化價值的辯證統(tǒng)一,形成“開放核心+增值服務”的可持續(xù)發(fā)展模式;通過產業(yè)鏈上下游的參數共享、算力眾包等方式,建立新型協(xié)同與協(xié)作關系,在模型輕量化、推理優(yōu)化等關鍵技術領域,催生差異化的技術路線,避免同質化內耗。這種協(xié)同機制不僅可以加速技術迭代,還能夠涌現出從基礎研究到商業(yè)落地的完整創(chuàng)新鏈條。

構建健康的開源大模型生態(tài)需要形成“政府—開發(fā)者—用戶”多方協(xié)同治理體系:政府監(jiān)管大模型的風險,核心開發(fā)者專注基礎架構創(chuàng)新,行業(yè)開發(fā)者深耕垂直場景應用,終端用戶提供反饋形成閉環(huán)。建議重點推進三個方向:防止開源大模型生態(tài)壟斷,構建多中心技術體系,避免單一主體掌控核心資源,建立開放標準和反壟斷機制,保障技術共享公平性;建立訓練數據的合規(guī)制度與數據要素市場化流通體系,解決網絡爬取數據合法性的問題,構建多級數據交易平臺;創(chuàng)新“中心化監(jiān)管+去中心化自治”并存機制,以及“監(jiān)管沙盒+熔斷機制”的敏捷治理模式,基于大模型規(guī)模和應用風險實施分級監(jiān)管,通過工具鏈矩陣降低技術門檻,平衡創(chuàng)新自由度與系統(tǒng)穩(wěn)定性,在保障創(chuàng)新自由度的同時,形成風險傳導的阻尼系統(tǒng),有效調和創(chuàng)新活力與秩序穩(wěn)定間的矛盾?,最終形成政府引導、社區(qū)自治、法律保障的多維治理體系。

在開源供應鏈自主可控方面,中國需構建兼顧內外的協(xié)同發(fā)展體系:對內依托本土開源生態(tài),打造“代碼托管—合規(guī)審查—安全驗證”全鏈條治理機制,強化核心技術的自主創(chuàng)新能力;對外深度參與國際標準制定,建立技術斷供預警與應對機制。針對算力瓶頸,重點攻關碎片化訓練、異構計算適配等關鍵技術,構建區(qū)塊鏈賦能的聯邦式算力共享平臺,打造“硬基建+軟服務”,以及“綠色算力+高效算法”的新型數字底座,研發(fā)低功耗芯片架構和節(jié)能訓練技術,實現國產芯片與大模型的深度協(xié)同優(yōu)化。努力實現新一代高性能計算技術突破,建立智能算力網絡,提升資源利用效率。在安全防護方面,需防范數據投毒(即攻擊者在大模型的訓練數據中故意注入惡意樣本,以誘導大模型學習錯誤模式并產生有害輸出的攻擊行為‌)等新型威脅,通過構建全生命周期溯源體系和形式化驗證工具,形成“預防—檢測—響應”的主動防御閉環(huán),確保開源大模型的自主可控發(fā)展。

從芯片禁運下的技術抗爭,到開源社區(qū)中的認知重構,從芯片架構的底層適配,到應用生態(tài)的枝繁葉茂,全球開發(fā)者的智慧在無界協(xié)作中結晶成價值網絡。通過開源治理、安全防護和軟硬件協(xié)同等方面的持續(xù)突破,構建中國特色的技術星圖,以實現從“追隨者”到“人類命運共同體”的跨越。這場開源運動已不僅是單純的技術選擇,也是一場關于創(chuàng)新范式的社會實驗。

(作者為中國科學院自動化研究所多模態(tài)人工智能系統(tǒng)全國重點實驗室研究員、博導,中國科學院大學人工智能學院崗位教授、博導)

【注:本文系國家杰出青年科學基金項目(項目編號:72225011)、國家自然科學基金重點項目(項目編號:72434005)以及國家自然科學基金專項項目(項目編號:L242400108)的階段性成果】

【注釋】

①高喬:《中國人工智能創(chuàng)新何以令海外驚嘆(環(huán)球熱點)》,《人民日報海外版》,2025年2月15日。

②黃鑫:《開源生態(tài)加速培育壯大》,《經濟日報》,2025年1月1日。

③Gibney, E., Not all 'open source' AI models are actually open: here's a ranking. Nature, 2024.

④https://github.com/pangu-tech/pangu-ultra/blob/main/pangu-ultra-report.pdf

⑤Gibney, E., China’s cheap, open AI model DeepSeek thrills scientists. Nature, 2025. 638(8049): p. 13-14.

⑥劉向東:《我國“燈塔工廠”的發(fā)展格局與全球價值鏈塑造》,《人民論壇》,2025年第8期,第52-56頁。

⑦康義:《制造業(yè)向好發(fā)展 夯實實體經濟根基》,《新型工業(yè)化》,2025年第1期,第22-29頁。

⑧?Bommasani, R., et al., Considerations for governing open foundation models. Science, 2024. 386(6718): p. 151-153.

⑨Ahmed, N., M. Wahed, and N.C. Thompson, The growing influence of industry in AI research. Science, 2023. 379(6635): p. 884-886.

⑩Gibney, E., Scientists flock to DeepSeek: how they’re using the blockbuster AI model. Nature, 2025.

?Maffulli, S., ‘Open source’AI isn’t truly open—here’s how researchers can reclaim the term. Nature, 2025. 640(8057): p. 9.

?Spirling, A., Why open-source generative AI models are an ethical way forward for science. Nature, 2023. 616(7957): p. 413.

責編/謝帥 美編/楊玲玲

聲明:本文為人民論壇雜志社原創(chuàng)內容,任何單位或個人轉載請回復本微信號獲得授權,轉載時務必標明來源及作者,否則追究法律責任。

[責任編輯:賈娜]
主站蜘蛛池模板: 自拍视频国产 | 色偷偷综合网 | 毛茸茸年轻成熟亚洲人 | 91天堂亚洲精品一区 | 国产精品视频无圣光一区 | 91破解版在线 | 亚洲 | 国产福利91 | 最新黄色地址 | 国内精品视频一区二区三区 | 国产福利一区视频 | 亚洲精品久久久久久久网站 | 好爽快一点视频在线观看 | 黄在线视频播放免费网站 | 又爽又黄又无遮挡的视频美女软件 | 爽妇综合网 | 色综合久久夜色精品国产 | 噜噜噜噜精品视频在线观看 | www看片| 免费黄色在线观看视频 | 国产婷婷色综合成人精品 | 免费国产zzzwww色 | 伊人久久精品线影院 | 可以看黄色的网址 | 欧美成人爽毛片在线视频 | 中文字幕一区二区精品区 | 大片免费播放 | 黄色免费片 | 日本美女a级片 | 在线二区人妖系列 | 国产在线ts人妖免费视频 | vr专区日韩精品中文字幕 | 国产精品第2页 | 久久成人国产精品二三区 | 国产福利精品在线 | 免费一级毛片免费播放 | 亚洲欧美国产日产综合不卡 | 国产综合久久久久影院 | 国内色视频| a级毛片免费播放 | 99毛片 | 国产永久免费高清动作片www |