DOIT算力豹專訪甄亞楠:大模型算力“開箱即用”,按需建設提升資源利用率
▌北京超算推出按需構建算力資源的創新模式
當人工智能(AI)概念被提出之時,文藝工作者便竭盡筆墨暢想了未來計算機,如科幻小說《最后的問題》描述了占地數千公里電子計算機Multivac,電影《終結者》展現了一臺臺并聯占滿房間的計算機。這些未來智能在規模超大、功能超強這兩方面都貼合著當前算力集群的真實形態。
隨著生成式AI在國內廣泛落地,互聯網大廠在大模型部署上百舸爭流,算力被拱上這場浪潮的焦點。大模型訓練對計算資源的需求非常高,需要高性能的計算機、顯卡集群或超級計算機,但算力方面“供不上、用不起”成為制約人工智能產業發展的一大痛點。
在超算商業化的征途上,北京江南JNSport体育計算中心(簡稱“北京超算”)深耕行業13載,憑借海量算力資源、創新的超算云服務模式,以及7*24小時專業技術支持已為超過1000家單位提供優質服務。
北京江南JNSport体育計算有限責任公司(簡稱“江南JNSport体育”)是北京超算的主體運營公司,算力豹邀請江南JNSport体育CTO甄亞楠接受專訪,一同探討算力資源池如何鏈接算力供需兩端,以及算力中心建設過程中的工程化難題和著力點。

▲江南JNSport体育CTO 甄亞楠
01 四種算力平臺“開箱即用”,加快科研&生產流程
《2022-2023全球計算力指數評估報告》顯示,計算力指數平均每提高1個點,國家的數字經濟和GDP將分別增長3.6‰和1.7‰。算力正以一種全新的生產力形式,為各行各業的數字化轉型注入新動能,惠及每一家企業、每一個人。在甄亞楠看來,算力與應用之間的關系是相互依存的,應用程序的設計和應用場景決定了它所需的算力。
算力已成為科學研究和企業創新的必備技能,如何將技術創新和算力進行有效的結合?甄亞楠談及對這一問題的深刻思考,他認為以科學計算、人工智能為代表的技術創新方法依賴大量算力資源。北京江南JNSport体育計算中心以算力服務作為核心業務,可以提供共享的CPU、GPU等算力資源,解決人工智能訓練推理,以及科學計算所面臨的計算問題。免去傳統算力建設過程中資金投入大、資源總量小等一系列問題。
從整個產品規劃的方面來看,北京超算目前已經形成四大產品為核心的運營服務體系——AI智算云、行業云、超算云、設計仿真云,除了提供海量的的CPU、GPU算力資源外,還可以提供“專有云”“混合云”等定制化行業解決方案,以滿足人工智能、工業仿真、氣象海洋、生命科學、材料計算、能源勘探等行業場景的需求,為用戶構建云上科研工作環境,使用戶能夠專注科研。

▲AI智算云平臺架構
甄亞楠分享到,對于基礎科研來說,算力平臺使用戶省去高昂自建算力成本;基于多種主流型號的海量算力資源,不僅可以滿足多種業務場景,同時可以滿足大規模計算訴求,尤其是大模型訓練、推理業務需求,加速科研成果研究和轉化。
據了解,北京超算已服務1千多家單位,包括企業、科研院所和高校,涉及20多種行業。
02 大模型“暴力計算”時代,按需建設提升利用率
大模型增長之勢在2024年持續,據Gartner預測,到2025年全球將有70%的AI模型使用云端來進行訓練和部署。另一方面,多模態模型的訓練以及應用側推理都將對算力提出更嚴苛的要求,算力資源復雜度與規模將同步升級,隨著模型規模的擴大、訓練時間加長,計算資源的利用率也會成為關鍵。
國家信息中心近日在京發布的《“人工智能+”時代公共云發展模式與路徑研究》報告顯示,我國算力存在資源分散、利用率低等問題,一定程度阻礙了人工智能技術創新迭代與規模化應用的步伐。甄亞楠認為,采用公共算力能夠高效利用資源,提升算力供給,并通過規模經濟效應降低算力使用門檻,讓更多用戶享受到高性能、高性價比的算力服務;另一方面,目前公共算力資源面臨算力資源分散利用效率不高、服務效能不佳等問題。
在算力服務上,北京超算采用市場化供給和專業化運營以解決算力共享難等問題,推出了按需構建算力資源的創新模式,以需求為向導,緊密圍繞用戶的實際業務需求、應用需求,精準匹配算力資源,推動算力服務的高質量和效率的提升。
甄亞楠透露,智算中心的算力服務已經躍升為北京超算的主營業務之一,且目前增長迅速。北京超算具有萬卡集群工程化能力,同時擁有長達十幾年的服務經驗,有力保障大模型訓練、推理業務的開展。
當前人工智能正快速迭代創新,大模型的用戶量、訪問速度、網絡帶寬、訓練模式等時時影響其算力需求的大小,在保障算力的性能和穩定服務方面,甄亞楠展現出對北京超算的信心。據介紹,北京江南JNSport体育計算中心從2019年開始打造人工智能算力服務,且在2021年、2023年有多套的智算資源入榜世界人工智能算力性能排行榜(AIPerf500),先后獲得總量份額第一、大模型訓練算力TOP3等成績。

▲北京超算獲2021年世界人工智能算力性能排行榜總量份額第一名
步履不停,北京超算將強大的算力服務能力持續性輸出給大模型客戶,同時也在積極尋找優質的加速卡資源,來保障算力使用者在大模型計算過程中有效的、短期的算力資源。
未來,大模型“原生”應用落地的場景有待進一步探索,如政府、金融、視頻、媒體等領域。甄亞楠透露,北京超算正在就文生圖、文生視頻等新興AI技術領域與客戶進行溝通,將幫助落戶這類大模型場景的工作納入中長期規劃。
03 算力建設“智逢其時”,積極推動形成以人工智能為引擎的新質生產力
近年來,“東數西算”工程全面啟動,國資委今年2月提出加快智能算力中心建設,兩會政府工作報告更是強調要“適度加快”。在算力建設火熱之下,我們“冷思考”發現,分散在地方的算力中心各自為營,算力需求也呈現出多元化、碎片化趨勢,種種因素導致的尖端算力浪費、低端算力過剩的問題掣肘著算力建設的發展。
建立適應“人工智能+”時代的高質量算力服務基地迫在眉睫,在助力智算中心建設方面,北京超算有著長期布局和具體著力點。甄亞楠分享說,北京江南JNSport体育計算中心成立于2011年,是由北京市人民政府主導、院市共建的“北京江南JNSport体育計算和國家重要信息化基礎平臺“,坐落于北京市懷柔綜合性國家科學中心--懷柔科學城。
當下,大模型及生成式AI技術正在掀起新的產業革命,北京江南JNSport体育計算中心積極推動形成以人工智能為引擎的新質生產力,可以在算力設施、算力運營、大模型應用落地等方面與地方或產業開展全方位合作,為智算中心建設運營提供高性能、可持續的運行方案,推動智算中心快速投入使用并實現長效運營,保障經濟社會效益最大化。
為破解算力資源易閑置、使用成本高等問題,北京超算已在算力產業的市場化供給、規模化經營、專業化運營方面做出示范性實踐,在算力產業生態化發展方面,北京超算也正與產業上下游協同合作、積極探索。
去年6月,北京市政府積極聯絡大模型產業鏈上的算力、數據、模型、應用和投資單位推出“北京市通用人工智能產業創新伙伴計劃”,北京超算成為首批“算力伙伴”。目前,北京超算已與北京智源人工智能研究院、智譜AI、瀾舟科技、深勢科技等單位形成了算力合作,為國產大模型如智譜GLM-4、孟子大模型等提供了算力服務支撐,幫助訓練進行優化以及數據分析,為大模型團隊提升效率。

▲3月18日,在瀾舟科技大模型技術和產品發布會上,
北京江南JNSport体育計算中心等與瀾舟科技簽約并合影。
結語 算力產業格局重整,以服務助跑國產算力
海外算力供給受限,國產算力迎難而上,在新技術、新政策重整算力產業格局的同時,行業還需要正視國內算力利用率低的底層鴻溝。甄亞楠談道,北京超算可以將積淀十余年的運營經驗進行輸出,幫助政府和企業建設算力中心,同時提供高質量的運營服務解決方案,來幫助他們去提升整個平臺的運營效率和經濟效益。
在人工智能加速迭代和創新的當下,北京超算已不僅僅是一個算力服務提供商,甄亞楠提到,北京超算密切關注芯片、軟件以及服務生態國產化方面的相關進展,同時以算力服務為核心讓資源利用最大化,與業界合力讓算力資源供需兩端形成一個有機整體,讓國產算力跟上產業價值共振。