中國共產黨新聞網>>綜合報道
分享

安徽合肥建設新一代算力集群——

算力集群助力前沿技術加速推廣(一線見聞)

本報記者  李俊杰  孫佩瑾

2025年04月17日08:40    來源:人民網-人民日報

  算力工程師在調試設備線路。

  運維工程師在對設備進行例行維護。

  “巢湖明月”超級計算機。
  以上圖片均為阮夢生攝

  核心閱讀

  算力是什麼?對你我生活有什麼影響?作為數字經濟時代的新質生產力,算力的飛速發展正推動人工智能等前沿技術加速推廣,進而服務科技創新、產業發展、民生保障等領域。

  近年來,作為綜合性國家科學中心,安徽合肥瞄准需求、搶抓機遇,建設了包含我國首個國產萬卡算力集群的新一代算力集群,有力推動經濟高質量發展。

  

  打開軟件,說出指令,不到5秒,一個初具邏輯的文本隨即生成。

  不單是文本生成,知識問答、邏輯推理、音視頻制作……人工智能大模型因其豐富且便捷的功能,已成為不少人工作生活的好助手。

  現今人工智能越來越“智慧”的背后,是看不見、摸不著的算力在支撐。

  何為算力?顧名思義,就是計算能力,即設備單位時間可處理的信息數據量。數字經濟時代,數據成為關鍵生產要素,算力通過對數據的分析、加工、處理,成為推動經濟高質量發展的新引擎。

  算力是怎樣發揮作用的?又將如何影響你我日常的工作生活?近日,記者走進安徽合肥“巢湖明月”新一代算力集群,與建設運營團隊在一個個巨型機房裡尋找答案。

  快速完成海量計算,如何做到?

  中國科學技術大學“機器化學家”實驗室裡,一種新型研究模式讓人眼前一亮:這裡沒有忙前忙后的科研人員,隻有一台動作靈活的機器人在操作台之間來回穿梭。

  借助它,中科大江俊教授團隊僅用5個星期,就從55萬種金屬配比中找出最優高熵催化劑。而這一過程需要閱讀1.6萬篇論文、進行2萬組理論計算、分析200組全流程機器實驗數據。

  如此大的計算量是怎樣在短時間內完成的呢?答案藏在不遠處的合肥先進計算中心。

  來到合肥先進計算中心,映入眼帘的是一座巨大的淡藍色立方體。玻璃立方內,一台名為“巢湖明月”的超級計算機佔據著上下4層共計200多平方米的空間。

  “這台計算機光服務器就有1500多台,它的計算能力達到了12P,即每秒鐘的運算能力為1.2億億次。”合肥市大數據資產運營有限公司多元算力服務中心主任張雲蕾介紹,“全國14億多人,每人每秒做一次計算,需要將近100天才能做完1.2億億次,而我們這台計算機1秒就能完成。”

  “有了這台計算機的支持,我們的‘機器化學家’就擁有了‘超強化學大腦’。”江俊一臉自豪,“它能不知疲倦地執行計算任務,得到最優的實驗配方。”

  不只是科研領域,當下,算力已經和生產、生活緊密聯系在一起。近年來,無論是綜合性國家科學中心建設,還是戰略性新興產業發展,合肥都對算力展現出迫切需求。

  瞄准這一需求,合肥積極開辟算力新賽道。2021年6月,“巢湖明月”超級計算機正式對外服務。2023年,合肥市大數據資產運營有限公司超前布局,建設了100P級的算力中心,緊接著又與科大訊飛共同建設了3000P級國產萬卡算力集群。

  “去年,我們又在算力集群上部署了3台量子計算機,探索建立起全國首個量超融合計算中心。”合肥市大數據資產運營有限公司總經理屠冉介紹,眼下,“巢湖明月”新一代算力集群初具雛形。

  走全國產技術路線,怎麼攻堅?

  在中國超級計算機發展史上,有一段受制於人的經歷:上世紀80年代,我國從海外高價購置了一台超級計算機,但在使用時卻處處受限——為了防止技術泄露,外方要求把設備放在一間全透明的玻璃房裡,並控制著機房鑰匙和開機密碼,我國科學家要經過授權才能進入,且所有操作必須在外方人員的監控下進行。

  “‘巢湖明月’玻璃立方的外觀設計,就是希望大家不要忘記這段歷史。”屠冉告訴記者,最初布局算力集群時,在技術上有兩條路線可選:一條是採用非國產芯片,這在當時是技術主流﹔另一條是走全國產路線。“高新技術是討不來、要不來的。我們團隊經過反復調研分析,最終認定,必須建立自主可控的算力體系,走國產化這條‘難而正確’的路。”

  國產化的道路難在哪?首先是接受度問題。屠冉坦言,當時,各類科研團隊、客戶企業對進口芯片搭建起的算力體系已經形成使用習慣,加之國產算力芯片的性能跟前者相比仍有差距,一開始大家都不太願意用。其次是技術難度大。想要建設3000P級全國產萬卡算力集群,國內尚無成熟經驗可借鑒。

  “為了啃下這塊硬骨頭,2023年7月,我們同科大訊飛、華為組建起數百人的聯合攻關團隊,並把工作計劃安排精確到天,實行日報日清制度。”聯合攻關團隊技術負責人潘青華回憶,組網過程中,單是光纖就有3.5萬多根。網絡怎麼排布?連接后能否跑通?……每一步,對於團隊而言都是“摸著石頭過河”。

  機房改造、設備部署、光纖接入……經過107個晝夜的奮斗,2023年10月,我國首個國產萬卡算力集群跑通!張雲蕾回憶:“集群點亮的那一刻,不少團隊成員流下激動的淚水。”

  隨后,團隊又加緊訓練,在2024年1月,國產算力集群性能達到當時同類型進口算力集群的90%。合肥市大數據資產運營有限公司副總經理井梅生介紹,算力集群自運營以來,平均負載率穩定在84.59%,峰值負載率達到91.53%,基本處於飽和運行狀態,服務質量得到用戶好評。

  統籌調度算力資源,效率多高?

  江淮汽車股份有限公司研發中心,工作人員利用數字孿生技術模擬汽車碰撞,分析高速碰撞時各個零部件以及假人損傷情況。

  這樣的試驗過去主要依賴實車碰撞,周期比較長。現在依托算力集群先進行仿真實驗分析,得到大量相關數據后,再進行實車碰撞驗証,相關環節研發周期縮短了30%以上,顯著提高了研發效率。

  從工業生產到科研探索,算力之所以成為新質生產力,在於它能夠賦能千行百業。

  新能源汽車、生物醫療、環境監測……駐足“巢湖明月”新一代算力集群展廳,一項項算力賦能產業發展案例令人目不暇接,一個個模擬應用場景及研發產品令人印象深刻。

  據了解,自2021年6月對外服務以來,“巢湖明月”新一代算力集群積極服務科技創新、產業發展、民生政務等領域,已累計服務700多家科研院所、近6000個用戶,累計交付超34.7億核時的CPU算力、1.56億卡時的人工智能算力,保障計算任務超1000萬次。

  “如今通過與國家超算互聯網連接,我們還能調度來自江蘇、浙江、上海、四川等14個省份20多家超算和智算中心的算力。”屠冉介紹,去年6月,中國科學院等離子體物理研究所需要峰值約1萬核的計算資源,“如果用本地的算力,就要排隊等待一個月。我們通過平台調度了外地的算力資源,有效保障任務按時完成。”

  今年以來,合肥全力打造國產算力生態高地,升級發布了城市算力池計劃,進一步集聚各地國產算力資源。目前,合肥市大數據資產運營有限公司直接納管的算力已近2萬P。

  夜幕降臨,“巢湖明月”機房裡的指示燈還在不停閃爍。玻璃立方亮起,科技創新的步伐繼續前行。

  《 人民日報 》( 2025年04月17日 06 版)

(責編:王瀟瀟、任一林)
微信“掃一掃”添加“學習大國”

微信“掃一掃”添加“學習大國”

分享到:
推薦閱讀