News
您的位置:
算力網絡由“算”、“網”、“腦”三個部分組成,其中“算”即生產算力,“網”即連接算力,“腦”即度量、感知、編排和調度算力。其中,編排和調度作為算力網絡的核心控制部分,亦為“算力大腦”的核心能力。算力大腦統籌全局資源,重要性可想而知。以工業視覺檢測場景為例,某電力企業在經歷自然災害后,需要迅速對某省、市、區、縣等各級分公司下轄的電力線路進行巡檢。傳統模式下,需通過固定監控攝像頭、無人機、移動攝像機等設備獲取的海量視頻或圖像信息,識別故障或隱患線路,第一時間組織搶修工作。這種情況恢復周期相對漫長,而恢復時長往往又和直接損失成正比。如果基于算力網絡,經過算力大腦的編排和調度,僅需通過以下四個自動化步驟,即可快速搭建一套視覺檢測系統并投入運行,從而節約大量寶貴的黃金恢復時間,降低災害損失。根據該企業的災復數據稽核要求,算網大腦利用其多量綱編排能力,基于距離、時效等原則,在災復數據產生地的周邊算力池分配算力資源;根據視覺檢測的要求,快速在已分配的算力資源上,通過云原生的編排能力,自動化部署AI檢測應用;接收災復數據,通過相對應的AI檢測應用進行風險檢測并輸出結果,用于指導災復工作開展;同時,在根據運行過程的狀態,實施進行動態算力調整;最后,在檢測工作完成后,根據預定策略快速地釋放算力資源。詳細拆解來看,“算網大腦”的三個核心編排能力在其中起著至關重要的作用:01云原生編排能力云原生編排能力指應用無需進行復雜的適配性改造,由算網大腦提供通用性編排框架,即可實現應用程序的自動、靈活、敏捷的部署,以及管理和擴縮容編排。通過提供鏡像及應用管理、集群及節點管理、服務治理、訪問安全管控、容器編排及調度能力,即可實現自動化集群部署、外部調用的均衡分發、敏捷擴縮容等,讓應用程序不再需要進行復雜的分布式架構設計及規劃,大大降低了技術門檻。那么在算力網絡中的容器編排調度能力,與傳統容器調度會有哪些方面的區別?首先,編排復雜度程度不一樣。與傳統容器引擎部署環境相對單一的情況不同,基于算力網絡的容器引擎,不但需要應對涉及多云多邊協調的復雜部署環境,而且需要去適配異構化的計算架構,保證在異構計算架構下高性能運行;甚至可利用編程芯片、DPU等算網新技術手段,進行特定場景的優化加速。其次,網絡的復雜程度不一樣。傳統容器引擎,通常在一個相對封閉的內部網絡之中,較為簡單。而處于算力網絡中的容器引擎,需要適配更為復雜的網絡環境,例如由SRv6、SFC、APN6、CFN、IFIT技術組成的SDN2.0架構的算力感知網絡。因此容器調度引擎需要針對此類網絡環境進行適配與改造,發揮算力感知網絡特性,實時進行應用程序的調度;例如可基于SRv6技術的網絡切片能力增強演進,并增強資源感知與應用感知能力,調度可觸達用戶的廣度更大和精度更高的算力資源。最后,安全性要求不一樣。算力類比電力,當社會算力并網后,如何保證正向對社會閑散算力的安全性管控,反向對調用方向適度且高效的認證和審計,是實現應用及其數據的關鍵要素。02多量綱的編排能力算網業務的編排需要充分考慮應用的特性,算網資源的QOS、安全、成本及能耗等多個量綱,實時進行業務編排,輸出最合理的編排方案。實現最便宜的算力匹配最合適的應用。從技術特性分析,多量綱編排引擎底層核心采用多屬性決策算法,或稱為有限方案多目標決策。由于算網業務的產品豐富性和資源靈活性,對于同用戶同業務的需求,可以編排出不同的解決方案供客戶選擇,可以是安全性優先或者性能優先,也可以是價格優先等等。從決策流程分析,算網大腦可以通過三個步驟精確給出最優、最匹配客戶需求的編排方案。首先,預設編排模型,按照性能、成本、能耗、安全4個緯度的不同占比,預設5個的編排模型,分別為綜合模型、性能模型、安全模型、能耗模型、成本模型。例如:性能模型(性能權重最大,安全其次,能耗及成本最低)等;其次,按照預設模型,按照相應的決策環境要求(業務訴求,性能訴求、價格要求等)及運行參數(算網運行感知參數)進行運算,計算出不同模型的得分;最后,利用投票決策算法,針對備選方案進行二次計算打分,最終確定最優的編排方案。03運行態的編排能力運行態編排能力是基于對算力網絡實時感知能力進行的二次編排能力,算網大腦需根據算力網絡的實時運行狀態、應用的運行狀態及業務并發量的發展趨勢等維度的信息,綜合給出應用程序使用的算力網絡資源及部署,動態編排調整方案,以期更好地促進應用平穩運行。運行態編排,前期利用從PCPR模型,從性能、成本、代價及回切周期可以分成擴容場景、縮容場景、切換場景、優化場景四類:擴容場景:例如,某應用使用的算力資源為位于A市的A算力池的4臺服務器。當訪問該應用的請求增多時,可以動態在A算力池追加服務器,對應用進行動態的擴容,以滿足高并發的要求。此為,簡單的擴容場景。更復雜的情況,當需求來之B市,A市與B市之間的網絡質量要求無法滿足該應用的要求時??梢栽贐市鄰近的資源池C算力池調撥出部分資源,動態部署該應用的新節點,以方便來之B市的訪問請求可以得到滿足。縮容場景的情況與擴容完全相反,不再贅述。切換場景:以上述例子來描述。此部署在A市A算力池的某應用,但因算力池的故障或者網絡等故障導致應用無法正常訪問時??梢钥焖俣ㄎ凰懔熬W絡環境達標的算力池,從中調配出算力資源,進行應用的應急部署,以進行快速的異?;謴?。當然對于無狀態的應用,可以快速地進行異地應急部署。但對于有狀態數據的應用,需要有配套的數據備份機制,能夠利用備份數據進行移動數據恢復,才能實現應用的跨算力池異地切換。優化場景:指在運行中的某個應用,假設其應用部署在多個算力池中,從部署拓撲來看,呈現出網狀的部署結構??梢愿鶕兄膽迷L問的響應情況、網絡及算力池運行的性能數據,綜合運算出其部署拓撲的調整建議,優化調整的范圍包括同一算力池內的機器數量及配置等的調整,也可以包括跨算力池的部署結構調整。后期,可以利用機器學習技術,針對歷史的運行數據進行學習和分析,進一步豐富調度規則、校正調度的精度。算力網絡是實現“算力”基礎設施化的一個重要載體。目前算力網絡在標準路線、體系架構等方面仍處于起步階段,一批重大原創成果和關鍵核心技術亟待突破。作為運營商的長期合作伙伴,浩鯨科技針對算力網絡創新性的提出完善的整體解決方案“BICN”,包括面向運營服務層的運營門戶(即鯨旗門戶)、面向編排管理層的算網大腦(即鯨睿大腦),以及負責泛在對接的套件(即鯨臂控制,包括多云管理、各專業控制器等)。面向編排管理層,浩鯨科技“鯨睿大腦”已實現統一編排左腦、算網自智右腦及算網孿生底座等核心能力,結合AI、大數據等多要素能力開展生態合作創新試驗,為新業態下算網業務的智能化編排開通提供可落地解決方案,探索算力網絡的創新應用和模式。相信伴隨著算力網絡的深度開發與新型基礎設施建設,算力能夠真正流動起來,并像電力和自來水一樣能夠實現隨用隨取,進而賦能全社會數字化轉型。
根據該企業的災復數據稽核要求,算網大腦利用其多量綱編排能力,基于距離、時效等原則,在災復數據產生地的周邊算力池分配算力資源;
根據視覺檢測的要求,快速在已分配的算力資源上,通過云原生的編排能力,自動化部署AI檢測應用;
接收災復數據,通過相對應的AI檢測應用進行風險檢測并輸出結果,用于指導災復工作開展;同時,在根據運行過程的狀態,實施進行動態算力調整;
最后,在檢測工作完成后,根據預定策略快速地釋放算力資源。
首先,預設編排模型,按照性能、成本、能耗、安全4個緯度的不同占比,預設5個的編排模型,分別為綜合模型、性能模型、安全模型、能耗模型、成本模型。例如:性能模型(性能權重最大,安全其次,能耗及成本最低)等;
其次,按照預設模型,按照相應的決策環境要求(業務訴求,性能訴求、價格要求等)及運行參數(算網運行感知參數)進行運算,計算出不同模型的得分;
最后,利用投票決策算法,針對備選方案進行二次計算打分,最終確定最優的編排方案。
擴容場景:例如,某應用使用的算力資源為位于A市的A算力池的4臺服務器。當訪問該應用的請求增多時,可以動態在A算力池追加服務器,對應用進行動態的擴容,以滿足高并發的要求。此為,簡單的擴容場景。更復雜的情況,當需求來之B市,A市與B市之間的網絡質量要求無法滿足該應用的要求時??梢栽贐市鄰近的資源池C算力池調撥出部分資源,動態部署該應用的新節點,以方便來之B市的訪問請求可以得到滿足。
縮容場景的情況與擴容完全相反,不再贅述。
切換場景:以上述例子來描述。此部署在A市A算力池的某應用,但因算力池的故障或者網絡等故障導致應用無法正常訪問時??梢钥焖俣ㄎ凰懔熬W絡環境達標的算力池,從中調配出算力資源,進行應用的應急部署,以進行快速的異?;謴?。當然對于無狀態的應用,可以快速地進行異地應急部署。但對于有狀態數據的應用,需要有配套的數據備份機制,能夠利用備份數據進行移動數據恢復,才能實現應用的跨算力池異地切換。
優化場景:指在運行中的某個應用,假設其應用部署在多個算力池中,從部署拓撲來看,呈現出網狀的部署結構??梢愿鶕兄膽迷L問的響應情況、網絡及算力池運行的性能數據,綜合運算出其部署拓撲的調整建議,優化調整的范圍包括同一算力池內的機器數量及配置等的調整,也可以包括跨算力池的部署結構調整。
浩鯨云計算科技股份有限公司 版權所有 2003-2023
蘇ICP備10224443號-6 蘇公網安備 32011402011374號