目前企業中的資料規模愈來愈龐大,所衍生出的各類問題,像是雜亂的資料、混亂的訊息,以及讓大量資料分散在各個資料中心與不同的雲端供應商中。面對這樣的紊亂情境,資訊長與IT組織能夠採取甚麼樣措施,來面對前所未有的資料蔓延 (data sprawl) 問題?


CIO應對資料蔓延的五大重點

目前企業中的資料規模愈來愈龐大,所衍生出的各類問題,像是雜亂的資料、混亂的訊息,以及讓大量資料分散在各個資料中心與不同的雲端供應商中。面對這樣的紊亂情境,資訊長與IT組織能夠採取甚麼樣措施,來面對前所未有的資料蔓延 (data sprawl) 問題?

文/Sharon Goldman‧譯/潘得龍

目前企業的資料保存方式大部分採取混合式,在企業內部會存在著多種公有與私有雲,在SaaS應用程式以及各類周邊設備裡,都能夠找到各種不同的資料類型。企業組織也通常希望透過人工智慧提升資料的價值,同時要能夠安全而合法地使用各類資料。這類型的目標,已經讓企業組織形成與資料的長期抗戰關係,想要努力將資料轉化為有用的啟發資訊,其所揭露的洞察內容,有助於促進決策的制定,並且超越競爭者。

因應這種類型的需求,產生許多明顯而大量的邊緣運算與物聯網架構:預估到2020年底,全球將有117億個物聯網設備連結。Gartner預測,到了2025年,有 75% 由企業所產生的資料,自來自於非傳統的集中式資料中心之外,也就是指企業資料是由邊緣周邊所產生及處理。隨著IoT裝置變得愈來愈智慧化與普及化,以及企業組織極力將IoT所產生的數據,結合到營運系統資料進行分析,也讓資料的內容變得更加複雜。


由於新冠肺炎大流行,因而從2020年開始,各企業均產生大量的遠距工作需求,這也成為另一個促使資料大量產生的推波助瀾因素。遠距系統激增了具備協同合作能力的App、平臺及隨身行動裝置的發展。這讓所有產生的文件、互動內容以及其它的資料內容,都必須另外儲存與處理。這些資料或文件,並沒有特定的指引或是流程,說明應該如何分享或是儲存。像是最近的一個市場調查發現,在全球 71% 的辦公室工作人員裡,其中有 68% 的美國員工,承認他們透過即時通訊軟體與辦公室協同合作工具,來分享機密資訊或公司裡重要的的業務資料。

資料營運(DataOps)諮詢暨平臺供應商DataKitchen執行長 Chris Bergh 對此解釋道:「物聯網的興起,以及邊緣運算與遠距工作的趨勢,推動了從集中化走向分散式的整體轉變。對IT組織而言,如此龐大的資料累積,代表著對資料資產逐漸失去了控制權。一般的企業產生資料的速度,已經遠超過企業資料管理團隊所能管理與治理的能力範圍了。」

當然,在新冠肺炎爆發之前,資料擴張的趨勢已經相當明顯,但專家表示,疫情的流行增加了資料產生的速度、範圍和影響。Info-Tech Research Group 的資訊技術總架構師暨資料與分析高級總監 Andy Neill 表示:「比起以往任何時候,企業組織都更需要藉由實施更健全的方法,來主動管理資料,並從資料當中獲得有效益的訊息,從而趕上迅速變化的趨勢。」

資料分散化帶來的漏洞和管理挑戰

Brillio公司美國區域分析團隊主管 Sandhya Balakrishnan 認為,問題是在於這些大量產生的資料沒有獲得良好的管理,這讓企業組織的重要訊息容易因為洩漏損害相關的利益。她解釋,傳統的主流資料策略,缺少針對邊緣資料的儲存與處理這個面向,因此無法保護與整合雲端的資料。她說:「這意味著企業的營運沒有單一的真實來源,會讓人對企業資料的品質和安全產生疑慮。」

IBM全球人工智慧主管 Seth Dobrin 指出,資料蔓延也讓企業如何遵守國際法規成為一項難以觸及的挑戰。他指出:「這類目標愈來愈難達成,因為如果貴公司位處於多個國家或是地區,同時擁有全世界各地的資料內容,而這些資料又必須在不同國家和地區之間共享,那麼就必須遵守每個國家與地區的法規。」

他補充指出,到頭來,企業組織仍需要針對這些資料建構出單一的掌握視角。儘管資料是分散的,但是應用資料的使用者與企業流程卻不見得是如此。所以他們需要以集中的使用方式處理資料內容。他解釋說:「其中存在著悖論。一方面,企業將資料分散於各地,但是它們也需要一種能夠瞭解、管理以及使用資料的統一方法。」

Capgemini公司北美工程研發業務單位的科技與創新高級助理副總裁 Subhankar Pal 指出,對資訊長而言,這表示它們需要發展出一種資料管理策略,能夠因應資料在邊緣擴展時,仍然能夠維持資訊安全、成本效率、可靠性以及效能。他說:「邊緣資料管理,讓習慣於傳統資料中心管理的資訊長,必須建立一套全新的資訊安全管理架構。透過邊緣設置,資料的處理會更接近來源位置,遠離較為安全的資料集中化資料中心。」

專家們建議,由於資訊長和IT組織都必須做好長期與資料蔓延奮戰的準備,因此可以採取以下五項重要步驟因應:

1. 擬定完整的數位與資料策略以開始進行

這是企業展示控制資料蔓延價值的重要起點,同時可避免沒有對投資進行優先順序安排所帶來的風險。Neill表示:「當策略就定位之後,企業組織就可以井然有序地,根據設計的方法,來規畫資料的處理方式以及平臺建置。」

2. 將焦點放在能夠支援自動化的資料架構

強大的資料架構策略應該要能解決業務營運的需求、對應所需要的資料架構以支援業務,以及部署正確的自動化科技,能夠支援不同的類型。Dobrin指出:「並沒有一種萬能的平臺能夠達到所有的需求。」他提出警告,某些科技的設計是要解決「水平的」的問題,像是邊緣處理,或是單一雲端資料儲存。另外有些科技的設計則是處理「水平」問題,像是資料目錄,在資料內容中的描述文件資料,方便讓企業使用者能夠方便取用。

3. 其他企業高階主管的參與

資訊長只是企業所擁有以及操作現代大型資料管理和資料規模規畫的一部分,Neill指出:「資訊長主要負責的部分是在資料的管理,或是在支援資料處理的系統、解決方案以及基礎架構上。」他解釋,主要是資料主管、資料分析主管、營運主管,或是其他非IT主管成員,才是真正擁有資料,然後執行如何應用資料內容替企業獲取效益的啟動者。他說:「瞭解如何指定這些責任,以及他們之間的關係,可以協助IT和企業各單位組織維護更一致的資料控制,而且能產生更重要有價值的洞察,回饋給企業。」

4. 投資資訊安全以跟上資料增長步調

Pal指出,邊緣位置的資料成長,使用者與存取點數量的軟硬體增加,都是在資訊安全管理上需要注意的部分。他解釋:「企業組織需要投資在更安全、採邊緣架構的解決方案,即使投入的成本很高,可以防止因為資料外洩所產生更高的成本。可以使用加密以及金鑰管理,成為邊緣裝置上的資料安全核心。而且在某些情況下,多因素驗證將會成為重要的角色。」

5. 確保可大規模地提升資料的管理能力

由於資料流向的複雜性提升,因此當企業組織開始嘗試進行管理之時,必須在公司規章中建立起檢查清單和簽署權限的需求。Bergh說:「這看來很像是對生產力進行課稅。」管理不應專注於如何限制用戶,而是應該著力於如何促進整體的安全,在可以控制的範圍內使用資料,這是主動的推動,而比較不是使用規定限制。他說:「這是所謂的自動化,稱之為DataGovOps,由資料品質管理與防護工作流程所設計,而不是著重在限制資料的使用。」

一旦資訊長克服資料蔓延挑戰 就能帶來全新機會

在2020年中,由IDC所做的研究發現,有 80% 受訪的IT主管,瞭解資料蔓延是他們的組織目前所必須處理的最重要問題。

Dobrin表示,企業如果不採取有關資料蔓延的適當行動,就會面對真正的財務損失後果。不只是可能由於不符合規定所遭受的罰款,而且更多是由於沒有能夠有效率的處理資料所產生的成本。

此外,如果企業並不能有效率的管理蔓延的資料,就會拖慢企業流程,不可靠的可能性也會升高。他補充說:「後續的結果可能是全面性的,從不良的企業決策到客戶關係的劣化,以及更高的客戶服務成本。」

最重要的是,資料是具備高度價值的貨幣,可以提供更多的機會給企業組織,尋求競爭的優勢。但Balakrishnan表示,只有在具備清楚的策略,標準化的儲存方式、資訊安全機制以及使用方式情形下,才能達成此一目標。

她說:「對資訊長而言,這表示建立能夠瞭解、發現以及管理這些長期分散資料資產的能力,而不能再被忽略成次要的投資。如果企業組織在資料管理方面進行創新,並且加強資料管理,那麼資料就可替企業產生加倍的競爭機會。這包含了更強大的資料蒐集能力、更自由的在市場應用資料,以及能夠更專業的應用資料建立應用範例。」