<s id="mcra4"><object id="mcra4"></object></s>
    <code id="mcra4"><input id="mcra4"></input></code><rp id="mcra4"><object id="mcra4"><input id="mcra4"></input></object></rp>
    <button id="mcra4"><acronym id="mcra4"></acronym></button>
      <dd id="mcra4"><track id="mcra4"></track></dd>
      <button id="mcra4"><acronym id="mcra4"></acronym></button>

        Cloudera用現代化企業數據架構,擁抱混合數據未來

        (魏德齡/文)數據的發展能夠產生什么樣的魔法效益?跑步、騎車這類曾經被很多人在中學時代視為枯燥的耐力項目,隨著秒表/碼表發展成為了智能表/功率計,讓更多人在數據的爆發中發現此前未知的自我,比賽過程中運動員所實時共享出的數據,也大大提升了觀賞度。如今,云計算大數據也照樣在體育賽事中嶄露頭角,足球比賽中實時分析產生的跑動距離、點球方位的統計,F1賽事中對于排位賽晉級圈速的估算、正賽中車輛之間的實時距離,全部給予了觀眾耳目一新的感覺。

        這一切的背后正是數據的發展,不同位置多種來源的數據源源不斷的產生,如同一堆混亂的表格文件,在企業主的桌面上堆砌,其中蘊涵著無數可能,也充滿了管理的煩惱。數據大爆發的背后,數據生態系統架構也正在朝向未來進化。

        未來數據生態系統架構

        談及未來數據生態系統架構,普遍被大家所提及并達成共識的莫過于數據網格、數據編織、湖倉一體這三個概念。

        數據網格是指一種范式轉變,其中數據由業務中的不同域擁有和管理?!八南敕ㄊ菙祿c產品思維的融合,這個產品是講企業內部里數據對外提供服務的方式。 ”Cloudera大中華區技術總監劉隸放解釋稱。以往企業在分析領域的思路多是集中式的管控,對外進行服務,而數據網格范式基于域主權、數據為產品、自助式數據平臺、聯合計算治理四項原則。通過域主權,數據成為一個產品,部門之間可以以產品的方式調用,規避了“影子IT”所帶來的一系列問題。

        數據編織是一種跨平臺的數據整合方式,它不僅可以集合所有業務用戶的信息,還具有靈活且彈性的特點,使得人們可以隨時隨地使用任何數據?!拔覀儸F在要做的事情,可能不光對人工的方式、手動數據管理進行服務,也要對未來的機器學習、自動的發現方式、對外進行服務,在這個框架里比以前要求更高。 ”劉隸放表示過去手動的元數據管理現在正在被一種積極主動的通過機器學習來構建元數據的方法取代。Gartner在今年提出數據編織的終極目標是為了數據的集成和訪問提供一種更靈活的,無縫的自動化的方式,其中主要包括能夠連接的服務與提供自助的服務。

        湖倉一體集成并統一了數據倉庫和數據湖的功能,旨在支持單一平臺上的AI、BI、ML和數據工程。其集數據倉庫與數據湖之所長,并規避了兩者存在的一些問題,適用于數據分析和機器學習工作負載,擁有減少數據冗余、成本效益,易于數據版本控制、治理和安全性等多重優勢?!坝辛撕}一體,我們可以在同一個平臺里同時實施數據倉庫和數據湖的需求,這個時候會提高成本效益。 ”劉隸放表示湖倉一體去其實也是降本增效的一個思路。

        人人獲益的三種方法論

        值得一提的是,這三種正在被外界廣泛討論并認可的方法論其實本身并不矛盾。劉隸放認為面對企業內部的不同角色,就需要講不同的數據架構和方法論。

        對于公司CEO或CIO而言,由于更關注如何在管理成本和維護人員規模的同時進行擴展,自然會關心數據網格,進而平衡企業內不同業務部門在組織架構下的數據所有權,以及數據和產品服務的方式。

        對于CTO或CSO而言,其真正關心的是如何做技術方案與分析系統,保持一致性并構建標準模式,數據編織自然成為了關注的焦點,如何用數據編織的方法豐富數據倉庫的構建方式,能夠為將來機器學習自主的治理提供服務。

        對于領域從業者或技術人員而言,湖倉一體則更為受用,可以理解為方法論,也可以理解為工具,尋求在具體項目上的優化。

        Gartner曾經表示:“未來數據的生態系統應該充分的利用分布式數據管理組件,可以在多個云和/或本地進行運行,但應該被視為具有高度自動化的緊密的整體,像集成、元數據管理和治理功能將各個組件粘合在一起。 ”

        這就意味著,關于數據未來的三種方法論其實將會有機的融為一體,最終讓企業中的每個角色獲益。

        擁抱混合數據未來

        Cloudera的新定位恰恰呼應了企業數據架構的未來,這家混合數據公司給出的定位是:我們提供適用于數據編織、數據湖庫、數據網格和未來數據生態系統架構要求的混合數據平臺的混合數據平臺,允許客戶在多個公共和私有云以及本地訪問和分析數據,使企業能夠做出由數據驅動的明智決策,幫助企業建立由數據驅動的未來。

        實際上,CDP(Cloudera Data Platform) 是業界唯一適用于數據編織、數據湖庫、數據網格和未來數據生態系統架構要求的混合數據平臺。 Cloudera的數據平臺實現了對于現代數據架構的全面支持,產品技術能夠適應數據網格、數據編織、湖倉一體這三種架構概念,同時在多云和本地部署上,都可以做到管理和分析。Cloudera的分析代碼經過一次編寫即可跨平臺運行。另外,SDX還能夠做到數據的統一安全管控和治理。

        以靈活且簡單的方式建立數據驅動型文化、以性能和成本效益驅動價值、以速度和控制拉動企業增長是Cloudera擁有的三大核心優勢?!拔覀內匀恢铝τ趯崿F讓每個人都可以輕松訪問數據和分析的愿景,以及我們成為混合數據領導者的使命。我們相信,數據可以讓今天的不可能,在明天成為可能?!贝饲癈loudera的一篇官方文章中曾這樣表述。

        對于眾多企業來說,數據正在源源不斷的出現,如何利用數據挖掘其中價值,在未來或許比獲取更多數據更加重要。Cloudera的數據平臺將為企業帶來通過數據戰略在競爭中實現“彎道超車”的機會,混合數據方法即將成為企業未來的“必需品”。

        極客網企業會員

        免責聲明:本網站內容主要來自原創、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

        午夜免费视频