企業大數據工程
課程介紹
使用 Databricks 和 Delta Lake 的機器學習
持續時長:
8-9 周
(周末的在線會議)
課程概況:
學員將使用 Apache Spark,在由 Databricks 和 Delta Lake 驅動的 Azure 云上執行并行化計算,以隱藏數據分布和容錯的復雜性。
本課程還將使用 Azure Databricks(基于 Apache spark、針對微軟 Azure 云進行優化的分析平臺),為主要的大數據管道奠定堅實的基礎。
主要優勢:
? 學員將在 Databricks 平臺進行實踐——這是市場上獨有的學習體驗。
? 該平臺提供了易于使用的 Jupyter 筆記本接口,并允許無縫集成各種 API、其他平臺和數據集。
? 不同于大部分其他 Apache Spark 課程,我們的課程提供Data Lake(作為一種數據分析策略的)技術的教學。
? Scala 編程語言
? Spark 數據框與數據集
? 彈性分布式數據集(RDD)
? Spark Streaming 功能
? Spark SQL
? 用 Databricks 吸收數據
? 用 Databricks 轉換數據
? 基于 Azure Databricks 的 Delta Lake
? 使用 Scala 的 Spark core
? Spark 結構 API – 數據框,使用 Python 的 SQL
? Spark 結構 API – 使用 Python 的數據工程
? 使用 Databricks 吸收數據
? 使用 Databricks 進行數據轉換,使用 Azure Databricks 管理 Delta Lake
– Douglas Merrill
我們的社會從 2020 年得到的最大啟示之一就是,我們周圍的世界正不斷發生變化。唯一不變的是,這個世界生成的數據量始終在增長。大數據被稱為 IT 行業的石油,這種說法不無道理,因為它的確促進了人們制定重要的商業決策。
到 2024 年產生的數據量
通過轉移到云端將業務敏捷度提升 29%
中國大數據行業產值將達 1500 億元人民幣(220 億美元)
– 前瞻產業研究院的預測結果
隨著企業從傳統架構過渡到現代數據架構,數據工程師開始成為極為關鍵的資源,他們可以應用能夠在云上擴散和運行的相關新技術來構建數據管道。 在當今這個多變和極具競爭的市場中,每個企業都在尋找更有深度的分析和見解,以便推進任何企業級的轉型。員工技能培訓可以確保團隊做好推進這種轉型的準備。
根據領英 2020 年新興職業報告
本課程可以幫助企業深入培訓員工,為企業提供創新解決方案,支持它們使用 Delta Architecture 等現代大數據架構來處理大數據。
正在尋找員工培訓課程的企業,這種培訓可以提升企業的 IT、數據管理和分析專業人員的技能,以便他們開發和維護可促進大數據分析的框架。
從事數據項目,至少具備 3 年工作經驗的軟件和 IT 專業人員。
能夠閱讀、書寫和理解英文資料。
具有英語口語能力是加分項(但不是必備能力)。
NIIT 美國
企業學習集團咨詢顧問
NIIT,StackRoute,
企業 IT 業務,
解決方案與產品負責人
NIIT,StackRoute,
AI 與數據科學,
高級顧問
NIIT,StackRoute,
高級培訓顧問與數據工程師
NIIT,StackRoute,
高級培訓顧問
輕松接觸嚴格挑選的資深從業人員和導師,他們具備多年的相關技術工作經驗。
通過多種方式為學員釋疑解惑,并解決他們在課程中遇到的各種問題。
訪問 O’Reilly 電子書,這種資料可以增強學員的理解能力。
整個課程提供了預置的本地/云實驗室,它側重于讓學員在實踐中學習,而不是以技術挑戰為其制造學習障礙。