企業大數據工程
課程介紹
使用 Spark 的機器學習
– Douglas Merrill
我們的社會從 2020 年得到的最大啟示之一就是,我們周圍的世界正不斷發生變化。唯一不變的是,這個世界生成的數據量始終在增長。大數據被稱為 IT 行業的石油,這種說法不無道理,因為它的確促進了人們制定重要的商業決策。
到 2024 年將產生的數據量
通過轉移到云端將業務敏捷度提升29%
中國大數據行業產值將達 1500 億元人民幣(220 億美元)
– 前瞻產業研究院的預測結果
隨著企業從傳統架構過渡到現代數據架構,數據工程師開始成為極為關鍵的資源,他們可以應用能夠在云上擴散和運行的相關新技術來構建數據管道。 在當今這個多變和極具競爭的市場中,每個企業都在尋找更有深度的分析和見解,以便推進自身轉型。員工技能培訓可以確保團隊做好推進這種轉型的準備。
根據領英 2020 年新興職業報告
本課程可以幫助企業深入培訓員工,為企業提供創新解決方案,支持它們使用 Delta Architecture 等現代大數據架構來處理大數據。
正在尋找員工培訓課程的企業,這種培訓可以提升企業的 IT、數據管理和分析專業人員的技能,以便他們開發和維護可促進大數據分析的框架。
從事數據項目,至少具備 3 年工作經驗的軟件和 IT 專業人員。
能夠閱讀、書寫和理解英文資料。
具有英語口語能力是加分項(但不是必備能力)。
NIIT 美國
企業學習集團咨詢顧問
NIIT,StackRoute,
企業 IT 業務,
解決方案與產品負責人
NIIT,StackRoute,
AI 與數據科學,
高級顧問
NIIT,StackRoute,
高級培訓顧問與數據工程師
NIIT,StackRoute,
高級培訓顧問
輕松接觸嚴格挑選的資深從業人員和導師,他們具備多年的相關技術工作經驗。
通過多種方式為學員釋疑解惑,并解決他們在課程中遇到的各種問題。
訪問 O’Reilly 電子書,這種資料可以增強學員的理解能力。
整個課程提供了預置的本地/云實驗室,它側重于讓學員在實踐中學習,而不是以技術挑戰為其制造學習障礙。
持續時長:
8-9 周
(周末的在線會議)
課程概況:
本課程旨在為關鍵的軟件工程方法奠定堅實的基礎,并向學員傳授使用 Apache Spark 構建可擴展的企業數據管道以便進行分析的技能。它還將向學員傳授使用 Apache Spark,在大數據集上擴展數據科學和機器學習任務的技能。
主要優勢:
? 我們的課程以邏輯上一致的方式解耦 Apache Spark。
? 它涵蓋三種最流行的 ML(機器學習)算法(決策樹、聚類和回歸),這是構建基于 ML 的解析解必不可少的方法。
? Scala 編程語言
? Spark 數據框和數據集
? 彈性分布式數據集(RDD)
? Spark Streaming 功能
? Spark SQL
? 機器學習
? 線性回歸和決策樹
? 聚類(K-均值算法)和邏輯回歸
? 使用 Scala 的 Spark core
? Spark 結構 API – 數據框,使用 Python 的 SQL
? Spark 結構 API – 使用 Python 的數據工程
? Apache Spark 的召回
? 機器學習與線性回歸介紹
? 決策樹和隨機森林代碼
? 聚類(K-均值算法)
? 邏輯回歸