你的位置: 首頁 > 內訓課首頁 > 互聯網/語言 > 課程詳情

details

Spark大數據挖掘工具Mllib實戰

暫無評價   
淘課價格
待定
可用淘幣
0
返現金券
待定

你還可以: 收藏

培訓受眾:

1,系統架構師、系統分析師、高級程序員、資深開發人員。

課程大綱:

隨著互聯網、移動互聯網和物聯網的發展,我們已經切實地迎來了一個大數據的時代。大數據是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合,對大數據的實時分析已經成為一個非常重要且緊迫的需求。目前對大數據的實時分析工具,業界公認最佳為Spark。Spark是一個開源集群運算框架,最初是由加州大學柏克利分校AMPLab所開發,Spark使用了內存內運算技術,在內存上的運算速度比Hadoop MapReduce的運算速度快上100倍,即便是在磁盤上運行也能快10倍。

為解決廣大系統設計人員深入研究與開發大數據挖掘和實時分析的需要,培訓中心特舉辦“Spark大數據挖掘工具MLlib實戰”培訓班,本課程主要講解Spark MLlib,Spark MLlib是一種高效、快速、可擴展的分布式計算框架,實現了常用的機器學習,如:聚類、分類、回歸等算法。講解各個算法的理論、詳細展示Spark源碼實現,最后均會通過實例進行解析實戰,幫助大家真正從理論到實踐全面掌握SparkMLlib分布式機器學習和大數據挖掘方法。具體事宜通知如下:

一、培訓對象

1,系統架構師、系統分析師、高級程序員、資深開發人員。

2,牽涉到大數據實時處理的數據中心運行、規劃、設計負責人。

3,政府機關,金融保險、移動和互聯網等大數據來源單位的負責人。

4,高校、科研院所牽涉到大數據與分布式數據處理的項目負責人。

二、學員基礎

1,對IT系統設計有一定的理論與實踐經驗。

2,對數據倉庫與大數據實時處理有一定的基礎知識。

三、師資

由業界知名云計算專家親自授課:

楊老師?? 主要研究網絡信息分析以及云計算相關技術,長期從事通信網管系統、網絡信息處理、商務智能(BI)以及電信決策支持系統的研究開發工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發經驗。

四、培訓要點:

互聯網點擊數據、傳感數據、日志文件、具有豐富地理空間信息的移動數據和涉及網絡的各類評論,成為了海量信息的多種形式。當數據以成百上千TB不斷增長的時候,我們在內部交易系統的歷史信息之外,需要一種基于大數據實時分析的決策模型和技術支持。

大數據通常具有:數據體量(Volume)巨大,數據類型(Variety)繁多,價值(Value)密度低,處理速度(Velocity)快等四大特征。如何有效管理和高效處理這些大數據已成為當前亟待解決的問題。大數據實時處理意味著更嚴峻的挑戰,更好地管理和處理這些數據也將會獲得意想不到的收獲。

Spark生態系統(BDAS項目)已經發展成一個,包含多個子項目的集合,包括Spark SQL、Spark Streaming、GraphX、MLlib等,本課程主要講解Spark MLlib,Spark MLlib是一種高效、快速、可擴展的分布式計算框架;實現了常用的機器學習,如:聚類、分類、回歸等算法。本次培訓將循序漸進從Spark的基礎知識、矩陣向量的基礎知識開始,然后再透徹講解各個算法的理論、詳細展示Spark源碼實現,最后均會通過實例進行解析實戰,幫助大家真正從理論到實踐全面掌握Spark MLlib分布式機器學習和數據挖掘方法。

本課程教學過程中還提供了案例分析來幫助學員了解如何用MLLib工具來解決具體的問題,并介紹了從大數據中挖掘出有價值的信息的關鍵。

本課程不是一個泛泛的理論性、概念性的介紹課程,而是針對問題討論解決方案的深入課程。教師對于上述領域有深入的理論研究與實踐經驗,在課程中將會針對這些問題與學員一起進行研究,在關鍵點上還會在實驗環境中演示、實踐,以加深對于這些解決方案的理解。通過本課程學習,希望推動Spark相關的項目開發上升到一個新水平。

五、培訓內容

第一講 Spark大數據實時處理技術

? 1)大數據處理技術

? 2)Spark實時處理技術

? 3)Spark生態系統BDAS

? 4)Spark架構分析

第二講 Spark安裝配置及監控

? 1)Ubuntu環境的準備

? 2)Hadoop2.X和Scala

? 3)搭建Spark開發環境

? 4)Idea編譯和運行

? 5)Spark監控管理

第3講 Scala編程語言和分布式計算模型

? 1) Scala編程語言

? 2) 操作基本數據類型

? 3)Spark計算模型和RDD

? 4)Transformation及Actions算子

? 5)Spark MLlib矩陣向量?

第四講 Spark MLlib線性回歸和邏輯回歸算法

? 1)線性回歸算法

? 2)線性回歸代碼實例

? 3)邏輯回歸算法

? 4)邏輯回歸回歸代碼實例

? 5)線性回歸和邏輯回歸代碼實操

第五講 Spark MLlib貝葉斯分類算法

? 1)? 貝葉斯分類算法原理

? 2)?Spark貝葉斯分類源碼

? 3)?Spark貝葉斯分類代碼示例

? 4)? 貝葉斯分類代碼實操

第六講 Spark MLlib決策樹算法

? 1)? 決策樹算法原理

? 2)?Spark決策樹算法源碼

? 3)?Spark決策樹算法代碼示例

? 4)? 決策樹代碼實操

第七講 Spark MLlib聚類算法

? 1)? K-Means聚類算法原理

? 2)?Spark K-Means聚類算法源碼

? 3)?SparkK-Means聚類代碼示例

? 4)? 聚類算法代碼實操

第八講 Spark MLlib關聯規則算法

? 1)?FPGrowth關聯規則算法原理

? 2)?FPGrowth關聯規則算法源碼

? 3)?FPGrowth關聯規則代碼示例

? 4)? 關聯規則代碼實操

第九講 Spark MLlib個性化推薦算法

? 1)? 協同過濾推薦算法原理

? 2)?Spark協同過濾推薦源碼

? 3)?Spark協同過濾推薦代碼示例

? 4)? 推薦代碼實操

第十講 Spark MLlib神經網絡算法

? 1)? 神經網絡算法原理

? 2)?Spark神經網絡算法源碼

? 3)?Spark神經網絡代碼示例

? 4)? 神經網絡代碼實操

六、培訓目標

1, 全面了解大數據實時處理技術的相關知識。

2,學習Spark的核心技術方法以及應用特征。

3,深入使用MLLib在大數據挖掘和實時分析中的使用。

4,掌握MLlib相關機器學習和數據挖掘工具的使用。

七、培訓時間、地點

時間: 2017年3月2日-3月3日 ????????????地點:北京

八、證書

培訓結束,頒發中科院計算所職業培訓中心“Spark大數據挖掘工具Mllib實戰”結業證書。

九、費用

培訓費:5500元/人(含教材、證書、午餐、學習用具等)。住宿協助安排,費用自理。

本課程名稱: Spark大數據挖掘工具Mllib實戰

查看更多:互聯網/語言內訓課

Spark 大數據挖掘 Mllib 相關的最新課程
講師動態評分 與同行相比

授課內容與課綱相符00%

講師授課水平00%

服務態度00%

福建省36选7走势图
武汉麻将好友约房软件 悟空理财 陕西快乐十分开奖走 深市股票推荐 微乐贵阳捉鸡麻将下 羽毛球比赛视频 胜平负北单足球竞彩 股票行情实时查询000610 麻将技巧规则 中甲联赛积分榜 上海麻将清混碰安卓版 宁夏11选5规则 lol赛程 速配资 快三走势图河北省一定 高中生炒股赚4.5亿