www.国产视频,一级看片免费视频囗交动图,波多野结衣高清无码中文456,中国一级特黄特级毛片,69mmWWW路cOm,天天摸夜夜摸黄片,aaaaaaaaa在线观看

spark編程指南 pdf 下載 最新軟件|熱門(mén)排行|軟件分類(lèi)|軟件專(zhuān)題|廠商大全

您的位置: 首頁(yè)教育教學(xué)電子圖書(shū) → spark編程指南中文版

spark編程指南中文版

spark編程指南中文版 網(wǎng)友評(píng)分:8
  • 軟件大?。?span>30.09M
  • 軟件語(yǔ)言:中文
  • 軟件類(lèi)型:國(guó)產(chǎn)軟件
  • 軟件類(lèi)別:免費(fèi)軟件 / 電子圖書(shū)
  • 更新時(shí)間:2018-01-22 14:47
  • 運(yùn)行環(huán)境:WinAll, WinXP, Win7, Win8, Win10
  • 軟件等級(jí):4級(jí)
  • 軟件廠商:
  • 官方網(wǎng)站:暫無(wú)
好評(píng):50%頂一個(gè)
壞評(píng):50踩一個(gè)

同類(lèi)相關(guān)軟件

軟件介紹

軟件標(biāo)簽: spark編程指南 spark教程

spark編程指南 pdf是一部非常實(shí)用的spark教程,這部電子書(shū)詳細(xì)講解了spark編程方法以及技巧,能夠讓你快速入門(mén),需要的朋友歡迎來(lái)綠色資源網(wǎng)免費(fèi)下載!

spark編程指南pdf

Spark編程指南電子書(shū)介紹

總體上來(lái)說(shuō),每個(gè)Spark應(yīng)用都包含一個(gè)驅(qū)動(dòng)器(driver)程序,驅(qū)動(dòng)器運(yùn)行用戶的main函數(shù),并在集群上執(zhí)行各種并行操作。

Spark最重要的一個(gè)抽象概念就是彈性分布式數(shù)據(jù)集(resilient distributed dataset – RDD),RDD是一個(gè)可分區(qū)的元素集合,其包含的元素可以分布在集群各個(gè)節(jié)點(diǎn)上,并且可以執(zhí)行一些分布式并行操作。RDD通常是通過(guò),HDFS(或者其他Hadoop支持的文件系統(tǒng))上的文件,或者驅(qū)動(dòng)器中的Scala集合對(duì)象,來(lái)創(chuàng)建或轉(zhuǎn)換得到;其次,用戶也可以請(qǐng)求Spark將RDD持久化到內(nèi)存里,以便在不同的并行操作里復(fù)用之;最后,RDD具備容錯(cuò)性,可以從節(jié)點(diǎn)失敗中自動(dòng)恢復(fù)數(shù)據(jù)。

Spark第二個(gè)重要抽象概念是共享變量,共享變量是一種可以在并行操作之間共享使用的變量。默認(rèn)情況下,當(dāng)Spark把一系列任務(wù)調(diào)度到不同節(jié)點(diǎn)上運(yùn)行時(shí),Spark會(huì)同時(shí)把每個(gè)變量的副本和任務(wù)代碼一起發(fā)送給各個(gè)節(jié)點(diǎn)。但有時(shí)候,我們需要在任務(wù)之間,或者任務(wù)和驅(qū)動(dòng)器之間共享一些變量。Spark提供了兩種類(lèi)型的共享變量:廣播變量和累加器,廣播變量可以用來(lái)在各個(gè)節(jié)點(diǎn)上緩存數(shù)據(jù),而累加器則是用來(lái)執(zhí)行跨節(jié)點(diǎn)的“累加”操作,例如:計(jì)數(shù)和求和。

Spark編程指南pdf目錄

1. Introduction

2. 快速上手

i. SparkShell

ii. 獨(dú)立應(yīng)用程序

iii. 開(kāi)始翻滾吧!

3. 編程指南

i. 引入Spark

ii. 初始化Spark

iii. SparkRDDs

i. 并行集合

ii. 外部數(shù)據(jù)集

iii. RDD操作

i. 傳遞函數(shù)到Spark

ii. 使用鍵值對(duì)

iii. Transformations

iv. Actions

iv. RDD持久化

iv. 共享變量

v. 從這里開(kāi)始

4. SparkStre

i. 一個(gè)快速的例子

ii. 基本概念

i. 關(guān)聯(lián)

ii. 初始化StreamingContext

iii. 離散流

iv. 輸入DStreams

v. DStream中的轉(zhuǎn)換

vi. DStream的輸出操作

vii. 緩存或持久化

viii. Checkpointing

ix. 部署應(yīng)用程序

x. 監(jiān)控應(yīng)用程序

iii. 性能調(diào)優(yōu)

i. 減少批數(shù)據(jù)的執(zhí)行時(shí)間

ii. 設(shè)置正確的批容量

iii. 內(nèi)存調(diào)優(yōu)

iv. 容錯(cuò)語(yǔ)義

5. SparkSQL

i. 開(kāi)始

ii. 數(shù)據(jù)源

i. RDDs

ii. parquet文件

iii. JSON數(shù)據(jù)集

iv. Hive表

iii. 性能調(diào)優(yōu)

iv. 其它SQL接口

v. 編寫(xiě)語(yǔ)言集成(Language-Integrated)的相關(guān)查詢(xún)

vi. SparkSQL數(shù)據(jù)類(lèi)型

6. GraphX編程指南

i. 開(kāi)始

ii. 屬性圖

iii. 圖操作符

TableofContentsiv. PregelAPI

v. 圖構(gòu)造者

vi. 頂點(diǎn)和邊RDDs

vii. 圖算法

viii. 例子

7. 部署

i. 提交應(yīng)用程序

ii. 獨(dú)立運(yùn)行Spark

iii. 在yarn上運(yùn)行Spark

8. 更多文檔

i. Spark配置

軟件截圖

下載地址 電腦版

用戶評(píng)論

熱門(mén)評(píng)論

最新評(píng)論

發(fā)表評(píng)論 查看所有評(píng)論(0)

昵稱(chēng):
請(qǐng)不要評(píng)論無(wú)意義或臟話,我們所有評(píng)論會(huì)有人工審核.
字?jǐn)?shù): 0/500 (您的評(píng)論需要經(jīng)過(guò)審核才能顯示)