SparkR下载安装配置教程

作者：云创智学|发布时间：2022-01-06 11:31:05.0|来源：云创智学

spark下载安装配置教程：

此安装步骤是Spark跑在Hadoop Yarn架构上的安装方式，如果是跑在独立的Spark环境上，请参照SparkR官网

（https://github.com/amplab-extras/ SparkR-pkg）。

1、安装依赖包：

install.packages("rJava")

yum install libcurl

yum install libcurl-devel install.packages("RCurl")

install.packages("devtools")

服务器需要安装maven服务（参照：

http://blog.csdn.net/zdnlp/article/details/7457596

2、安装SparkR包

library(devtools)

install_github("amplab-extras/SparkR-pkg", subdir="pkg")

USE_YARN=1 SPARK_YARN_VERSION=2.4.0 SPARK_HADOOP_VERSION=2.4.0 USE_MAVEN=1./install-dev.sh

3、Linux下加载R包

install.packages('Cairo', dependencies=TRUE,repos='http://cran. rstudio.com/')

在R或Rstudio中调用SparkR：

library(SparkR)

sc<-sparkR.init(master="local","RwordCount")

lines<- textFile(sc,"hdfs://XXXIP):8020/test/log.txt")

words <-flatMap(lines,function(line)

{strsplit(line,",")[[1]]}

)

count(words)

SparkR下载安装配置教程

作者：云创智学|发布时间：2022-01-06 11:31:05.0|来源：云创智学

友情链接

关于云创

联系我们

SparkR下载安装配置教程

作者：云创智学|发布时间：2022-01-06 11:31:05.0|来源：云创智学

推荐课程

大数据与人工智能就业初级班

大数据与人工智能就业高级班

大数据与人工智能就业中级班

人工智能导论

人工智能图像处理应用

大数据分析挖掘实训课

大数据实战能力提升

ChatGPT应用教学

大数据实战能力提升+金牌服务

云计算职业技能竞赛初级课程（视频资源）

大数据平台技术

大数据应用实训工程实战

云计算职业技能竞赛中级课程（带实验平台实战资源）

云计算职业技能竞赛高级资源增强包

云计算职业技能竞赛中级资源增强包

云计算职业技能竞赛初级资源增强包

云计算职业技能竞赛初级课程/（带实验平台实战资源）

友情链接

关于云创

联系我们