当前位置: 首页 > news >正文

[Spark、hadoop]spark Streaming的核心DStream

目录

Spark Streaming的核心是DStream

一、DStream简介

二.DStream编程模型

三.DStream转换操作


Spark Streaming的核心是DStream

一、DStream简介

1.Spark Streaming提供了一个高级抽象的流,即DStream(离散流)。

2.DStream的内部结构是由一系列连续的RDD组成,每个RDD都是一小段由时间分隔开来的数据集。

二.DStream编程模型

三.DStream转换操作

transform()

1.在3个节点启动zookeeper集群服务

$ zkServer.sh start

2.启动kafka(3个节点都要)

$ /opt/module/kafka/bin/kafka-server-start.sh  /opt/module/kafka/config/server.properties

3.克隆会话,jps查看是否有Kafka(3个节点)

 

4.进入/etc/resolv.conf加入如下内

vi resolv.conf

Nameserver 114.114.114.114

 

5.下载nc

$ yum install nc

6.启动服务端且监听Socket服务,并输入I am learning spark streaming now

$ nc -lk 9999

I am learning spark streaming now(回车)

7.创建Maven项目, 打开右上角的Fileànewàproject

8.选择mavenànext

 

 

9.填写groupld、artifctldànext

10.添加依赖

<dependencies>

    <dependency>

        <groupId>org.scala-lang</groupId>

        <artifactId>scala-library</artifactId>

        <version>2.11.8</version>

    </dependency>

    <dependency>

        <groupId>org.apache.spark</groupId>

        <artifactId>spark-core_2.11</artifactId>

        <version>2.0.2</version>

    </dependency>

    <!--引入sparkStreaming依赖-->

    <dependency>

        <groupId>org.apache.spark</groupId>

        <artifactId>spark-streaming_2.11</artifactId>

        <version>2.0.2</version>

    </dependency>

    <dependency>

        <groupId>mysql</groupId>

        <artifactId>mysql-connector-java</artifactId>

        <version>5.1.38</version>

    </dependency>

    <!--引入sparkstreaming整合kafka的依赖-->

    <dependency>

        <groupId>org.apache.spark</groupId>

        <artifactId>spark-streaming-kafka-0-8_2.11</artifactId>

        <version>2.0.2</version>

    </dependency>

</dependencies>



<build>

    <sourceDirectory>src/main/scala</sourceDirectory>

    <testSourceDirectory>src/test/scala</testSourceDirectory>

</build>

 

11 在main目录下创建scala文件,右击ànewàdirectory,命名为Scala

 

12 右击Scala文件,选择【Mark Directory as】à【sources root】表示将文件夹标记为资源文件夹类型(存放项目源码文件)

13 同样在test目录下创建scala文件,右击ànewàdirectory,命名为Scala

 

14 右击Scala文件,选择【Mark Directory as】à【test sources root】表示将文件夹标记为测试资源文件夹类型(存放开发中测试的源码文件)

15 右击main下的Scala文件先创建一个package并命名为cn.itcast 

 

16 编写TransformTest.Scala

注意红框内容!!!

   

17 运行程序,可以看到控制台输出结果

 

UpdateStateKey()

1 编写UpdateStateKeyTest.scala

注意红框内容!!!

2 运行程序并在master 9999 端口不断输入单词,观察到控制台输出内容

$ nc -lk 9999

Hadoop spark itcast(回车)

Spark itcast

相关文章:

  • 【Vue】父子组件通信
  • API接口开发其实特简单,Python Flask Web 框架教程来了
  • SpringMVC03之拦截器和JSR303
  • 索引失效案例
  • 机器学习笔记 - Albumentations库实现的图像增强功能一览
  • 软考-存储系统
  • 大学生网页设计制作作业实例代码 (全网最全,建议收藏) HTML+CSS+JS
  • GAN Step By Step -- Step4 CGAN
  • HackerRank 算法刷题笔记(一),基于Go语言
  • 【Linux篇】第十三篇——信号(概念+信号的产生+阻塞信号+捕捉信号)
  • Android Jetpack系列之MVI架构
  • 十分钟之内实现stack和queue?容器适配器是什么?priority_queue不是队列?
  • 基于Keras实战项目-猫狗熊猫分类大战
  • 基于 Echarts + Python Flask 动态实时大屏( 附代码)
  • 并查集原理及模拟实现
  • JS 中的深拷贝与浅拷贝
  • $translatePartialLoader加载失败及解决方式
  • [iOS]Core Data浅析一 -- 启用Core Data
  • gops —— Go 程序诊断分析工具
  • interface和setter,getter
  • javascript数组去重/查找/插入/删除
  • JDK9: 集成 Jshell 和 Maven 项目.
  • Laravel Mix运行时关于es2015报错解决方案
  • Making An Indicator With Pure CSS
  • NLPIR语义挖掘平台推动行业大数据应用服务
  • Python实现BT种子转化为磁力链接【实战】
  • quasar-framework cnodejs社区
  • React的组件模式
  • SpringBoot 实战 (三) | 配置文件详解
  • Vue 2.3、2.4 知识点小结
  • 番外篇1:在Windows环境下安装JDK
  • 官方新出的 Kotlin 扩展库 KTX,到底帮你干了什么?
  • 汉诺塔算法
  • 解决jsp引用其他项目时出现的 cannot be resolved to a type错误
  • 精彩代码 vue.js
  • 每天一个设计模式之命令模式
  • gunicorn工作原理
  • ​Base64转换成图片,android studio build乱码,找不到okio.ByteString接腾讯人脸识别
  • ​MPV,汽车产品里一个特殊品类的进化过程
  • ​香农与信息论三大定律
  • #162 (Div. 2)
  • #中国IT界的第一本漂流日记 传递IT正能量# 【分享得“IT漂友”勋章】
  • (1/2)敏捷实践指南 Agile Practice Guide ([美] Project Management institute 著)
  • (Java)【深基9.例1】选举学生会
  • (pytorch进阶之路)CLIP模型 实现图像多模态检索任务
  • (附源码)springboot优课在线教学系统 毕业设计 081251
  • (原創) 人會胖會瘦,都是自我要求的結果 (日記)
  • (原創) 如何安裝Linux版本的Quartus II? (SOC) (Quartus II) (Linux) (RedHat) (VirtualBox)
  • (转)ObjectiveC 深浅拷贝学习
  • (转)PlayerPrefs在Windows下存到哪里去了?
  • .gitattributes 文件
  • .L0CK3D来袭:如何保护您的数据免受致命攻击
  • .net 8 发布了,试下微软最近强推的MAUI
  • .NET Core实战项目之CMS 第一章 入门篇-开篇及总体规划
  • .net 获取url的方法