当前位置: 首页 > news >正文

windows安装spark

在 Windows 上安装 Spark 并进行配置需要一些步骤,包括安装必要的软件和配置环境变量。以下是详细的步骤指南:

步骤一:安装 Java

  1. 下载和安装 Java Development Kit (JDK)

    • 到 Oracle JDK 下载页面 或 OpenJDK 下载页面 下载适合你系统的 JDK。
    • 安装 JDK,记住安装路径。
  2. 配置环境变量

    • 右键点击“此电脑”或“计算机”,选择“属性”。

    • 点击“高级系统设置”。

    • 点击“环境变量”。

    • 在“系统变量”下,点击“新建”,然后添加以下内容:

      • 变量名:JAVA_HOME
      • 变量值:JDK 安装路径(例如:C:\Program Files\Java\jdk-11.0.10
    • 找到 Path 变量,选择它并点击“编辑”。在变量值的末尾添加以下内容:%JAVA_HOME%\bin

步骤二:安装 Hadoop

  1. 下载 Hadoop 二进制文件

    • 到 Hadoop 官方网站 下载最新的二进制发行版,例如 hadoop-3.3.1.tar.gz
    • 解压缩文件到你的本地目录,例如 C:\hadoop-3.3.1
  2. 配置 Hadoop 环境变量

    • 回到“环境变量”窗口,点击“新建”,然后添加以下内容:

      • 变量名:HADOOP_HOME
      • 变量值:Hadoop 安装路径(例如:C:\hadoop-3.3.1
    • 编辑 Path 变量,在变量值的末尾添加以下内容:%HADOOP_HOME%\bin

  3. 配置 Hadoop Winutils

    • 下载 Hadoop 的 winutils.exe 文件,可以从 GitHub 仓库 找到对应版本。
    • winutils.exe 放到 C:\hadoop-3.3.1\bin 目录下。

步骤三:安装 Apache Spark

  1. 下载 Spark

    • 到 Spark 官方网站 下载预编译的 Spark 版本,例如 spark-3.1.2-bin-hadoop3.2.tgz
    • 解压缩文件到你的本地目录,例如 C:\spark-3.1.2-bin-hadoop3.2
  2. 配置 Spark 环境变量

    • 回到“环境变量”窗口,点击“新建”,然后添加以下内容:

      • 变量名:SPARK_HOME
      • 变量值:Spark 安装路径(例如:C:\spark-3.1.2-bin-hadoop3.2
    • 编辑 Path 变量,在变量值的末尾添加以下内容:%SPARK_HOME%\bin

步骤四:验证安装

  1. 打开命令提示符

    • Win + R 打开“运行”窗口,输入 cmd 并按 Enter
  2. 验证 Java 安装

    • 在命令提示符中输入:java -version
    • 应该显示已安装的 Java 版本。
  3. 验证 Hadoop 安装

    • 在命令提示符中输入:hadoop version
    • 应该显示已安装的 Hadoop 版本。
  4. 验证 Spark 安装

    • 在命令提示符中输入:spark-shell
    • 应该启动 Spark Shell 并显示 Spark 版本和其他信息。

步骤五:运行 Spark 示例

  1. 在命令提示符中
    • 进入 Spark 安装目录,例如:cd C:\spark-3.1.2-bin-hadoop3.2
    • 运行 Spark 示例:bin\spark-submit --class org.apache.spark.examples.SparkPi examples\jars\spark-examples_2.12-3.1.2.jar 10
    • 这将运行 Spark Pi 示例并输出结果。

通过以上步骤,你已经在 Windows 系统上成功安装并配置了 Spark,可以开始进行分布式数据处理和分析任务。如果在安装过程中遇到问题,请确保每一步的环境变量配置和软件版本匹配。

相关文章:

  • Mysql特殊用法分享
  • platformio烧写STC8H1K08单片机程序失败:Serial port error: read timeout
  • 探索设计模式——单例模式详解
  • matplotlib 创建多个子图
  • TWM论文阅读笔记
  • ChatTTS 推荐及使用说明
  • Spring框架的最新进展:2023年Spring Boot和Spring Cloud功能更新
  • 数据分析的Excel基础操作
  • 节能减排如何替电子行业巨头降低成本
  • [程序员] 表达的能力
  • 在公司的一些笔记
  • 【ARM 安全系列介绍 3.7 -- SM4 对称加密算】
  • Java中的图形用户界面开发
  • 【MySQL进阶之路 | 高级篇】SQL执行过程
  • 用Vite基于Vue3+ts+DataV+ECharts开发数据可视化大屏,即能快速开发又能保证屏幕适配
  • [译]如何构建服务器端web组件,为何要构建?
  • express如何解决request entity too large问题
  • Fundebug计费标准解释:事件数是如何定义的?
  • iOS动画编程-View动画[ 1 ] 基础View动画
  • javascript面向对象之创建对象
  • js写一个简单的选项卡
  • linux安装openssl、swoole等扩展的具体步骤
  • mysql innodb 索引使用指南
  • MySQL数据库运维之数据恢复
  • overflow: hidden IE7无效
  • TCP拥塞控制
  • Vue2.x学习三:事件处理生命周期钩子
  • 从 Android Sample ApiDemos 中学习 android.animation API 的用法
  • 大型网站性能监测、分析与优化常见问题QA
  • 给初学者:JavaScript 中数组操作注意点
  • 开发基于以太坊智能合约的DApp
  • 离散点最小(凸)包围边界查找
  • 猫头鹰的深夜翻译:Java 2D Graphics, 简单的仿射变换
  • 判断客户端类型,Android,iOS,PC
  • 一些css基础学习笔记
  • 容器镜像
  • ​TypeScript都不会用,也敢说会前端?
  • #Datawhale AI夏令营第4期#AIGC文生图方向复盘
  • #includecmath
  • #java学习笔记(面向对象)----(未完结)
  • #nginx配置案例
  • #pragma multi_compile #pragma shader_feature
  • (el-Date-Picker)操作(不使用 ts):Element-plus 中 DatePicker 组件的使用及输出想要日期格式需求的解决过程
  • (Redis使用系列) Springboot 实现Redis消息的订阅与分布 四
  • (ZT)薛涌:谈贫说富
  • (独孤九剑)--文件系统
  • (附源码)springboot宠物医疗服务网站 毕业设计688413
  • (佳作)两轮平衡小车(原理图、PCB、程序源码、BOM等)
  • (蓝桥杯每日一题)平方末尾及补充(常用的字符串函数功能)
  • (理论篇)httpmoudle和httphandler一览
  • (三)c52学习之旅-点亮LED灯
  • (一)C语言之入门:使用Visual Studio Community 2022运行hello world
  • (一)认识微服务
  • *1 计算机基础和操作系统基础及几大协议
  • .NET CORE 第一节 创建基本的 asp.net core