当前位置: 首页 > news >正文

大数据之Spark开发环境准备

文章目录

  • 前言
  • 一、开发环境准备
    • (一)前期准备
    • (二)PyCharm创建项目
  • 总结


前言

#博学谷IT学习技术支持#
之前的文章介绍了Spark环境的搭建和一些基础知识,接下来主要是进行入门案例的开发,以及Spark运行原理的记录和总结,开始学习之前了解下Spark环境搭建【环境搭建】和基础的知识【Spark基础】。

一、开发环境准备

正式开始开发之前需要准备好代码开发环境,开发环境搭建好才能进行入门案例的开发;

(一)前期准备

开发软件:PyCharm 2021.2.1
虚拟机:node1【IP地址为:192.168.88.161】
虚拟平台:VMware 15.5.2版本

(二)PyCharm创建项目

  1. 创建新项目,选择New Project
    在这里插入图片描述
  2. 左侧选项栏中选择【Pure Python】,并在右侧Location位置设置好本次项目存放的位置
    在这里插入图片描述
  3. 创建好项目后,创建以下文件夹,以便存放相关的文件
    在这里插入图片描述
  4. 由于该项目的代码放在带有PySpark运行环境的虚拟机中运行,所以在PyCharm中需要设定虚拟机的IP地址、端口以及虚拟机用于存放项目文件的路径;
    选择PyCharm软件左上角的【File】并点击,接着点击【Settings】进行设定
    在这里插入图片描述
  5. 在Setting界面选择界面左侧的【Python Interpreter】,接着需要设置右侧的【Python Interpreter】和【Path mappings】,这两个设置对应第6步,若已经设定好,直接从第7步往后接着看就可以了
    在这里插入图片描述
  6. 这一步指定Python编译器的路径,点击【Python Interpreter】右侧的设置按钮,会弹出【Add】和【Show All】两个选项,如果是第一次设定,直接选择【Add】即可,如果已经设定过,选择【Show All】并选择相对应的设定即可,该步骤直接演示【Add】的流程。
    在这里插入图片描述
    进入【Add】界面后,先选择左侧【SSH Interpreter】,然后在右侧填写Host的IP地址以及UserName,接着点击右下角的【Next】按钮,进入下一步。
    在这里插入图片描述
    进入密码填写界面,先填写Host的访问密码,记得勾选【Password】旁边的【Save password】,然后再点击右下角的【Next】按钮。
    在这里插入图片描述
    接着就是设定虚拟机上的Python的Interpreter,以及选择虚拟机上存储Spark代码的路径,最后点击右下角的【Finish】按钮就完成【Python Interpreter】的添加了
    在这里插入图片描述
    最后点击【OK】按钮就设置完成了。
    在这里插入图片描述
  7. PyCharm还要设置代码自动上传到装有Spark环境的虚拟机上,一有新代码就可以自动上传到虚拟机上。
    在这里插入图片描述

总结

本文主要是关于Spark开发环境的准备,PyCharm软件设定好可以提高代码开发的效率。

相关文章:

  • 什么是Java运算?Java运算好学吗?
  • abaqus子程序vumat安装使用
  • 【Java项目】Minio的安装部署以及SpringBoot整合Minio
  • 架构设计第一讲:架构设计相关面试题汇总
  • LeetCode笔记:Biweekly Contest 101
  • 【python实操】马上毕业了,你还不懂什么是守护线程、线程、进程?(附12306抢票程序-源代码)
  • Springboot整合rabbitmq并实现消息可靠性和持久性
  • ChatGPT可以作为一个翻译器吗?
  • 一文学会 Spring MVC 表单标签
  • 【联邦学习(Federated Learning)】- 横向联邦学习与联邦平均FedAvg
  • 免费一键生成原创文章-原创文章批量生成
  • 众人围剿,GPT-5招惹了谁
  • Spring Boot 3.0系列【19】核心特性篇之自定义Starter启动器
  • oracle中sql 正则怎么写?
  • 【5G RRC】NR测量Gap介绍
  • AHK 中 = 和 == 等比较运算符的用法
  • exports和module.exports
  • Joomla 2.x, 3.x useful code cheatsheet
  • JS变量作用域
  • Just for fun——迅速写完快速排序
  • Mysql优化
  • React+TypeScript入门
  • spark本地环境的搭建到运行第一个spark程序
  • Spring Cloud Alibaba迁移指南(一):一行代码从 Hystrix 迁移到 Sentinel
  • Vue.js源码(2):初探List Rendering
  • 彻底搞懂浏览器Event-loop
  • 分布式事物理论与实践
  • 跨域
  • 使用common-codec进行md5加密
  • ​ssh免密码登录设置及问题总结
  • #laravel 通过手动安装依赖PHPExcel#
  • #我与Java虚拟机的故事#连载13:有这本书就够了
  • $().each和$.each的区别
  • (1)(1.13) SiK无线电高级配置(五)
  • (2021|NIPS,扩散,无条件分数估计,条件分数估计)无分类器引导扩散
  • (3)STL算法之搜索
  • (C++)八皇后问题
  • (C语言)fgets与fputs函数详解
  • (C语言)深入理解指针2之野指针与传值与传址与assert断言
  • (安卓)跳转应用市场APP详情页的方式
  • (分享)一个图片添加水印的小demo的页面,可自定义样式
  • (附程序)AD采集中的10种经典软件滤波程序优缺点分析
  • (附源码)计算机毕业设计高校学生选课系统
  • (六)库存超卖案例实战——使用mysql分布式锁解决“超卖”问题
  • (一) springboot详细介绍
  • (转)Android学习笔记 --- android任务栈和启动模式
  • (转)GCC在C语言中内嵌汇编 asm __volatile__
  • (转)jQuery 基础
  • *ST京蓝入股力合节能 着力绿色智慧城市服务
  • .bat批处理(六):替换字符串中匹配的子串
  • .NET Micro Framework 4.2 beta 源码探析
  • .NET Micro Framework初体验
  • .NET/C# 在代码中测量代码执行耗时的建议(比较系统性能计数器和系统时间)
  • .NET企业级应用架构设计系列之技术选型
  • .Net下C#针对Excel开发控件汇总(ClosedXML,EPPlus,NPOI)