当前位置: 首页 > news >正文

spark读取csv文件

测试spark读取本地和hdfs文件

from pyspark.sql import SparkSessionspark = SparkSession.builder \.appName("Example PySpark Script") \.getOrCreate()# 读取本地csv文件
df = spark.read.csv("/Users/xiaokkk/Desktop/local_projects/spark/intents.csv", header=True, inferSchema=True)
# 显示前几行数据
df.show(5)
# 读取HDFS的csv文件
df = spark.read.csv("hdfs://127.0.0.1:9001/data/intents.csv", header=True, inferSchema=True)
df.show(5)

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • [数据结构]红黑树之插入操作(RBTree)
  • 深圳又有5家企业高新企业资质被取消?
  • 3个恢复方法详解:iPhone手机快速找回备忘录
  • 大数据-122 - Flink Time Watermark Java代码测试实现Tumbling Window
  • 拥抱分布式云:云基础设施的下个新时代
  • 11、Django Admin启用对计算字段的过滤
  • [ios]准备好app后使用xcode发布ios操作
  • 用SpringBoot API实现识别pdf文件是否含有表格
  • AI建模——AI生成3D内容算法产品介绍与模型免费下载
  • 【人工智能/机器学习/机器人】数学基础-学习笔记
  • Z Product | AI教母李飞飞AI创业,4 个月估值达 10 亿美金,目标是使AI能够像人类一样理解和推理三维物理世界
  • 口语笔记——定语
  • 进程管理中的三态模型
  • 828华为云征文 | Flexus X实例与华为云EulerOS的Tomcat安装指南
  • 智能监测,守护未来:QY-19 GNSS位移监测站
  • JavaScript-如何实现克隆(clone)函数
  • 【402天】跃迁之路——程序员高效学习方法论探索系列(实验阶段159-2018.03.14)...
  • 【407天】跃迁之路——程序员高效学习方法论探索系列(实验阶段164-2018.03.19)...
  • 2019年如何成为全栈工程师?
  • canvas 五子棋游戏
  • co模块的前端实现
  • css布局,左右固定中间自适应实现
  • Fundebug计费标准解释:事件数是如何定义的?
  • Git的一些常用操作
  • Mysql5.6主从复制
  • Redis在Web项目中的应用与实践
  • 创建一个Struts2项目maven 方式
  • 解决iview多表头动态更改列元素发生的错误
  • 看域名解析域名安全对SEO的影响
  • 容器服务kubernetes弹性伸缩高级用法
  • 如何进阶一名有竞争力的程序员?
  • 十年未变!安全,谁之责?(下)
  • 什么软件可以剪辑音乐?
  • 为视图添加丝滑的水波纹
  • 小程序button引导用户授权
  •  一套莫尔斯电报听写、翻译系统
  • ​linux启动进程的方式
  • # 服务治理中间件详解:Spring Cloud与Dubbo
  • (11)工业界推荐系统-小红书推荐场景及内部实践【粗排三塔模型】
  • (Java入门)抽象类,接口,内部类
  • (TipsTricks)用客户端模板精简JavaScript代码
  • (超详细)2-YOLOV5改进-添加SimAM注意力机制
  • (七)Appdesigner-初步入门及常用组件的使用方法说明
  • (限时免费)震惊!流落人间的haproxy宝典被找到了!一切玄妙尽在此处!
  • (一)C语言之入门:使用Visual Studio Community 2022运行hello world
  • (转)jQuery 基础
  • (转)大型网站架构演变和知识体系
  • (转)详解PHP处理密码的几种方式
  • (转)自己动手搭建Nginx+memcache+xdebug+php运行环境绿色版 For windows版
  • .mp4格式的视频为何不能通过video标签在chrome浏览器中播放?
  • .NET Core/Framework 创建委托以大幅度提高反射调用的性能
  • .NET Framework 3.5中序列化成JSON数据及JSON数据的反序列化,以及jQuery的调用JSON
  • .NET:自动将请求参数绑定到ASPX、ASHX和MVC(菜鸟必看)
  • .NetCore+vue3上传图片 Multipart body length limit 16384 exceeded.
  • .net打印*三角形