当前位置: 首页 > news >正文

[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子

[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子

from pyspark.sql.types import *

schema = StructType( [ StructField("age",IntegerType(),True),
StructField("name",StringType(),True),
StructField("pcode",StringType(),True) ] )

myrdd = sc.parallelize([(40,"Abram","01601"),(16,"Lucia","87501")])

mydf = sqlContext.createDataFrame(myrdd,schema)

mydf.limit(5).show()

+---+-----+-----+
|age| name|pcode|
+---+-----+-----+
| 40|Abram|01601|
| 16|Lucia|87501|
+---+-----+-----+

 

相关文章:

  • 使用SQLite做本地数据缓存的思考
  • 与Brian Goetz聊Java的模式匹配
  • 感叹人生
  • Flash Builder 4.7 正式版下载、破解
  • 苹果开发者账号的区别,发布方式In-House和Ad Hoc区别
  • Safari on Windows已可良好支持中文!
  • chrome 图片助手下载
  • 智能社官网顶部导航实现demo
  • Azure Stack运维工具Azure Stack Tools的使用及实战
  • 2015年灾害脆弱性分析报告
  • iOS:延迟加载和上拉刷新/下拉加载的实现
  • Jetty总览
  • JS数据类型的转换规则
  • BusyBox ifup udhcpc后台运行
  • JavaScript:综合案例---房贷计算器的实现
  • 【每日笔记】【Go学习笔记】2019-01-10 codis proxy处理流程
  • 78. Subsets
  • C++回声服务器_9-epoll边缘触发模式版本服务器
  • classpath对获取配置文件的影响
  • JAVA 学习IO流
  • JavaScript中的对象个人分享
  • open-falcon 开发笔记(一):从零开始搭建虚拟服务器和监测环境
  • overflow: hidden IE7无效
  • Sass 快速入门教程
  • supervisor 永不挂掉的进程 安装以及使用
  • 从零开始的无人驾驶 1
  • 从重复到重用
  • 基于阿里云移动推送的移动应用推送模式最佳实践
  • 技术:超级实用的电脑小技巧
  • 解析带emoji和链接的聊天系统消息
  • 利用阿里云 OSS 搭建私有 Docker 仓库
  • 驱动程序原理
  • 容器化应用: 在阿里云搭建多节点 Openshift 集群
  • 如何编写一个可升级的智能合约
  • 通过git安装npm私有模块
  • 想使用 MongoDB ,你应该了解这8个方面!
  •  一套莫尔斯电报听写、翻译系统
  • 主流的CSS水平和垂直居中技术大全
  • Oracle Portal 11g Diagnostics using Remote Diagnostic Agent (RDA) [ID 1059805.
  • Android开发者必备:推荐一款助力开发的开源APP
  • 说说我为什么看好Spring Cloud Alibaba
  • ​马来语翻译中文去哪比较好?
  • !!java web学习笔记(一到五)
  • #QT(TCP网络编程-服务端)
  • #单片机(TB6600驱动42步进电机)
  • #微信小程序(布局、渲染层基础知识)
  • (12)Linux 常见的三种进程状态
  • (13)[Xamarin.Android] 不同分辨率下的图片使用概论
  • (39)STM32——FLASH闪存
  • (vue)el-checkbox 实现展示区分 label 和 value(展示值与选中获取值需不同)
  • (板子)A* astar算法,AcWing第k短路+八数码 带注释
  • (第61天)多租户架构(CDB/PDB)
  • (三分钟了解debug)SLAM研究方向-Debug总结
  • (转)Android中使用ormlite实现持久化(一)--HelloOrmLite
  • (转)mysql使用Navicat 导出和导入数据库