当前位置: 首页 > news >正文

加载指定 having lines separator 时max_data_processor 不起作用

问题现象
当使用文本加载方式时,行分隔符默认为 '\n' 。如果某列数据可能包含了行分隔符,
则需要在 SQL 中输入 'having lines separator' 子句,同时需要输入 'enclosed by' 指定字
段包围符。加载 sql 如下:
load data infile 'sftp://gbase:gbase@192.168.105.100//home/gbase/test.txt' into t
able test data_format 3 having lines separator fields terminated by '|' enclose
d by '"';
当 在 load sql 中 指 定 max_data_processors ,或者在数据库中修改参数
gcluster_loader_max_data_processors
加 载 时 , 通 过 查 看 系 统 表
information_schema.load_satus 发现只有一个 node 节点参与数据分发处理,指定的
参数不起作用,加载性能较慢。
原因分析 GBase 8a MPP Cluster FAQ FAQ
文档版本(2021-04-02) 南大通用数据技术股份有限公司
92
这个现象在当前产品中是正常的约束,因为列数据中不包含有行分隔符时,可以将
数据文件按照行进行分块切分,发送给多个 node 去进行数据处理分发。
而列数据中包含有行分隔符时,无法直接将数据文件按照行分隔符分块切分,需要
考虑每个行分隔符前后的包围符是否成对匹配,这个过程是无法并行操作的。
解决方法
建议从数据来源上杜绝这种列数据中包含有行分隔符的情况,比如可以自行指定多
字节行分隔符。

相关文章:

  • 高薪程序员面试题精讲系列150之电商专题(上)-你们的电商项目有什么特色?是B2B还是B2C、还是C2C的?直播电商你了解吗?
  • kafka是啥?虽然很难学,但是实验入门很简单
  • MySQL8.0 索引优化-invisible index
  • 基于java仓库管理系统计算机毕业设计源码+系统+lw文档+mysql数据库+调试部署
  • C++对象内存故事, 一个对象是如何由子对象来构成的?
  • 软件过程模型(软件开发模型)
  • 138-基于51单片机的教室智能照明灯控制系统光控人数检测(原理图+源程序+元件清单+PCB)
  • PIE-Engine教程—中国降水分布可视化加载以2018年为例(含图例添加)
  • C#基础进阶
  • 国际聋人周 | 聋健人群无界融合,看见手语的力量
  • SCI英文文献模板/查看SCI论文分区/tex模板的使用
  • AlphaFold、嗜睡机制、量子通信荣获2023科学突破奖
  • GeoTrust品牌OV型通配符SSL证书
  • 第312场周赛
  • openGauss学习笔记- - -初始与使用技巧
  • CentOS7简单部署NFS
  • ES6语法详解(一)
  • exports和module.exports
  • IDEA常用插件整理
  • jquery ajax学习笔记
  • linux学习笔记
  • Mysql数据库的条件查询语句
  • Node项目之评分系统(二)- 数据库设计
  • SpingCloudBus整合RabbitMQ
  • vue-router的history模式发布配置
  • Web设计流程优化:网页效果图设计新思路
  • windows下mongoDB的环境配置
  • Work@Alibaba 阿里巴巴的企业应用构建之路
  • zookeeper系列(七)实战分布式命名服务
  • 从零开始的webpack生活-0x009:FilesLoader装载文件
  • 讲清楚之javascript作用域
  • 开源SQL-on-Hadoop系统一览
  • 理解IaaS, PaaS, SaaS等云模型 (Cloud Models)
  • 巧用 TypeScript (一)
  • 使用API自动生成工具优化前端工作流
  • 小程序上传图片到七牛云(支持多张上传,预览,删除)
  • 学习笔记:对象,原型和继承(1)
  • 异步
  • “十年磨一剑”--有赞的HBase平台实践和应用之路 ...
  • ​LeetCode解法汇总2808. 使循环数组所有元素相等的最少秒数
  • #宝哥教你#查看jquery绑定的事件函数
  • $.ajax()方法详解
  • (pt可视化)利用torch的make_grid进行张量可视化
  • (二十五)admin-boot项目之集成消息队列Rabbitmq
  • (附源码)计算机毕业设计ssm-Java网名推荐系统
  • (含react-draggable库以及相关BUG如何解决)固定在左上方某盒子内(如按钮)添加可拖动功能,使用react hook语法实现
  • (九)One-Wire总线-DS18B20
  • (免费分享)基于springboot,vue疗养中心管理系统
  • (原+转)Ubuntu16.04软件中心闪退及wifi消失
  • (原創) 博客園正式支援VHDL語法著色功能 (SOC) (VHDL)
  • (转)程序员疫苗:代码注入
  • .net core 源码_ASP.NET Core之Identity源码学习
  • .NET DataGridView数据绑定说明
  • .NET 应用启用与禁用自动生成绑定重定向 (bindingRedirect),解决不同版本 dll 的依赖问题
  • .net安装_还在用第三方安装.NET?Win10自带.NET3.5安装