当前位置: 首页 > news >正文

SQL 2005的SSIS与Oracle的迁移性能

项目中存在一部分数据迁移的工作,说白了就是从老的系统中将数据倒换的新的系统模型中,老系统的数据来源比较复杂多样,新的自然是Oracle9.2。

本来这也就是一次性工作,用SQL自然是最快的方式,不论是开发还是数据传输的速度。可是甲方偏偏要看到界面,希望这是一个成型的工具,没办法,甲方就是上帝。

公司原来也有一个迁移工具,可是只能适用于表对表的倒换,复杂一些无能为力,而且数据还巨慢,用过的人都是对它无语。

从新开发,不说花费和效果,光是时间也不行。没办法,只好看看现在流行的ETL的工具。

市场前列毋庸置疑,肯定是Informatia 和 DataStage.

Informatia没有,只好看看DataStage是否能适应现在的功能要求。不想,虽然是图形界面,可使用起来一点也不容易,而且安装后,Windows下居然不能脱离域环境,而且不是Server版本的Windows还不能运行Paralle Job。郁闷无比。

试了两天后,暂时放下。Microsoft的易用性比功能强大更吸引我。试试SQL Server 2005中的SSIS,号称企业级的ETL。

一用之后呢,没想还真有点喜欢上了它,从介绍的和界面上看一点也不比DataStage的功能少,性能,哈,下面就是我要说得了。

ETL工具最慢的部分都是L这一部分,按照一般的说法能占到总体时间的五分之四,所以这是关键。

测试也不算复杂,就是同样的数据抽取、转化、然后加载用不同的驱动分别跑一遍,目的库已经确定是Oracle,所以也没有太大的余地了。

在SSIS中,有两个驱动可以连接Oracle数据库,一个是Microsoft OLEDB Provider for Oracle,另外一个是Oracle Provider for OLEDB

不测不知道,还真长了不少见识。

892497.jpg

同一机器,同一数据源,同一结果,两者间还真有不少区别。

首先是速度(连续三次): Microsoft OLEDB Provider for Oracle 1分37 1分32 1分30

Oracle Provider for OLEDB 1分10 1分07 1分02

在速度上 Oracle Provider for OLEDB 基本符合 1分3万条左右,而Microsoft OLEDB Provider for Oracle 1分钟只有2万条左右。

照这样看,答案似乎也就出来了,Oracle Provider for OLEDB也就成了不二选择。

且慢,我还没有说明为什么选择25万条记录而不是别的数量的数据呢。

这就不得不说说内存的使用:未启动数据迁移时即停留在VS.Net设计界面时,内存已使用了790M左右,而我机器的物理内存也就896M。

运行开始后,25万条记录下Microsoft OLEDB Provider for Oracle 平均在1G左右,而Oracle Provider for OLEDB乖乖得不得了,铁定在1.25G以上,一次还在1.3G。更离谱的是,原数据表中共有近100万条记录,Microsoft OLEDB Provider for Oracle在内存峰值1.5G左右可以顺利完成,而Oracle Provider for OLEDB在内存使用一旦突破1.3G往上一些,就开始不停提示内存不足,不在安心的迁移数据了,或者干脆显示为红色,报一些莫名的错误。

这就让人两难了,一个速度快了那么50%,可确是一个内存消耗大户,有没有止境,我这破机器也无从得知。

另外一个速度慢,可却节俭持家,穷人也照顾到了,哈。感觉好这有点像Oracle和MS的企业风格,一个走高端,为了需要的指标可以不计成本,穷人靠边;另一个呢,还不错,虽然也越来越来不鸟没钱的人,可还做得不太显眼。

最后了,同样的数据源(Microsoft OLEDB Provider for Oracle驱动),将目的库换成SQL Server 2005,驱动为SQL Native Client,同样的数据数据转换,98.9万条记录中11.1万条入库,靠1分12完事,打开FastLoad,58秒搞定。而且都只是第一次运行,相信如果多运行几次后,结果应该更好。别说,自家孩子真就不一样,别人的家的没法比。

由于数据库驱动接触并不多,希望那个大虾指点一下,能帮忙给找一个Windows下Oracle驱动可以媲美与SQL Native Client的,先谢了。

相关文章:

  • 字体 用_做海报设计,不知道用什么字体?
  • 你的简历合适且有意义吗?
  • 数据库 自带_Kepware实现向数据库实时写入数据
  • 国际商务英语学习[十八]
  • opencv矩阵转eigen_numpy opencv matlab eigen SVD结果对比
  • 及cp含义_电气设计图纸中AL、AW、HAL等各种符号分别代表什么含义?
  • 对当前虚拟货币问题的思考(下)
  • 光照系统可以工作了。
  • 组播vlan_单播地址、组播地址、广播地址的优缺点
  • 打印表单_重磅更新 | 表单提交校验逻辑、轮播图纷纷上线
  • 期待能好好好好好好的睡一觉。
  • (转)编辑寄语:因为爱心,所以美丽
  • vue 前端设置允许跨域_Vue3.X脚手架项目设置proxy前端跨域
  • SSIS循环导入多个同表结构不同表明的excel
  • docker logs写入文件_Docker 日志的 10 大陷阱
  • [ JavaScript ] 数据结构与算法 —— 链表
  • 《用数据讲故事》作者Cole N. Knaflic:消除一切无效的图表
  • 【node学习】协程
  • Angular数据绑定机制
  • extjs4学习之配置
  • React-flux杂记
  • SpiderData 2019年2月13日 DApp数据排行榜
  • Spring Boot快速入门(一):Hello Spring Boot
  • Webpack4 学习笔记 - 01:webpack的安装和简单配置
  • 大快搜索数据爬虫技术实例安装教学篇
  • 规范化安全开发 KOA 手脚架
  • 区块链将重新定义世界
  • 适配mpvue平台的的微信小程序日历组件mpvue-calendar
  • 微信公众号开发小记——5.python微信红包
  • 微信开源mars源码分析1—上层samples分析
  • 学习ES6 变量的解构赋值
  • 一些关于Rust在2019年的思考
  • 自制字幕遮挡器
  • ​Z时代时尚SUV新宠:起亚赛图斯值不值得年轻人买?
  • #pragma once与条件编译
  • #我与Java虚拟机的故事#连载09:面试大厂逃不过的JVM
  • (06)Hive——正则表达式
  • (13)[Xamarin.Android] 不同分辨率下的图片使用概论
  • (175)FPGA门控时钟技术
  • (70min)字节暑假实习二面(已挂)
  • (C)一些题4
  • (floyd+补集) poj 3275
  • (附源码)spring boot智能服药提醒app 毕业设计 102151
  • (附源码)计算机毕业设计ssm基于B_S的汽车售后服务管理系统
  • **CI中自动类加载的用法总结
  • .NET BackgroundWorker
  • .net core 依赖注入的基本用发
  • .NET Entity FrameWork 总结 ,在项目中用处个人感觉不大。适合初级用用,不涉及到与数据库通信。
  • .Net 垃圾回收机制原理(二)
  • .NET中的十进制浮点类型,徐汇区网站设计
  • @configuration注解_2w字长文给你讲透了配置类为什么要添加 @Configuration注解
  • @private @protected @public
  • @SpringBootApplication 包含的三个注解及其含义
  • [ Linux Audio 篇 ] 音频开发入门基础知识
  • [Android Studio] 开发Java 程序