当前位置: 首页 > news >正文

慢SQL!压垮团队的最后一根稻草!

这里写图片描述
来源 | 公众号 | 一名叫大蕉的程序员 | 作者 | 杨钊

原文地址:https://mp.weixin.qq.com/s/62fTZoAU_ThqA50v9iY1TQ


先说结论,我支持将逻辑写在Java等应用系统中!

背景:

今天只讨论一种应用模式,就是最普遍的,前端实时调用后端Web服务,服务端经过DB的增删改查作出响应的应用。至于离线数据分析,在线规则引擎模板执行,流式计算等不在本次讨论范畴。

一、重SQL还是重Java的开发场景演示

先看一个例子吧,需求是:查询出每个学生所在的城市名以及分数展示到前端。用经典的Controller、Service、DAO开发模式描述,设计数据库表如下:

这里写图片描述

(1)重SQL模式示例代码:

这里写图片描述

(2)重Java模式示例代码:

这里写图片描述
这里写图片描述
这里写图片描述

可以看到,使用重SQL的模式来进行开发确实很快很快,只需要把SQL开发出来基本就完事了,但是看着用重 Java 的模式开发,需要写一堆的代码,这么看来好像是 SQL 胜利一筹。

好,PD突然说了,我要把城市名为 “大蕉” 的,分数乘于2展示出来。握草,这个怎么搞??

(1)重SQL模式示例代码:

这里写图片描述

好了。。这个SQL已经变得很复杂了基本没法看了。。

(2)重 Java 模式示例代码:

这里写图片描述

咦好像改动也不多嘛。

这时候PD又来了我要把城市名为 “大蕉” ,并且城市Code小于10086的,分数乘于2展示出来。握草,完蛋了,之前全是SQL,这个需求要怎么搞??继续叠加上去继续 CASE WHEN?

还没想清楚呢,突然 DBA 电话飞过来了,兄dei你的SQL太慢了,现在把整个库拖垮了,你是不是没有加索引?

我:索引加了啊。。。难道是没走到?那是先解决慢SQL还是先开发需求呢?拆库是不可能了,逻辑这么死鬼复杂拆库完全没法跑啊,加CPU加内存啊 DBA大佬!!!

[DBA日报] 慢SQL 180+,已解决10。

又上了一个版本

[DBA日报] 慢SQL 200+,已解决15。

又上了一个版本

[DBA日报] 慢SQL 250+,已解决30。

慢慢的,开发和运营和DBA每天都疲劳于监控这些SQL。。。。

二、上述示例的思考

观察了一下,传统企业以及绝大部分转型中的企业的 Java 应用中,很神奇的是,他们的开发人员包括我自己以前,大家都非常非常希望使用一个 SQL 来完成所有的逻辑的编写,非常多企业更是把数据库的存储过程和数据库自定义函数来完成。

这些关于逻辑应该写在哪里的争论从来没有停止过,不仅仅发生在后端和数据库端,连前后端都经常会发生这种争论,现在只讨论后端和数据库端的纠结。

我将从这五个方面分别对比一下两种模式的异同:

  • 出现场景

  • 开发效率

  • 缺陷排查

  • 架构升级

  • 系统维护

三、出现场景

1、SQL

我们绝大多数的历史代码都是用存储过程来实现的啊,如果有新需求不往上面做的话,很难兼容原来的逻辑啊啊。

前面的人呢是这样写的,我来了看大家都这样写就这样写了。

2、Java

新应用嘛,我想怎么样写就怎样写。

监控和埋点写起来简单吖,排查问题可方便了。

前面的人呢是这样写的,我来了看大家都这样写就这样写了。

四、开发效率

1、SQL

这样写起来很快啊,而且写 Java 代码多难受啊,写 SQL 我自己在数据库开发环境跑一下结果正确我就直接丢到代码中提交了,多爽啊。

老实说,这样子确实会提高开发的效率,因为不用写那么多查库聚合的操作,一切都在 SQL 中搞定了。另一方面来看,这确实会让 Java 代码看起来很鸡肋,好像只是把数据从 web 层到数据层的一个管道而已,一切 if else 能写在 SQL 中的都写在 SQL 中了。

但是新需求来或者需求变更的时候,我经常要重新写SQL,如果变动不多我可能要改动到原来的 SQL,但是我又不敢改,所以只好 copy 重新写一个,改 SQL 的风险好大,一报错又要重启好难受。

2、Java

一次要写N个类,有点烦。

新需求来或者需求变更的时候,如果逻辑比较复杂,我直接抽成方法或者改成一些设计模式,维护起来效率还是可以接受的。

五、缺陷排查

1、SQL

开发排查问题的时候,除了看日志,直接把SQL和参数丢到 PL/SQL 或者 其他工具里跑一下,基本就能知道数据问题出现在哪了。测试同学在进行测试的时候,如果发现有不对的东西,直接跟开发同学一样的思路,把SQL 跑一下,问题基本就定位得七七八八了。

但是呢,一旦遇到跑 SQL 无法一眼看出问题的 bug 或者 SQL 实在是太长太长了的的时候,就蒙圈了。我曾经就维护了一个几千行的存储过程,一旦发生问题,排查问题的过程巨艰难。但是呢直接用一个数据库一个功能搞定所有功能未尝不是一件很爽的事情,因为关系型数据库实在是实在是太太太稳定了,一次编写永久运行。

2、Java

看日志看监控。

根据报错的代码位置 check 一下代码逻辑。

一些入参分支肉眼 check 不出来,只能远程 debug 慢慢看数据流向。

测试的同学基本无法帮忙 check 缺陷,只能靠程序的表现来判断。

六、架构升级

1、SQL

SQL 慢没关系,它稳定啊,慢就把机器垂直扩展一下好啦,加cpu,加内存,换SSD,加加加绝对可以解决事情的。

SQL 有各种索引和优化策略,说不定跑起来比我们自己写逻辑还快呢。

加加加,加内存加cpu垂直升级。也没有其他招数了,除了前置缓存,但是如果查询都很个性化SQL很复杂,前置缓存也基本没啥乱用。。。

如果你的逻辑全部写在 SQL 中,那完蛋了,你这个表基本就没法分表了,因为你的业务逻辑跟数据库的数据完整性是强耦合的,需要一切数据基本都在一个数据库中,这是一件很难受很难受的事情,不信你去问问那些所有业务逻辑全写在 SQL 中的小伙。

数据库中非常复杂的表关联会极大程度拖慢数据库处理每条 SQL 的平均时间,极大程度拖慢数据库 RT,降低了数据库的 RT ,如果逻辑都写在 SQL 中,那么只能进行垂直升级。因为一旦进行水平扩展,那么多机器的非常复杂的分布式表关联,RT 基本不是一个高并发的业务应用的能容忍的。

2、Java

如果是数据库瓶颈,加数据库机器,分库分表一下,应用层基本不用改,在DAO层进行路由一下。

如果是服务器cpu瓶颈,多加几台机器就好了。

如果还有瓶颈,增加一下查询缓存。

在应用快速发展的过程中一般都会分库分表的拆分或者自动水平扩展,这时候其实只需要数据库层面做好自己的数据迁移和同步就好了,对于业务层来说是完全无感知的。即使业务非常非常复杂,需要拆应用,其实也非常简单,只需要把对应的 DAO 层的操作拆分出去,换成 RPC 或者其他方式的调用就好了。

七、系统维护

1、SQL

旧SQL完全不敢动,来一个需求加一个 SQL。

慢SQL日益增加,应对疲乏。

2、Java

SQL写完一次基本不用动,来一个需求加一个方法聚合一下数据操作即可。

应用维护比较简单,只要监控做好了,定位到问题基本都能很快解决。

逻辑越来越复杂,没有好的开发框架的话,代码维护起来也是挺要命,因为完全不知道跑哪个分支去了。但是现在已经有很多优秀的开源框架来更好地维护代码了,比如 Spring 的全家桶。

八、怎么破!

旧的重 SQL 逻辑暂时不要动,新的逻辑都基于 Java 模式开发,先保证慢 SQL 不增加,旧的 SQL 稳定运行,毕竟业务稳定是第一要素。

如果业务初期需要非常非常快速开发,那么使用重 SQL 模式也是可以理解的,但是还是要抽时间重构成 Java 模式。

九、结论

我支持将逻辑写在 Java 等应用系统中。其实原因在上面基本描述完了,第一就是复杂 SQL 的表关联其实跟个人的能力有非常大的关系,如果一个 SQL 写得不好,那是极慢极慢的非常容易把整个数据库拖慢的。第二就是维护这些 SQL 也是一件很难受的事情,因为你完全不知道这个 SQL 背后的数据流转是怎样的,你只能根据自己的猜测去查看 SQL 中的 bug,Java 应用好歹还能 debug 一下还有打点看看数据不是?如果逻辑写在 Java 中那么其实你的 DAO 层只需要编写一次,但是可以永久使用,基本不会在这一层浪费很多的时间(用过 ibatis 的都知道改了 SQL 需要重启应用吧?)。第三就是逻辑都写在 SQL ,中对于分库分表和应用拆分来说是一件非常难受的事情,真的难受。

相关文章:

  • 2017年秋招美团Java程序员开发,看我如何拿到offer
  • Javascript中常用事件的命名
  • 阿里的面试官都喜欢问哪些问题?
  • 浅谈C语言中结构体的初始化
  • Spring AOP中的JDK和CGLib动态代理哪个效率更高?
  • 2016百度之星 - 初赛(Astar Round2A)
  • 为什么需要分布式配置中心?
  • 线上出故障了!我慌得一匹!教大家如何应对在线故障!
  • mysql远程访问cannot connect(10038) 问题解决的过程
  • Spring Cloud技术栈还没有学完!Hystrix又双叒叕停止更新了!
  • 2018年博客之星评选,需要您宝贵的一票!非常感谢!
  • 用私有构造器或者枚举类型强化Singleton 属性
  • 阿里分布式事务框架GTS(Seata)开源啦!
  • 完了!生产事故!几百万消息在消息队列里积压了几个小时!
  • [原创]java WEB学习笔记18:java EE 中的MVC 设计模式(理论)
  • [LeetCode] Wiggle Sort
  • [译]CSS 居中(Center)方法大合集
  • [译]如何构建服务器端web组件,为何要构建?
  • 0x05 Python数据分析,Anaconda八斩刀
  • HTTP--网络协议分层,http历史(二)
  • IndexedDB
  • JS学习笔记——闭包
  • js中forEach回调同异步问题
  • Linux下的乱码问题
  • node入门
  • 阿里云容器服务区块链解决方案全新升级 支持Hyperledger Fabric v1.1
  • 湖南卫视:中国白领因网络偷菜成当代最寂寞的人?
  • 主流的CSS水平和垂直居中技术大全
  • (delphi11最新学习资料) Object Pascal 学习笔记---第5章第5节(delphi中的指针)
  • (一)使用Mybatis实现在student数据库中插入一个学生信息
  • (原)本想说脏话,奈何已放下
  • (转)IIS6 ASP 0251超过响应缓冲区限制错误的解决方法
  • **PHP分步表单提交思路(分页表单提交)
  • ./configure、make、make install 命令
  • .halo勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .net CHARTING图表控件下载地址
  • .net wcf memory gates checking failed
  • .net 受管制代码
  • .net遍历html中全部的中文,ASP.NET中遍历页面的所有button控件
  • [android]-如何在向服务器发送request时附加已保存的cookie数据
  • [AutoSar]BSW_Memory_Stack_004 创建一个简单NV block并调试
  • [bbk5179]第66集 第7章 - 数据库的维护 03
  • [BZOJ 2142]礼物(扩展Lucas定理)
  • [CSS]浮动
  • [Eclipse] 详细设置护眼背景色和字体颜色并导出
  • [HJ73 计算日期到天数转换]
  • [linux] Key is stored in legacy trusted.gpg keyring
  • [MySQL FAQ]系列 -- 如何利用触发器实现账户权限审计
  • [OCR]Python 3 下的文字识别CnOCR
  • [Oh My C++ Diary]内联函数
  • [Prism]Composite Application Guidance for WPF(9)——命令
  • [Python学习笔记]Requests性能优化之Session
  • [RQNOJ 696] 【树形DP】
  • [Windows编程] 利用dxdiag获取用户机器硬件及OS信息
  • [多线程]多线程编程需要注意的问题|多进程