当前位置：首页 > news >正文

MySQL周期表管理太繁琐，通过Python自定义工具方法优雅解决

news 来源：原创 2024/5/5 21:55:52

这是学习笔记的第 2149 篇文章

最近的数据库小问题还是零零散散会出现，通过这些零星的小问题可以发现很多潜在问题的端倪。所以准备在一些技术储备方面要多投入一些，把这些基础打扎实。

比如对于按照时间维度的日表，我们在此成为周期表，对于它的管理看起来很简单，实际上会有很多潜在的问题，对此我会提供一些改进的思路。

比如日表test_data_20190101，它存储的是1月1日的数据，这种数据模型中的数据基本都是流水型/日志数据，所以数据不需要保留太长时间，在用到的时候够查就可以了，一般设置为1个月，那么test_data表在20190201的时候就删除20190101的数据了，这里就存在一系列的问题，核心思想就是：怎么保证这个过程是可控的。通常会出现很多方面的问题:

1)周期表没有生成，业务写入失败

2）过期周期表没有按时清理，磁盘空间报警

3）误删除周期表，导致数据无法回复

4）管理多个周期表，没有提醒的机制，导致人为跟进出错概率高

5）周期表创建了，可能权限没有刷新

6）周期表创建了，但是业务压根没有用到，数据量一直是0

7）周期表创建了，但是不连续，比如有的月份是31天，只创建了30天

当然还有很多，对此我的目标是把这些潜在的问题都解决掉，转换为一种闭环的操作。

所以看起来一个很简单的操作，在引入一个特定的场景后（目前维护的有60多张周期表，时间范围各不相同），就会发现要处理的问题实在是太多了。

从功能设计上，有下面的一些小的功能需要完善和补充：

生成周期表的创建语句
检测失效的周期表
转置失效的周期表
删除失效的周期表
周期表阈值检测
数据是否存在的检测
周期表连续性检查
周期表可访问预检查
周期表自动创建

对于里面的一个功能，如何检测周期表是否连续，出发点是很好的，但是在实现的时候发现比想象的要复杂一些。

在今天的总结中，我的最大收获就是想明白，重视设计，写出来一二三，然后按照设计的思路，完成之后就会事半功倍。

简单的梳理，我发现时间管理方面有很多重复的功能，如果每次都去单独处理，其实还是挺繁琐的，索性写了一堆的工具方法。

N个小时后的时间
N个小时前的时间
今天前的第N天
今天后的第N天
今天以前的N天列表
今天以后的N天列表
指定时间范围的时间列表
判断日期是否在日期范围之内
两个日期列表相同的日期
两个日期列表差异的日期

640?wx_fmt=jpeg

相关的部分代码如下：

# 得到几个小时前的时间

def beforeHours2Date(hours, date_format='%Y-%m-%d %H:%M:%S'):	
    hours = int(hours)	
    t = time.time() - hours*60*60	
    t = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(t))	
    return t

# 得到几个小时后的时间

def afterHours2Date(hours, date_format='%Y-%m-%d %H:%M:%S'):	
    hours = int(hours)	
    t = time.time() + hours*60*60	
    t = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(t))	
    return t

# 得到几天前的日期

def beforeDays2Date(days, date_format='%Y-%m-%d %H:%M:%S'):	
    days = int(days)	
    t = time.time() - days*60*60*24	
    t = time.strftime('%Y-%m-%d', time.localtime(t))	
    return t

# 得到几天后的日期

def afterDays2Date(days, date_format='%Y-%m-%d %H:%M:%S'):	
    days = int(days)	
    t = time.time() + days*60*60*24	
    t = time.strftime('%Y-%m-%d', time.localtime(t))	
    return t

#得到几天前到今天的日期列表

def beforeDays2Datelist(n):	
    before_n_days = []	
    for i in range(1, n + 1)[::-1]:	
        before_n_days.append(str(datetime.date.today() - datetime.timedelta(days=i)))	
    return before_n_days

# 得到今天到几天后的日期列表

def afterDays2Datelist(n):	
    before_n_days = []	
    for i in range(1, n + 1)[::-1]:	
        before_n_days.append(str(datetime.date.today() + datetime.timedelta(days=i) ))	
    return before_n_days

# 根据起始和截止日期得到日期列表

def get_datelist_by_start_end(datestart,dateend):	
    data_list_arr = []	
    datestart = str_to_date_day(datestart)	
    dateend = str_to_date_day(dateend)	
    data_list_arr.append(date_day_to_str(datestart))	
    while datestart < dateend:	
        datestart += datetime.timedelta(days=1)	
        next_day = datestart.strftime('%Y-%m-%d')	
        data_list_arr.append(next_day)	
    return data_list_arr

# 转换字符串为时间

def str_to_date_time(time_str):	
    return datetime.datetime.strptime(time_str, '%Y-%m-%d %H:%M:%S')

# 转换时间为字符串

def date_time_to_str(time1):	
    return time1.strftime("%Y-%m-%d %H:%M:%S")

# 转换字符串为日期

def str_to_date_day(time_str):	
    return datetime.datetime.strptime(time_str, '%Y-%m-%d')

# 转换日期为字符串

def date_day_to_str(time1):	
    return time1.strftime("%Y-%m-%d")

# 判断日期是否在指定的列表中

def date_in_range(date_str,start_date,end_date):	
    return date_str in get_datelist_by_start_end(start_date,end_date)

# 得到指定时间范围内不连续的日期

def discontinuous_date_in_list(start_date,end_date,date_list):	
    defined_list = get_datelist_by_start_end(start_date, end_date)	
    return list(set(defined_list).difference(set(date_list)))

比如我的一个需求，得到不连续的日期，调用函数discontinuous_date_in_list，输入参数为起始日期，结束日期，然后提供一个时间列表进行比对。

print discontinuous_date_in_list('2019-10-21','2019-11-01',['2019-10-21','2019-10-23'])

输出为：

['2019-10-22', '2019-10-27', '2019-10-26', '2019-10-25', '2019-10-24', '2019-10-29', '2019-10-28', '2019-10-30', '2019-10-31', '2019-11-01']

可以看到很简短的代码就实现了一些繁琐的逻辑调用，而在后续的功能开发中，时间部分的处理也能高效很多。

简单一句话：不要轻视设计，然后像拼装乐高一样完成逻辑集成。

640?wx_fmt=jpeg

近期热文：

千万不要养大型犬，多么痛的领悟

《吊打面试官》系列-Redis基础

为什么我们的数据科学团队无法产生价值

在繁杂的业务需求中，如何找到API设计的平衡点

Greenplum的segment故障自愈小试

MySQL表添加了一个字段，竟然导致数据无法写入，反思

通过Maxwell解析MySQL Binlog，打好业务多活的基础

快到买买买的日子了，对于买书我提几点建议

深度解读：我为什么从来不过“双十一”

《黑客与画家》经典语录

一个MySQL服务CPU 100%的优化案例反思

MySQL双主模式下是如何避免数据回环冲突的

MySQL中的SQL优化建议那么多，该如何有的放矢

dbaplus广州站归来

梳理这件事情做不好，很多努力都是白费

【译】理解JavaScript：new 关键字

IDEA常用插件整理

Java知识点总结（JavaIO-打印流）

Js基础知识（四） - js运行原理与机制

Linux Process Manage

Linux中的硬链接与软链接

node入门

Python3爬取英雄联盟英雄皮肤大图

windows下如何用phpstorm同步测试服务器

Work@Alibaba 阿里巴巴的企业应用构建之路

笨办法学C 练习34：动态数组

测试如何在敏捷团队中工作？

搭建gitbook 和访问权限认证

检测对象或数组

那些被忽略的 JavaScript 数组方法细节

前端学习笔记之观察者模式

使用docker-compose进行多节点部署

小而合理的前端理论：rscss和rsjs

一天一个设计模式之JS实现——适配器模式

应用生命周期终极 DevOps 工具包

原生JS动态加载JS、CSS文件及代码脚本

Salesforce和SAP Netweaver里数据库表的元数据设计

## 临床数据两两比较加显著性boxplot加显著性

#Linux（Source Insight安装及工程建立）

#微信小程序（布局、渲染层基础知识）

（1）SpringCloud 整合Python

（30）数组元素和与数字和的绝对差

（5）STL算法之复制

（51单片机）第五章-A/D和D/A工作原理-A/D

（9）YOLO-Pose:使用对象关键点相似性损失增强多人姿态估计的增强版YOLO

（二）什么是Vite——Vite 和 Webpack 区别（冷启动）

（附源码）ssm教材管理系统毕业设计 011229

(欧拉)openEuler系统添加网卡文件配置流程、(欧拉)openEuler系统手动配置ipv6地址流程、(欧拉)openEuler系统网络管理说明

（最简单，详细，直接上手）uniapp/vue中英文多语言切换

.NET Core IdentityServer4实战-开篇介绍与规划

.NET 设计一套高性能的弱事件机制

.net 重复调用webservice_Java RMI 远程调用详解，优劣势说明

.NET/C# 获取一个正在运行的进程的命令行参数

.net快速开发框架源码分享

.NET与java的MVC模式(2):struts2核心工作流程与原理

相关文章：