当前位置: 首页 > news >正文

Python数据科学视频讲解:数据清洗、特征工程和数据可视化的注意事项

1.6 数据清洗、特征工程和数据可视化的注意事项

视频为《Python数据科学应用从入门到精通》张甜 杨维忠 清华大学出版社一书的随书赠送视频讲解1.6节内容。本书已正式出版上市,当当、京东、淘宝等平台热销中,搜索书名即可。内容涵盖数据科学应用的全流程,包括数据科学应用和Python的入门,数据清洗与特征工程,以及数据挖掘与建模、数据可视化等。

针对数据分析或机器学习推荐两本入门级的图书:《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)。这两本书的特色是在数据分析、机器学习各种算法的介绍方面通俗易懂,较少涉及数学推导,对数学基础要求相对不高,在python代码方面讲的很细致,看了以后根据自身需要选取算法、优化代码、科学调参。都有配套免费提供的源代码、数据文件和视频讲解,也有PPT、思维导图、习题等。

为什么说这两本书值得?首先说《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社),内容非常详实,包含了Python和机器学习,相当于一次获得了两本书。在讲解各类机器学习算法时,逐一详解用到的各种Python代码,针对每行代码均有恰当注释(这一点基本上是大多数书目做不到的)。恒丰银行总行行领导,山东大学经济学院教学实验中心主任 副教授 韩振,德勤华永会计师事务所 华文伟 合伙人,首创证券深圳分公司机构业务部 樊磊 总经理 中国准精算师,山东省农村信用社联合社数据管理项目组 郝路安 总监等一众大牛联袂推荐。这本书在出版之前曾开发成9次系列课程,在恒丰银行全行范围类开展培训,490人跟随杨维忠老师上课学习(课程限报490人),培训完成后课程在知鸟平台上回放超过3万人次。很多银行员工通过这些学习一下子就学会了Python,并且用于工作中开展数据分析、机器学习、数据可视化等,这本书也被多家商业银行选做数字化人才培训教材,成为银行员工的一本网红书。

《Python数据科学应用从入门到精通》一书,旨在教会读者实现全流程的数据分析,并且相对《Python机器学习原理与算法实现》一书增加了很多概念性、科普性的内容,进一步降低了学习难度。国务院发展研究中心创新发展研究部第二研究室主任杨超 ,山东大学经济学院金融系党支部书记、副主任、副教授、硕士生导师张博,山东管理学院信息工程学院院长 袁锋 教授、硕士生导师,山东大学经济学院刘一鸣副研究员、硕士生导师,得厚投资合伙人张伟民等一众大牛联袂推荐。书中全是干活,买这一本书相当于一下子得到了5本书(Python基础、数据清洗、特征工程、数据可视化、数据挖掘与建模),而且入门超级简单,不需要编程基础,也不需要过多数学推导,非常适用于零基础学生。全书内容共分13章。其中第1章为数据科学应用概述,第2章讲解Python的入门基础知识,第3章讲解数据清洗。第4~6章介绍特征工程,包括特征选择、特征处理、特征提取。第7章介绍数据可视化。第8~13章介绍6种数据挖掘与建模方法,分别为线性回归、Logistic回归、决策树、随机森林、神经网络、RFM分析。从数据科学应用和Python的入门,再到数据清洗与特征工程,最终完成数据挖掘与建模或数据可视化,从而可以为读者提供“从拿到数据开始,一直到构建形成最终模型或可视化报告成果”的一站式、全流程指导。

两本书随书赠送的学习资料也很多,包括全部的源代码、PPT、思维导图,还有10小时以上的讲解视频,每一章后面还有练习题及参考答案,还有学习群,相对于只看网络上的视频,一方面更加系统、高效,另一方面照着书一步步操作学起来也事半功倍。全网热销中,当当、京东等平台搜索“Python机器学习 杨维忠”“Python数据科学 杨维忠”即可。

《Python机器学习原理与算法实现》(杨维忠、张甜著,2023年2月,清华大学出版社),适用于学习Python/机器学习

《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)适用于学习数据分析、数据科学、数据可视化等。

创作不易,恳请多多点赞,感谢您的支持!也期待大家多多关注我,让我共同学习数据分析知识。

相关文章:

  • 【从零开始学习JVM | 第一篇】快速了解JVM
  • mysql中NULL值
  • 设计模式——单例模式(Singleton Pattern)
  • 基于单片机音乐盒仿真仿真系统设计
  • css实现头部占一定高度,内容区占剩余高度可滚动
  • Qt 容器QGroupBox带有标题的组框框架
  • SpringBoot集成Elasticsearch8.x(9)|(RestClient实现Elasticsearch DSL操作)
  • deepface:实现人脸的识别和分析
  • 3GPP标准查看、下载和几个UE相关系列标准
  • Transformer源码(带注释)
  • 机器学习中Fine-tuning应用实例
  • nginx配置正向代理支持https
  • 判断上三角矩阵
  • ORACLE使用Mybatis-plus批量插入
  • 12月12日作业
  • 【EOS】Cleos基础
  • Android路由框架AnnoRouter:使用Java接口来定义路由跳转
  • Java,console输出实时的转向GUI textbox
  • Java超时控制的实现
  • jquery cookie
  • Laravel深入学习6 - 应用体系结构:解耦事件处理器
  • opencv python Meanshift 和 Camshift
  • React-redux的原理以及使用
  • React中的“虫洞”——Context
  • spring-boot List转Page
  • sublime配置文件
  • SwizzleMethod 黑魔法
  • vue-router的history模式发布配置
  • 彻底搞懂浏览器Event-loop
  • 技术:超级实用的电脑小技巧
  • 力扣(LeetCode)22
  • 事件委托的小应用
  • 思否第一天
  • 物联网链路协议
  • 想写好前端,先练好内功
  • 小程序测试方案初探
  • No resource identifier found for attribute,RxJava之zip操作符
  • 【运维趟坑回忆录】vpc迁移 - 吃螃蟹之路
  • ​如何使用ArcGIS Pro制作渐变河流效果
  • #NOIP 2014# day.1 生活大爆炸版 石头剪刀布
  • #Z0458. 树的中心2
  • (6)【Python/机器学习/深度学习】Machine-Learning模型与算法应用—使用Adaboost建模及工作环境下的数据分析整理
  • (8)STL算法之替换
  • (C#)获取字符编码的类
  • (C++)八皇后问题
  • (done) 两个矩阵 “相似” 是什么意思?
  • (java版)排序算法----【冒泡,选择,插入,希尔,快速排序,归并排序,基数排序】超详细~~
  • (Pytorch框架)神经网络输出维度调试,做出我们自己的网络来!!(详细教程~)
  • (博弈 sg入门)kiki's game -- hdu -- 2147
  • ***监测系统的构建(chkrootkit )
  • .NET Project Open Day(2011.11.13)
  • .NET学习教程二——.net基础定义+VS常用设置
  • @kafkalistener消费不到消息_消息队列对战之RabbitMq 大战 kafka
  • @manytomany 保存后数据被删除_[Windows] 数据恢复软件RStudio v8.14.179675 便携特别版...
  • @我的前任是个极品 微博分析