当前位置: 首页 > news >正文

使用Python轻松实现科研绘图

当撰写在学术期刊上发表的文章时,图表的布局和风格应符合预定义的格式要求。这样可以确保该出版物的所有文章都具有一致的风格,并且任何包含的图表在打印时都是高质量的。

Python在科学界广泛使用,并提供了创建科学绘图的好方法。然而,当使用Python中最流行的绘图库之一matplotlib时,默认的图表质量较差,需要进行调整以确保满足要求。更改matplotlib图形的样式可能非常耗时,这就是scienceplots库派上用场的地方。只需几行代码,就可以立即改变图形的外观,而无需花费太多时间来研究如何更改图形的不同部分。

scienceplots该库允许用户创建简单、信息丰富的图表,类似于学术期刊和研究论文中的图表。不仅如此,它还将所需的DPI设置为600(对于某些样式),这通常是出版物的要求,以确保打印出高质量的印刷图形。scienceplots库包含多种样式,包括对多种语言的支持,包括中文和日文等。可以通过下面的链接探索scienceplots库中的全部样式。

本文将探讨如何将一些基本和常见的数据可视化转换为可以包含在科学出版物中的形式。

1.设置scienceplots

在使用scienceplots库创建绘图之前,需要确保计算机上安装了LaTeX。LaTeX是一种排版系统,专为创建技术和科学文档而设计。如果正在使用Google Colab,则可以在单元格中运行以下代码来安装LaTeX。

!sudo apt-get install dvipng texlive-latex-extra texlive-fonts-recommended texlive-latex-recommended cm-super

在设置好LaTeX之后,可以使用pip安装scienceplots库:

pip install SciencePlots

在选择的平台上安装了库和LaTeX之后,就可以导入scienceplots库以及matplotlib

import scienceplots
import matplotlib.pyplot as plt

2.创建用于绘图的虚拟数据

在生成一些图表之前,首先需要创建一些样本数据。我们将在本文的后面部分展示scienceplots库如何处理现实世界的数据。

对于本文的这一部分,现在将使用np.linspace创建一些线性间隔的值,然后对该数据进行一些随机的数学计算。

# 生成x值
x = np.linspace(0, 10, 20)# 生成带有随机噪声的y值
y = np.sin(x)
y2 = np.cos(x)
y3 = y2 * 1.5

一旦创建了数据(或者如果从csv文件中加载数据,则将其加载到pandas中),就可以开始创建绘图了。

3.使用Matplotlib创建带有标记的折线图

我们将首先处理的是折线图。可以通过使用matplotlib.plot()函数并传入xy参数的必需数据来轻松创建此图表。由于我们处理的是从方程中派生的变量,因此有时将这些变量包含在图例中对于读者理解它们可能很方便。

Matplotlib的一个好处是我们可以使用LaTeX方程作为标签。我们只需要用美元符号($)将方程括起来即可。如下是使用scienceplotsmatplotlib创建带有标签的折线图的示例代码:

plt.figure(figsize = (6,6))
plt.plot(x, y, marker='o', label='$y=sin(x)$')
plt.plot(x, y2, marker='o', label='$y=cos(x)$')
plt.plot(x, y3, marker='o', label='$y=y2*1.5$')plt.xlabel('X')
plt.ylabel('Y')
plt.legend()
plt.show()

当运行上述代码时,会得到以下带有标准颜色的基本Matplotlib图像:

图片

应用scienceplots之前的基本Matplotlib折线图

尽管上图看起来可用,但它的质量(dpi和大小)以及样式可能并不完全适合在期刊中发表。

4.应用SciencePlots样式到线型图

要立即转换图像,可以添加一行代码:使用with语句,调用Matplotlib的style.context函数,并允许传入SciencePlots提供的众多可用样式之一。

with plt.style.context(['science', 'high-vis']):plt.figure(figsize = (6,6))plt.plot(x, y, marker='o', label='$y=sin(x)$')plt.plot(x, y2, marker='o', label='$y=cos(x)$')plt.plot(x, y3, marker='o', label='$y=y2*1.5$')plt.xlabel('X Variable (mm)')plt.ylabel('Y Variable')plt.legend()plt.show()

当运行上述代码时,将得到以下更适合于期刊发表的绘图。

应用scienceplots样式后的Matplotlib折线图

该图形简洁(即没有多余的图表元素),并且很容易区分不同的线条。此外,在Jupyter Notebook中查看此图形时,它可能会显示得非常大,即使我们设置了相对较小的图形尺寸。这是因为图形的DPI被设置为600,这通常是许多出版物的要求,并确保图形尽可能清晰。

然后尝试应用另一种样式。这次将使用电气和电子工程师学会(IEEE)的样式。要做到这一点,只需要将high-vis替换为ieee即可改变样式。

with plt.style.context(['science', 'ieee']):plt.figure(figsize = (6,6))plt.plot(x, y, marker='o', label='$y=sin(x)$')plt.plot(x, y2, marker='o', label='$y=cos(x)$')plt.plot(x, y3, marker='o', label='$y=y2*1.5$')plt.xlabel('X')plt.ylabel('Y')plt.legend()plt.show()

当运行上述代码时,将得到以下使用IEEE推荐样式的绘图:

图片

应用scienceplots IEEE风格后的Matplotlib折线图

5.使用SciencePlots绘制直方图

在前面的示例中探讨了如何将样式应用于线型图,也可以将相同的样式应用于其他类型的绘图,接下来尝试如何将这种样式应用于直方图。

首先,使用以下代码创建一个Matplotlib图形,使用一些射线(地质形态的自然放射性测量)数据。为了显示第二个数据集,本文将同样的数据向右调整了20个API单位。

plt.figure(figsize = (6,6))
plt.hist(df['GR'], bins=100, label='GR1', alpha =0.5)
plt.hist(df['GR']+20, bins=100, label='GR2', alpha=0.5)
plt.xlim(0, 150)
plt.xlabel('Gamma Ray')
plt.ylabel('Frequency')
plt.legend()
plt.show()

当运行上面的代码时,将得到以下图形:

图片

射线测量的简单Matplotlib直方图

可以注意到它使用了Matplotlib的标准样式,并且看起来非常基础,两个数据集互相重叠,这导致一些信息被隐藏。现在查看一下IEEE样式如何改变这种情况:

with plt.style.context(['science', 'ieee']):plt.figure(figsize = (6,6))plt.hist(df['GR'], bins=100, label='GR1')plt.hist(df['GR']+20, bins=100, label='GR2')plt.xlim(0, 150)plt.xlabel('Gamma Ray')plt.ylabel('Frequency')plt.legend()plt.show()

当运行上述代码时,将得到以下使用IEEE样式的图形。然而,第二个射线数据集仍然遮挡了第一个数据集。

应用scienceplots IEEE样式后的射线测量的Matplotlib直方图

我们对SciencePlots库能够处理任何重叠并自动应用透明度抱有过高的期望,为此需要付出一点努力,需要为每个数据集添加alpha参数即可。

with plt.style.context(['science', 'ieee']):plt.figure(figsize = (6,6))plt.hist(df['GR'], bins=100, label='GR1', alpha=0.5)plt.hist(df['GR']+20, bins=100, label='GR2', alpha=0.5)plt.xlim(0, 150)plt.xlabel('Gamma Ray')plt.ylabel('Frequency')plt.legend()plt.show()

当运行带有alpha更改的上述代码时,将得到以下图形:

图片

应用scienceplots并为数据集添加透明度后的射线测量值的直方图

在这个图形中,可以看到两个数据集的条形的变化,建议检查所需发表的期刊的样式指南,以确保使用透明度是可接受的。

6.应用Science Plots到Seaborn图形

不仅可以将scienceplots库中的样式应用于matplotlib图形,还可以将其应用于Seaborn图形。这是因为Seaborn基于matplotlib代码开发

在创建图形时,有时Seaborn提供了比matplotlib更简单的绘图方式。例如,当有一个基于文本的分类变量时,我们希望能够绘制该变量,而不必为每个类别添加单独的散点图。

在这个例子中,有一些中子孔隙度和堆积密度数据,这是常见的测井测量。对于每个测量,还有一个岩性类别,这个数据集来源于Force 2020 Xeek机器学习竞赛数据集。

首先,需要在笔记本中导入seaborn:

import seaborn as sns

导入seaborn库后,可以使用以下代码创建散点图。

plt.figure(figsize=(6, 6))
sns.scatterplot(data=df, x='NPHI', y='RHOB', hue='LITH', s=10)plt.ylabel('Bulk Density (RHOB) - g/cc')
plt.xlabel('Neutron Porosity (NPHI) - dec')
plt.ylim(2.8, 1.4)
plt.show()

当运行上面的代码时,会得到以下数据按不同岩性着色的散点图:

图片

使用Seaborn生成的基本中子-密度交叉图

还需要确保样式适合预期的期刊,并且颜色对所有读者都可访问和使用。要应用scienceplots样式,可以使用与之前相同的语法:

with plt.style.context(['science', 'ieee']):plt.figure(figsize=(10, 8))sns.scatterplot(data=df, x='NPHI', y='RHOB', hue='LITH', s=10)plt.ylim(2.8, 1.4)plt.title('RHOB vs NPHI Crossplot')plt.show()

当运行上面的代码时,会得到以下具有改进样式的图,包括新的调色板。

图片

Seaborn散点图,使用scienceplots样式显示堆积密度与中子孔隙度,按岩性变化着色

选择图形的调色板可能会很棘手且耗时,然而它可以使图形对具有视觉问题的读者更易访问和理解。此外,一些颜色在黑白打印时可能不容易区分,可以考虑为不同类别分配不同的形状,这对于从实验室过程中获得的小型数据集中尤为重要。

综上,本文探讨了如何快速将基本的matplotlib图形转化为可以轻松添加到科学出版文章中的形式。这些图形可能仍然需要进一步调整,但通过使用scienceplots库,可以实现大部分需求。另外,建议查看所选择期刊的作者工具包,以确保创建的图形符合要求的标准。

相关文章:

  • Ubuntu中安装R语言环境并在jupyter kernel里面增加R kernel
  • linux版:TensorRT安装教程
  • 基于PHP的化妆品销售网站,MySQL数据库,PHPstudy,前台用户+后台管理,完美运行,有一万多字论文
  • flink的副输出sideoutput单元测试
  • 基于opencv+tensorflow+神经网络的智能银行卡卡号识别系统——深度学习算法应用(含python、模型源码)+数据集(二)
  • js中的instance,isPrototype和getPrototypeOf的使用,来判断类的关系
  • 这就是思维导图!全面分析思维导图的实际用途
  • 深度学习_13_YOLO_图片切片及维度复原
  • 如何下载 Apache + PHP + Mysql 集成安装环境并结合内网穿透工具实现公网访问内网服务
  • 【 云原生 | K8S 】kubeadm 部署Kubernetes集群
  • Redis 5大数据类型命令解读
  • 作为程序员,我建议你学会写作
  • 如何解决网页中的pdf文件无法下载?pdf打印显示空白怎么办?
  • 在Spring Boot中使用进程内缓存和Cache注解
  • 当我只有一个代理,我该如何从内网搭建一个docker环境
  • Angular 4.x 动态创建组件
  • CAP 一致性协议及应用解析
  • CentOS 7 修改主机名
  • CSS实用技巧
  • exports和module.exports
  • Fastjson的基本使用方法大全
  • Java小白进阶笔记(3)-初级面向对象
  • Linux中的硬链接与软链接
  • React16时代,该用什么姿势写 React ?
  • Web设计流程优化:网页效果图设计新思路
  • 成为一名优秀的Developer的书单
  • 初识 webpack
  • 从0到1:PostCSS 插件开发最佳实践
  • 基于Android乐音识别(2)
  • 前端
  • 如何学习JavaEE,项目又该如何做?
  • 软件开发学习的5大技巧,你知道吗?
  • 深度学习中的信息论知识详解
  • 微服务核心架构梳理
  • 小程序开发中的那些坑
  • 写代码的正确姿势
  • 用element的upload组件实现多图片上传和压缩
  • 用jquery写贪吃蛇
  • 曜石科技宣布获得千万级天使轮投资,全方面布局电竞产业链 ...
  • ​Python 3 新特性:类型注解
  • ​软考-高级-信息系统项目管理师教程 第四版【第19章-配置与变更管理-思维导图】​
  • #我与Java虚拟机的故事#连载19:等我技术变强了,我会去看你的 ​
  • $(function(){})与(function($){....})(jQuery)的区别
  • (C语言)逆序输出字符串
  • (第二周)效能测试
  • (附源码)spring boot校园拼车微信小程序 毕业设计 091617
  • (附源码)springboot工单管理系统 毕业设计 964158
  • (附源码)流浪动物保护平台的设计与实现 毕业设计 161154
  • (个人笔记质量不佳)SQL 左连接、右连接、内连接的区别
  • (企业 / 公司项目)前端使用pingyin-pro将汉字转成拼音
  • (求助)用傲游上csdn博客时标签栏和网址栏一直显示袁萌 的头像
  • (十)T检验-第一部分
  • (四)JPA - JQPL 实现增删改查
  • (已解决)vue+element-ui实现个人中心,仿照原神
  • (转)c++ std::pair 与 std::make