当前位置: 首页 > news >正文

【C/C++】程序环境,探索程序的执行过程(习得无上内功《易筋经》的第一步)

目录

  • 1.程序的翻译环境和执行环境
  • 2.详解编译+链接
    • 2.1翻译环境
    • 2.2编译本身也分为几个阶段
      • 预编译(预处理)
      • 编译
      • 汇编
        • 详解符号表
        • 形成符号表
    • 2.3.链接
      • 合并段表
      • 符号表的合并和重定位
  • 3.运行环境
  • 总结:

1.程序的翻译环境和执行环境

在ANSIC(标准C,ANSI:美国国家标准总局)的任何一种实现中,存在两个不同的环境。

第一种:翻译环境,在这个环境中源代码被转换为可执行的机器指令。
第二次:执行环境,它用于实现执行代码。
在这里插入图片描述

2.详解编译+链接

2.1翻译环境

在这里插入图片描述
在这里插入图片描述

  • 组成一个程序的每个源文件通过编译过程分别转换成目标文件。
  • 每个目标文件由链接器捆绑在一起,形成一个单一而完整的可执行程序。
  • 链接器同时也会引入标准C函数库(链接库)中任何被该程序所用到的函数,而且它可以搜素程序员个人的程序集,将其需要的函数也链接到程序中。

2.2编译本身也分为几个阶段

我现在使用的是VS2019(IDE)—— 集成开发环境
有很多的功能:
编辑+|编译+链接+调试
编辑器+编译器(cl.ese)+ 链接器(link.exe)+ 调试器
VS已经封装的十分好了,我们无法看到编译的过程,想要刨析这些过程这里在Linux环境下进行演示,下面的演示会在Linux下进行。

在这里插入图片描述

gcc -E test.c -o test.i //预编译完成后就停下来,预处理之后产生的结果都放在test.i文件中
gcc -S test.c //编译完成后就停下来,结果保存在test.s中
gcc -c test.c  //汇编完成后就停下来,结果保存在test.o中。

在这里插入图片描述

代码:
test.c

#include<stdio.h>
extern int Add(int, int);
#define MAX 10

int main()
{
	//zhushi
	int max = MAX;
	int a = 10;
	int b = 20;
	int c = Add(a, b);
	printf("%d\n", c);

	return 0;
}

Add.c

int Add(int a1, int a2)
{
	return a1 + a2;
}

输出结果
在这里插入图片描述
可执行程序
在这里插入图片描述

  • 在项目文件夹的Debug下可以查看

预编译(预处理)

  1. 展开头文件

    为头文件(如:#include<stdio.h>,#include被称为预处理指令)中增加头文件信息,测试后大概增加800多行代码。

  2. 注释删除

    经过预编译后,源文件中的注释会被删除。

  3. #define符号替换

    在代码中所有#define定义的宏就会被替换到文本中原来的位置,而#define行会消失。(#define也被称为预处理指令)

  4. 经过预编译后源文件中的C语言代码不会改变。
  • 总的来说,预编译主要做一些文本相关的操作。

Linux命令

  • 使用指令:gcc -E test.c -o test.i
  • 预处理完成后就会停下,预处理的结果会放在test.i文件中。
    在这里插入图片描述
  • 如图说是,为test.i文件内容,它的头文件变为了800多行代码,删除了注释,#define符号被替换
    验证头文件展开
    在这里插入图片描述
  • 在include文件下,找到stdio.h文件,进行对比
    stdio.h文件内容:
    在这里插入图片描述
    我们可以在下面的图中看到,test.i文件的增加内容来自stdio.h文件。
    在这里插入图片描述

编译

  1. 把C语言代码转换成了汇编代码

    将C语言代码转换为汇编代码需要经过4个步骤

    1. 语法分析
    2. 词法分析
    3. 语义分析
    4. 符号汇总
  • 这里重点讲一下符号汇总
    1. 将源文件转化为可执行程序(可执行程序有自己的格式 —— elf文件的格式,可执行程序内容是二进制的)
    2. 符号汇总是将代码中全局变量、函数名汇总起来
    3. 在test.c文件中汇总的是main、Add、printf符号
    4. 在Add.c文件中汇总的是Add符号
    5. 这些汇总在编译阶段看不出什么,符号汇总主要体现在汇编和链接阶段

Linux命令

  • 使用指令:gcc -S test.c
  • 预处理完成后就停下来,结果保存在test.s中。

进入test.s文件后,我们会发现代码已经被转化为汇编语言

在这里插入图片描述

汇编

  1. 汇编后的文件是我们之前在翻译环境中提到的目标文件,目标文件的格式也是elf的

    • 在Windows环境下的目标文件名是xxx.obj
    • 在Linux环境下的目标文件是xxx.o
  2. 该文件把汇编指令转换成二进制指令

    因为计算机只认识二进制指令

  3. 形成符号表

    对不同源文件已完成汇总的符号分别进行分配地址,形成符号表

Linux命令

  • 使用指令:gcc -c test.c
  • 编译完成之后就停下来,结果保存在test.o文件中。
    在这里插入图片描述

这里我们可以看到,经过汇编后,文件转化为二进制形式

详解符号表

  • 在Linux环境下,test.o文件为目标文件,它和可执行文件具有相同的格式:elf格式
  • 在test.o文件中我们可以查看查看它对应源文件的符号表,虽然它是二进制形式的,但我们可以通过readelf工具查看。

查看readelf工具Linux展示:

  • 使用指令:man readelf
    在这里插入图片描述
  • 这里我们使用-s选项查看符号表信息
    在这里插入图片描述
    我们可以进行如下操作查看test.o的符号表:
    在这里插入图片描述
  • test.o符号表中有main、Add、printf符号

查看Add.o符号表:
在这里插入图片描述

  • Add.o符号表中有Add符号

形成符号表

  • 我们已经知道,每个.o文件都有它对应的符号表,符号表里有编译过程中记录的符号,还有与符号相关联的地址。

  • 在编译过程中,test.i文件里面通过extern来声明Add函数,让编译器知道有这个符号。

  • 但Add函数是定义在其他文件里面的,我们只知道有这么个函数,而不能确定它在哪,所以它对应的地址是无效的(随机分配的地址
    在这里插入图片描述

  • 而main函数就在test.c文件中,我们可以找到它,所以我们会给它一个有效的地址。

  • printf函数是库函数,我们暂时不考虑。
    在这里插入图片描述

  • 在Add.c文件里实现了Add函数,我们可以找到它的地址,所以在编译过程,Add.i文件会对Add进行符号汇总,Add.o文件会对Add形成符号表。
    在这里插入图片描述

2.3.链接

  1. 合并段表

    生成一份可执行程序(格式也是elf的),将不同.o文件中的相同段的数据合并

  2. 符号表的合并和重定位

    合并:对所有符号进行合并,将相同的符号进行合并
    重定向:使用有意义的地址(在两个源文件中可能出现两个相同的符号,但一个的地址是无意义的)

合并段表

  • 每个可执行程序或test.o这样的目标文件,它们的格式都是elf文件的格式。这样的文件都有各自的段而且每个文件相同段的格式是相同的,合并段表就是把相同的段合并在一起。
    在这里插入图片描述

符号表的合并和重定位

  • 对所有符号进行合并,将相同的符号进行合并。
  • 取相同符号有意义的地址,进行合并。
  • 如果一个符号直邮无意义的符号,那就会报错。
  • 最终形成的符号表可以方便符号在调用时找到它的地址。
    在这里插入图片描述
    演示调用函数没有定义:
    在这里插入图片描述
  • 将Add函数注释后运行
    在这里插入图片描述
    链接错误,我们将Add函数注释后,编译器找不到Add的有效地址了,就会报错。

3.运行环境

程序执行的过程:

  1. 程序必须载入内存中。在有操作系统的环境中:一般载入内存的操作是由操作系统完成的。在独立的环境中(如单片机),程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
  2. 程序的执行便开始,接着便调用main函数。
  3. 开始执行程序。这个时候程序将使用一个运行时堆栈(static,函数栈帧),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留它们的值。
  4. 终止程序。正常终止main函数;也可能时意外终止。

总结:

以上的内容只是程序环境和预处理的冰山一角,了解这些可以让你更好的去理解一些知识,比如说在武侠小说中,少林《易筋经》是无上的内功心法,学会的人无不纵横武林,学其它东西都快的很。如果想要了解的更多建议大家下来的看看《程序员的自我修养》这本书,是一本有关于链接、装载与库的书,虽然前期读会比较吃力,建议大家伴随着整个学习过程去看,相信会对你的内功有很大的提升。

相关文章:

  • 计算机网络——基于UDP与TCP网络编程
  • 中兴设备18种命令模式总结大全,全网第一篇,强烈建议收藏!
  • 【学生管理系统】权限管理
  • NLP学习之:Bert 模型复现(1)任务分析 + 训练数据集构造
  • 【PTA】《数据结构与算法》线性结构复习题
  • Java利用工具类提升写报表效率
  • RFSoC应用笔记 - RF数据转换器 -14- RFSoC自动增益控制与NCO跳频功能
  • 大数据Hadoop之——Apache Hudi 数据湖实战操作(Spark,Flink与Hudi整合)
  • 智能机器人项目,安装人脸识别face_recognition报错解决
  • EMQX(emqtt)安装与入门
  • ansible常用模块的用法和ansible基于模块方式实现LNMP
  • ArcGIS || ENVI:如何将彩色影像拆分为R、G、B以及H、S、I(B/V)影像?
  • 【英语:基础进阶_原著扩展阅读】J6.原著阅读实战训练
  • SpringBoot学习1—安装与配置
  • 10月笔试面试记录
  • Android单元测试 - 几个重要问题
  • Android开发 - 掌握ConstraintLayout(四)创建基本约束
  • CSS 三角实现
  • github从入门到放弃(1)
  • Java教程_软件开发基础
  • js操作时间(持续更新)
  • Lucene解析 - 基本概念
  • markdown编辑器简评
  • SAP云平台里Global Account和Sub Account的关系
  • 聚类分析——Kmeans
  • 排序算法学习笔记
  • 深度解析利用ES6进行Promise封装总结
  • 为视图添加丝滑的水波纹
  • 应用生命周期终极 DevOps 工具包
  • 原生Ajax
  • 《码出高效》学习笔记与书中错误记录
  • 如何在招聘中考核.NET架构师
  • ​DB-Engines 11月数据库排名:PostgreSQL坐稳同期涨幅榜冠军宝座
  • (09)Hive——CTE 公共表达式
  • (12)目标检测_SSD基于pytorch搭建代码
  • (第61天)多租户架构(CDB/PDB)
  • (附源码)python房屋租赁管理系统 毕业设计 745613
  • (接口自动化)Python3操作MySQL数据库
  • (一)插入排序
  • (转)Oracle 9i 数据库设计指引全集(1)
  • ***微信公众号支付+微信H5支付+微信扫码支付+小程序支付+APP微信支付解决方案总结...
  • .bashrc在哪里,alias妙用
  • .Family_物联网
  • .gitignore文件_Git:.gitignore
  • .NET Core实战项目之CMS 第十二章 开发篇-Dapper封装CURD及仓储代码生成器实现
  • .NET 依赖注入和配置系统
  • .NET/C# 获取一个正在运行的进程的命令行参数
  • .NET开源项目介绍及资源推荐:数据持久层
  • .secret勒索病毒数据恢复|金蝶、用友、管家婆、OA、速达、ERP等软件数据库恢复
  • :中兴通讯为何成功
  • ??eclipse的安装配置问题!??
  • @FeignClient 调用另一个服务的test环境,实际上却调用了另一个环境testone的接口,这其中牵扯到k8s容器外容器内的问题,注册到eureka上的是容器外的旧版本...
  • @Service注解让spring找到你的Service bean
  • @TableLogic注解说明,以及对增删改查的影响
  • [ Linux Audio 篇 ] 音频开发入门基础知识