当前位置: 首页 > news >正文

【C语言】程序环境,预处理,编译,汇编,链接详细介绍,其中预处理阶段重点讲解

目录

程序环境

翻译环境

1. 翻译环境的两个过程

2. 编译过程的三个阶段 

执行环境 

预处理(预编译) 

1. 预定义符号

2. #define 

2.1 用 #define 定义标识符(符号)

2.2 用 #define 定义宏 

2.3 #define 的替换规则 

2.4 # 和 ## 的用法

2.5 宏和函数

2.6 #undef

3. 命令行定义

4. 条件编译

5. 文件包含

5.1 两种头文件的包含

5.2 嵌套文件包含


程序环境

在ANSI C(标准C)的任何一种实现中,存在两个不同的环境。

1. 翻译环境,在这个环境中源代码被转换为可执行的机器指令。

2. 执行环境,它用于实际执行代码。

.

我们写出的C语言代码是文本信息,计算机不能直接理解,计算机是执行二进制指令的,翻译环境负责将C语言代码转成二进制指令,执行环境负责执行二进制代码。


翻译环境

1. 翻译环境的两个过程

1. 一个工程可以有多个.c(源文件)文件,每个源文件都会单独经过编译器处理生成自己对应的目标文件(.obj),这个过程叫做编译。

2. 多个目标文件和链接库经过链接器的处理,最后生成可执行程序,这个过程叫做链接。

链接库的意思是链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。

2. 编译过程的三个阶段 

翻译环境分为编译和链接两部分,编译又有预处理,编译,汇编三个阶段。

1. 预处理:gcc -E test.c -o test.i

预处理完成之后就停下来,预处理之后产生的结果都放在test.i文件中。

2. 编译:gcc -S test.c

编译完成之后就停下来,结果保存在test.s中。

3. 汇编:gcc -c test.c

汇编完成之后就停下来,结果保存在test.o中。

.

符号

1. 查看符号,这些符号都是全局的。

2. 每个源文件自己编译阶段符号汇总,汇编阶段形成符号表(符号,对应地址),链接进行所有源文件的符号表合并(相同符号合并,函数定义的符号的地址为有效地址,函数声明的符号的地址为无效地址,选取有效地址)。

比如:下图main.c符号表中_sum地址是无效的,合并的时候选择sum.c符号表的_sum地址。


执行环境 

程序执行的过程:

1. 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排(例如单片机的烧录),也可能是通过可执行代码置入只读内存来完成。

2. 程序的执行便开始。接着便调用main函数。 

3. 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack)也就是函数栈帧,存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。

4. 终止程序。正常终止main函数;也有可能是意外终止。


预处理(预编译) 

1. 预定义符号

以下预定义符号会在预处理阶段被替换。

__FILE__ 替换为当前进行编译的源文件名称

__LINE__ 替换为当前的行号

__DATE__ 替换为文件被编译的日期

__TIME__ 替换为文件被编译的时间

__STDC__ 如果编译器遵循ANSI C,其值为1,否则未定义

.

2. #define 

2.1 用 #define 定义标识符(符号)

语法:

#define name stuff

例子:

用 MAX 代表1000。

#define MAX 1000

为 register 这个关键字,创建一个简短的名字。

#define reg register

用更形象的符号来替换一种实现。

#define do_forever for(;;)

在写 case 语句的时候自动把 break 写上。

#define CASE break;case

如果定义的 stuff 过长,可以分成几行写,除了最后一行外,每行的后面都加一个反斜杠(续行符)。

#define DEBUG_PRINT printf("file:%s\tline:%d\t\date:%s\ttime:%s\n" ,\__FILE__,__LINE__ ,\__DATE__,__TIME__ )

提问:在define定义标识符的时候,要不要在最后加上;

答:不会直接报错,但没必要加,因为

1. 这只是单纯的替换,如果你加了分号,万一代码那边也写了分号,就会出现两个分号。

2. 不方便进行运算和逻辑执行,替换后你多一个分号有时候会影响原先代码的逻辑。

2.2 用 #define 定义宏 

语法:

其中的 parament-list 是一个由逗号隔开的符号表,它们可能出现在 stuff 中。

#define name(parament-list) stuff 

用法:

#define MAX(x, y) (x>y ? x : y)

这个写法其实不够严谨,因为传进来的可能是多项式,所以尽量加上括号。

#define MAX(x, y) ((x)>(y) ? (x) : (y))

这个替换会发生在预处理阶段。


带副作用的宏参数 

x+1;//不带副作用
x++;//带有副作用

例子

#define MAX(a, b)  ( (a) > (b) ? (a) : (b) )x = 5;
y = 8;
z = MAX(x++, y++);

z 就会替换为 z = ( (x++) > (y++) ? (x++) : (y++));

副作用就是表达式求值的时候出现的永久性效果。

2.3 #define 的替换规则 

在程序中扩展 #define 定义的符号和宏时,需要涉及几个步骤。

1. 在调用宏时,首先对参数进行检查,看看是否包含任何由 #define 定义的符号。如果有,那它们首先被替换,替换后的文本被插入到程序中原来文本的位置。

2. 然后参数被宏的值所替换。

3. 最后,再次对结果文件进行扫描,看看它是否包含任何由 #define 定义的符号。如果有,就重复上述处理过程。

注意:

1. 宏参数和 #define 定义中可以出现其他 #define 定义的符号。但是宏不能出现递归。

2. 当预处理器搜索 #define 定义的符号时,字符串常量的内容并不被搜索。

2.4 # 和 ## 的用法

1. # 的用法:把宏的参数插入到字符串中。

例子:

#define PRINT(n) printf("the value of n is %d\n", n)int main()
{int a = 10;PRINT(a);int b = 20;PRINT(b);return 0;
}

问题:字符串中的n没有被替换。

解决办法:在 n 前面加一个 #

#define PRINT(n) printf("the value of "#n" is %d\n", n)int main()
{int a = 10;PRINT(a);int b = 20;PRINT(b);return 0;
}

题外话:字符串的双引号是可以连接的。

比如:


2. ## 的用法:可以把位于它两边的符号合成一个符号。

例子:

将 a 和 b 连起来变成 ab。

#define CAT(x, y) x##yint main()
{int ab = 10;printf("%d\n", CAT(a, b));printf("%d\n", ab);return 0;
}

2.5 宏和函数

宏的优点

1. 执行简单的运算时,选择用宏而不是函数。

原因:

用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多,所以宏比函数在程序的规模和速度方面更胜一筹。

函数的参数必须声明为特定的类型,宏是类型无关的,所以函数只能在类型合适的表达式上使用。

2. 宏的参数可以出现类型,但是函数做不到。

#define MALLOC(num, type) (type*)malloc(num*sizeof(type))MALLOC(10, int);
//预处理器替换之后:
(int*)malloc(10*sizeof(int));

宏的缺点

1. 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度。

2. 宏是没法调试的。

3. 宏由于类型无关,也就不够严谨。

4. 宏可能会带来运算符优先级的问题,导致程容易出现错。


宏与函数对比


命名约定

1. 宏名全部大写

2. 函数名不要全部大写

2.6 #undef

这条指令用于移除一个宏定义。

如果现存的一个名字需要被重新定义,那么它的旧名字首先要被移除。

例子:

3. 命令行定义

许多 C 的编译器提供了一种能力,允许在命令行中定义符号。用于启动编译过程。

例子:

 #include <stdio.h>int main(){int array [ARRAY_SIZE];int i = 0;for(i = 0; i< ARRAY_SIZE; i ++){array[i] = i;}for(i = 0; i< ARRAY_SIZE; i ++){printf("%d " ,array[i]);}printf("\n");return 0;}

编译指令:

gcc -D ARRAY_SIZE=10 programe.c

4. 条件编译

在编译一个程序的时候,条件编译指令可以将一条语句或一组语句进行编译或者放弃编译。

常见的条件编译指令:

1. 单分支的条件编译,常量表达式由预处理器求值。

 #if 常量表达式//...#endif如:
#define __DEBUG__ 1#if __DEBUG__//..
#endif

2. 多分支的条件编译

#if 常量表达式//...
#elif 常量表达式//...
#else//...
#endif

3. 判断是否被定义,各自有两种写法。

#if defined(symbol)//...
#endif#ifdef symbol//...
#endif#if !defined(symbol)//...
#endif#ifndef symbol//...
#endif

4. 嵌套指令

#if defined(OS_UNIX)#ifdef OPTION1unix_version_option1();#endif#ifdef OPTION2unix_version_option2();#endif
#elif defined(OS_MSDOS)#ifdef OPTION2msdos_version_option2();#endif
#endif

5. 文件包含

5.1 两种头文件的包含

本地文件包含

#include "filename"

查找策略:先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标准位置查找头文件,如果找不到就提示编译错误。


库文件包含

#include <filename.h>

查找策略:查找头文件直接去标准路径下去查找,如果找不到就提示编译错误。


题外话

1. 其实库文件包含也能用双引号,但是这样做查找的效率就低些,当然这样也不容易区分是库文件还是本地文件了。

2. #include 指令可以使另外一个文件被编译,就像它实际出现于一样。

这种替换的方式很简单:预处理器先删除这条指令,并用包含文件的内容替换。

这样一个源文件被包含10次,那就实际被编译10次。

5.2 嵌套文件包含

comm.h 和 comm.c 是公共模块。

test1.h 和 test1.c 使用了公共模块。

test2.h 和 test2.c 使用了公共模块。

test.h 和 test.c 使用了 test1 模块和 test2 模块。

这样最终程序中就会出现两份 comm.h 的内容,这样就造成了文件内容的重复。


解决办法有两种

1. 条件编译

#ifndef __TEST_H__#define __TEST_H__
... //头文件的内容#endif   

2. 头文件开头写:

#pragma once

这样就可以避免头文件的重复引入。

林宇恒/code_c - 码云 - 开源中国 (gitee.com)

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 全球汽车用MEMS加速度计市场规划预测:未来六年CAGR为2.8%
  • STM32ADC
  • Java中的抽象类和接口区别
  • TypeScript函数类型:提升函数的类型安全性和可读性
  • 2024年厦门市大数据创新应用大赛重磅开赛,邀您来战!
  • 【数据结构初阶】详解:实现循环队列、用栈实现队列、用队列实现栈
  • 通过内网穿透远程访问自己的项目
  • 【力扣】3128. 直角三角形 JAVA
  • matlab y=sin(x) - 2/π*(x)函数绘制
  • 1.1、centos stream 9安装Kubernetes v1.30集群 环境说明
  • CSS mask-image 实现边缘淡出过渡效果
  • Flink-CDC解析(第47天)
  • 【机器学习】机器学习与医疗健康在疾病预测中的融合应用与性能优化新探索
  • CANopen和CAN是什么关系
  • Resilience4j 数据库熔断-健康检查sql
  • JS中 map, filter, some, every, forEach, for in, for of 用法总结
  • [deviceone开发]-do_Webview的基本示例
  • Android开发 - 掌握ConstraintLayout(四)创建基本约束
  • chrome扩展demo1-小时钟
  • k个最大的数及变种小结
  • Linux各目录及每个目录的详细介绍
  • Mac 鼠须管 Rime 输入法 安装五笔输入法 教程
  • Netty 框架总结「ChannelHandler 及 EventLoop」
  • PHP的Ev教程三(Periodic watcher)
  • RxJS: 简单入门
  • Vue 2.3、2.4 知识点小结
  • 欢迎参加第二届中国游戏开发者大会
  • 技术胖1-4季视频复习— (看视频笔记)
  • 区块链分支循环
  • 如何在 Tornado 中实现 Middleware
  • 它承受着该等级不该有的简单, leetcode 564 寻找最近的回文数
  • 主流的CSS水平和垂直居中技术大全
  • 微龛半导体获数千万Pre-A轮融资,投资方为国中创投 ...
  • ​决定德拉瓦州地区版图的关键历史事件
  • ​总结MySQL 的一些知识点:MySQL 选择数据库​
  • !!java web学习笔记(一到五)
  • #{}和${}的区别?
  • #NOIP 2014#day.2 T1 无限网络发射器选址
  • #QT(智能家居界面-界面切换)
  • #鸿蒙生态创新中心#揭幕仪式在深圳湾科技生态园举行
  • #我与Java虚拟机的故事#连载07:我放弃了对JVM的进一步学习
  • #知识分享#笔记#学习方法
  • %@ page import=%的用法
  • (5)STL算法之复制
  • (PyTorch)TCN和RNN/LSTM/GRU结合实现时间序列预测
  • (Redis使用系列) Springboot 实现Redis 同数据源动态切换db 八
  • (八)光盘的挂载与解挂、挂载CentOS镜像、rpm安装软件详细学习笔记
  • (简单) HDU 2612 Find a way,BFS。
  • (原)本想说脏话,奈何已放下
  • .bat批处理(十):从路径字符串中截取盘符、文件名、后缀名等信息
  • .Net 6.0 处理跨域的方式
  • .NET CF命令行调试器MDbg入门(四) Attaching to Processes
  • .NET COER+CONSUL微服务项目在CENTOS环境下的部署实践
  • .Net Remoting常用部署结构
  • .NET/C# 编译期能确定的字符串会在字符串暂存池中不会被 GC 垃圾回收掉