Hi~!这里是奋斗的小羊,很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~~
💥💥个人主页:奋斗的小羊
💥💥所属专栏:C语言
🚀本系列文章为个人学习笔记,在这里撰写成文一为巩固知识,二为展示我的学习过程及理解。文笔、排版拙劣,望见谅。
本篇文章将详细介绍编译过程中预编译的具体细节
在C语言的学习中部分人可能会忽视这一部分的学习,因为像VS这样相对强大的集成开发环境,我们在写好代码后只需要开始执行即可,所以部分人认为这一部分不值得我们花费时间去学习
其实不然,学习C语言预编译过程可以帮助我们更深入地了解C语言的编译过程和语法特性,提高代码编写的效率和质量,以及拓展编程技能
C语言设置了一些预定义符号,可以直接使用,预定义符号也是在预编译阶段处理的
__FILE__
:正在编译的源文件的文件名__LINE__
:文件当前的行号__DATE__
:文件被编译的日期__TIME__
:文件被编译的时间__STDC__
:如果编译器遵循 ANSI C,其值为1,否则未定义例如:
#define
定义的常量和标识符在预编译阶段完成替换
基本语法:
#define name stuff
特别的,为了区分普通常量这个name
我们一般用大写形式
比如:
#define MAX 10000 #define REG register
#define
后面的代码理论上讲只能写一行,但是如果后面的代码过长,我们可以使用'\'
来实现换行,相当于转义转义字符'\'
转义了转义字符'\n'
#define DEBUG_PRINT printf("file:%s\tline:%d\t\ date:%s\ttime:%s\n,\ __FILE__,__LINE__,\ __DATE__,__TIME__)
值得注意的是,行末最好不要加;
,在某些场景下是没什么问题,但是在大多数情况下是有语法错误的,所以我们要养成良好的编程习惯,行末不加;
#define
机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义宏(define macro)
基本语法:
#define name(parament_list) stuff
其中parament-list
(参数列表)是一个由逗号隔开的符号表,它们可能出现在stuff
中
注意: 参数列表的左括号必须与
name
紧邻,如果两者之间有任何空白存在,参数列表就会被解释为stuff
的一部分
举例:输入一个数,输出它的平方数
#include #define SQUARE(x) x*x int main() { int n = 0; scanf("%d", &n); int ret = SQUARE(n); printf("%d\n", ret); return 0; }
上面的代码看似没有什么问题,但当我们想计算n+1
的平方数时,就会出现问题:
#include #define SQUARE(x) x*x int main() { int n = 0; scanf("%d", &n); int ret = SQUARE(n + 1); printf("%d\n", ret); return 0; }
这是为什么呢?
原因就是带参数的宏在替换的时候括号内的表达式是不做任何计算的
也就是说,上面替换后的形式是:5 + 1 * 5 + 1
,为了解决这个问题,我们可以在定义宏的时候给x
加上括号:
#define SQUARE(x) (x)*(x)
这样替换后的结果就变成了:(5 + 1)*(5 + 1)
,但是这样给单独的参数加括号的形式在某些场景下还是存在问题,比如:
#include #define SQUARE(x) (x)+(x) int main() { int n = 0; scanf("%d", &n); int ret = 5 * SQUARE(n + 1); printf("%d\n", ret); return 0; }
那为了解决这个问题,我们可以(x)+(x)整体加上括号:((x) + (x))
#include #define SQUARE(x) ((x)+(x)) int main() { int n = 0; scanf("%d", &n); int ret = 5 * SQUARE(n + 1); printf("%d\n", ret); return 0; }
所以,在写宏的时候一定不要吝啬括号
当宏参数在宏的定义中出现超过一次的时候,如果参数带有副作用,那么你在使用这个宏的时候就可能出现危险,导致不可预测的后果,副作用就是表达式求值的时候出现的永久性效果
例如:
- x + 1; //不带副作用
- x++; //带有副作用
上面两个表达式的值是相同的,但是第一个表达式x
的本身没有发生改变,而第二个表达式x
本身发现了改变,这就是副作用
例如:使用宏实现求两个数的较大值
#include #define MAX(x, y) ((x)>(y)?(x):(y)) int main() { int a = 10; int b = 20; int ret = MAX(a, b); printf("%d\n", ret); return 0; }
上面代码中宏参数在宏定义中出现了两次,我们使用MAX(a, b);
时没什么问题,但当我们使用MAX(a++, b++);
时问题就会出现:
#include #define MAX(x, y) ((x)>(y)?(x):(y)) int main() { int a = 10; int b = 20; int ret = MAX(a++, b++); printf("%d\n", ret); printf("a = %d, b = %d\n", a, b); return 0; }
可以发现a和b的值会发生改变,就是表达式求值的时候出现了永久性效果。
与函数对比:
#include int MAX(int x, int y) { printf("a = %d, b = %d\n", x, y); return (x > y ? x : y); } int main() { int a = 10; int b = 20; int ret = MAX(a++, b++); printf("%d\n", ret); return 0; }
从上面的代码中可以看出来,带参数的宏替换和函数传参是非常相似的,但是它们的传参是有本质区别的。
带参数的宏替换是直接将参数做整体替换,替换过后的表达式是:((a++)>(b++)?(a++):(b++))
;而函数参过后的表达式是:(a > b ? a : b)
。
在程序中扩展#define
定义符号和宏时,需要涉及几个步骤。
- 在调用宏时,首先对参数进行检查,看看是否包含任何由
#define
定义的符号,如果有,它们首先被替换- 替换文本随后被插入到程序中原来文本的位置,对于宏,参数名被他们的值所替换
- 最后,再次对结果文件进行扫描,看看是否包含任何由
#define
定义的符号,如果有,重复上述步骤
例如:
#include #define M 10 #define N M + 2 #define MAX(x, y) ((x)>(y)?(x):(y)) int main() { int ret = MAX(M, N); return 0; }
MAX(M, N)
首先被替换成:((10)>(M + 2)?(10):(M + 2))
然后((10)>(M + 2)?(10):(M + 2))
再被替换成:((10)>(10 + 2)?(10):(10 + 2))
注意:
- 宏参数和
#define
定义中可以出现其他#define
定义的符号,但宏不能实现递归
比如:#define N M + 2
这个是可以的,但#define N N + 2
是不行的。
- 当预处理器搜索
#define
定义的符号时,字符串常量的内容并不被搜索
比如:
#include #define M 10 #define N M + 2 #define MAX(x, y) ((x)>(y)?(x):(y)) int main() { printf("MAX(M, N)"); return 0; }
可以看到宏MAX(M, N)
并没有展开。
宏通常被应用于执行简单的运算。
比如在两个数中找较大数,用宏实现更有优势:
#define MAX(x, y) ((x)>(y)?(x):(y))
那为什么不用函数呢?原因有二:
>
来比较的类型,宏参数是无关类型的。但是和函数相比宏还是有劣势的:
宏有时候能做到函数做不到的事,比如:宏的参数可以出现类型,但是函数不行
#include #define MALLOC(n, type) (type*)malloc(n * sizeof(type)) int main() { //int* p = (int*)malloc(10 * sizeof(int)); int* p = MALLOC(10, int); //int *p = (int*)malloc(10 * sizeof(int)); return 0; }
宏和函数的对比:
属性 | #define 定义宏 | 函数 |
---|---|---|
代码长度 | 每次使用时,宏代码都会被插入到程序中,除了非常小的宏之外,程序的长度会大幅度增长 | 函数代码只出现于一个地方,每次使用这个函数时,都调用那个地方的同一份代码 |
执行速度 | 更快 | 存在函数的调用和返回的额外开销,所以相对慢一些 |
操作符优先级 | 宏参数的求值是在所有周围表达式的上下文环境里,除非加上括号,否则邻近操作符的优先级可能会产生不可预料的结果,所以建议宏在书写的时候多写括号 | 函数参数只在函数调用的时候求值一次,它的结果值传递给函数,表达式的求值结果更容易预测 |
带有副作用的参数 | 参数可能被替换到宏体中的多个位置,如果宏的参数被多次计算,带有副作用的参数求值可能会产生不可预测的结果 | 函数参数只在传参的时候求值一次,结果更容易控制 |
参数类型 | 宏的参数与类型无关,只要对参数的操作是合法的,它就可以使用任何参数类型 | 函数的参数是与类型有关的,如果参数的类型不同,就需要不同的函数,即使他们执行的任务是相同的 |
调试 | 宏是不方便调试的 | 函数是可以逐语句调试的 |
递归 | 宏是不能递归的 | 函数是可以递归的 |
#
运算符将宏的一个参数转换为字符串字面量,它仅允许出现在带参数的宏的替换列表中#
运算符所执行的操作可以理解为“字符串化”
比如:当我们有一个变量int a = 10;
的时候,我们想打印出:the value of a is 10.
下面是常规写法:
#include int main() { int a = 10; printf("the value of a is %d\n", a); return 0; }
如果我们想把打印的这条代码通过宏替换来实现,该怎么做呢?
#include #define PRINT(format, n) printf("the value of n is "format"\n", n) int main() { int a = 10; PRINT("%d", a); //printf("the value of n is ""%d""\n", a); return 0; }
如果写成上面这种代码很明显并没有解决问题,因为如果我们将n
写成%d
时并不能打印出a
,而只能打印出a的值,那为了能打印出a
本身的字面量,我们就可以使用#
操作符
如下:
#include #define PRINT(format, n) printf("the value of "#n" is "format"\n", n) int main() { int a = 10; PRINT("%d", a); //printf("the value of "a" is ""%d""\n", a); double b = 3.14; PRINT("%lf", b); //printf("the value of "b" is ""%lf""\n", b); return 0; }
所以我们说:#
运算符所执行的操作可以理解为“字符串化”,上面的代码中是将a和b字符串化了。
当n = a的时候,#n 就相当于“a”
##
可以把位于它两边的符号合成一个符号,它允许宏定义从分离的文本片段创建标识符。##
被称为记号粘合
这样的连接必须产生一个合法的标识符,否则其结果就是未定义的。
比如现在有这么一个问题:当我们写一个函数来求两个数的较大值的时候,不同的类型我们就需要写不同的函数,这样写太繁琐了,我们可以使用宏来简化这件事:
#include #define GENERIC(type) \ type type##_max(type x, type y)\ {\ return ((x) > (y) ? (x) : (y));\ } GENERIC(int) //int int_max(int x, int y) //{ // return ((x) > (y) ? (x) : (y)); //} GENERIC(double) //double double_max(double x, double y) //{ // return ((x) > (y) ? (x) : (y)); //} int main() { printf("%d\n", int_max(10, 20)); printf("%lf\n", double_max(3.14, 6.28)); return 0; }
上面的代码中我们利用宏替换来实现创建不同类型的函数,type##_max
中的##
操作符将type
和_max
连接成了一个新的标识符
一般来讲函数和宏的使用语法很相似,所以语言本身没法帮我们区分二者,我们平时的习惯是:
#undef
这条指令用于移除一个宏定义
#include #define M 10 int main() { printf("%d\n", M); #undef M printf("%d\n", M); return 0; }
如果现存的一个宏名需要被重新定义,那么它的旧名字首先需要被移除
许多C编译器提供了一种能力,允许在命令行中定义符号,用于启动编译过程。
例如:当我们根据同一个源文件想要编译出一个程序的不同版本的时候,这个特性有点用处。(假定某个程序中声明了一个一定长度的数组,如果机器内存有限,我们需要一个很小的数组,但是另外一个机器内存大些,我们需要一个较大的数组)
编译指令:
//linux 环境演示 gcc -D ARRAY_SIZE=10 programe.c
满足条件,就参与编译;不满足条件,就不参与编译
在编译一个程序的时候我们如果要将一条语句(一组语句)编译或者放弃是很方便的,因为我们有条件编译指令:
1. #if 常量表达式 //常量表达式由预处理器求值 //... #endif 如: #define _DEBUG_ 1 int main() { #if _DEBUG_ printf("a"); #endif return 0; }
2.多个分支的条件编译 #if 常量表达式 //... #elif 常量表达式 //... #else //... #endif 如: #define M 1 int main() { #if M == 1 printf("a"); #elif M == 2 printf("b"): #else printf("C"); #endif return 0; }
3.判断是否被定义 //如果定义了 #if defined(symbol)或 #ifdef symbol 如: #define M 2 int main() { #ifdef M printf("a"); #endif return 0; } //如果没定义 #if !defined(symbol)或 #ifndef symbol
4.嵌套指令 #ifdef OS_UNIX #ifdef OPTION1 unix_version_option1(); #endif #ifdef OPTION2 unix_version_option2(); #endif #elif defined(OS_MSDOS) #ifdef OPTION2 msdos_version_option2(): #endif #endif
条件编译通常用于跨平台性代码的编译
一般指自己创建的头文件
#include "filename.h"
查找策略:
先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标准位置查找头文件,如果找不到就提示编译错误。
一般指标准库中头文件的包含
#include
查找策略:
直接去标准路径下去查找,如果找不到就提示编译错误。
那这样是不是就说明,对库文件也可以使用" "
的形式包含呢?
答案是可以的。但是这样查找的效率比较低,也不容易区分是库文件还是本地文件
我们已经知道,#include
指令可以使另外一个文件被编译,就像它实际出现于#include
指令的地方一样。
这种替换的方式很简单:预编译器先删除这条指令,并用被包含文件的内容替换
一个头文件被包含几次,就会被实际编译几次,如果重复包含,编译的压力就比较大
#include "test.h" #include "test.h" #include "test.h" #include "test.h" #include "test.h" int main() { return 0; }
如果像上面这样写,test.h
文件的内容就会被拷贝5份,如果test.h
文件比较大,这样预处理后代码量会剧增。
如果工程比较大,有公共使用的文件,被大家都能用,又不做任何的处理,那么后果会不堪设想。
为了解决头文件被重复引入的问题,就要用到条件编译
我们在每个头文件的开头这样写:
#ifndef __FILENAME_H__ #define __FILENAME_H__ //... #endif
或者
#pragma once
就可以避免头文件的重复引入。
- 预编译是C语言编译过程的第一阶段,在预编译阶段可以对源代码进行预处理,如宏定义、头文件包含等。通过学习预编译过程,可以更全面地理解C语言代码的编译过程。
- 预编译指令能够简化代码结构、提高代码的重用性和可维护性。学习预编译过程可以帮助程序员更好地利用预编译指令优化代码结构,提高代码的质量。
- 条件编译是预编译指令中的重要功能,可以根据不同条件编译不同的代码。通过学习预编译过程,可以了解如何使用条件编译来实现跨平台编译,提高代码的可移植性。