字符函数和字符串函数
C语言中字符和字符串的使用非常之多。为了提高代码的效率以及精简代码,C语言规定了一系列的字符函数和字符串函数。接下来对常用的函数进行介绍。
字符函数
字符分类函数
格式:is+与作用相关英文():
作用:用于区分字符的类别。这些类别包括字母、数字、标点符号、空格等。
头文件:ctype.h
常见的字符分类函数包括:
1. isalnum():检查字符是否是字母或数字。
2. isalpha():检查字符是否是字母。
3. isdigit():检查字符是否是数字。
4. islower():检查字符是否是小写字母。
5. isupper():检查字符是否是大写字母。
6. isspace():检查字符是否是空格字符。
7. ispunct():检查字符是否是标点符号。
8. isprint():检查字符是否是可打印字符(包括图形字符和空白字符)。
9. isnumeric():检查字符是否是数字字符(包括Unicode数字字符)。
10. isdecimal():检查字符是否是十进制数字字符。
用法:(以islower为例)
int islower (int c)//检测c是否为小写字母
通过返回值确定是否为小写字母。如果返回值是非0,则是小写字母,如果是0,则不是小写字母。
字符转换函数
格式:1.to+与作用相关英文() 2.ato+目标转换类别英文缩写()
作用:用于将字符转换为不同的类别。
头文件:ctype.h
常见的字符转换函数包括:
1. tolower():将字符转换为小写形式。
2. toupper():将字符转换为大写形式。
3. atoi():将字符串转换为整数。
4. atof():将字符串转换为浮点数。
官网地址:cplusplus.com/reference/cctype/
字符串函数
strlen函数
string length的缩写----字符串长度计算
格式:
size_t strlen ( const char * str );
作用:字符串以\0为结束标志,strlen函数计算的是\0前的字符个数。(不包含\0)
头文件:string.h
要求:
• 参数指向的字符串必须要以 '\0' 结束。
• 注意函数的返回值为size_t,是⽆符号的。
实例
//strlen的实例
int main()
{const char* arr = "abcdef";printf_s("%u", strlen(arr));return 0;
}
模拟实现
//strlen的模拟实现
size_t my_strlen(const char* str)
{assert(str);if (*str == '\0')return 0;elsereturn 1 + my_strlen(str + 1);
}
strcpy函数
string copy的缩写----字符串拷贝
格式:
char* strcpy(char * dest, const char * src);
作用:将源字符串src
的内容复制到目标字符串dest
中,直到遇到源字符串的结束符\0
为止。
头文件:string.h
要求:
• 源字符串以 '\0' 结束。
• 会将源字符串中的 '\0' 也复制到⽬标空间。
• ⽬标空间必须⾜够⼤,以确保能存放源字符串。
• ⽬标空间必须可修改。
实例
//strcpy的实例
int main()
{char arr1[20] = { 0 };char arr2[] = "hello world";strcpy(arr1, arr2);printf_s("%s", arr1);return 0;
}
模拟实现
//strcpy的模拟实现
char* my_strcpy(char* dest, char* src)
{assert(dest != NULL);assert(src != NULL);char* ret = dest;while (*dest++ = *src++){;}return ret;
}
strcat函数
string concatenate的缩写----字符串连接
格式:
char *strcat(char *dest, const char*src)
作用:将源字符串src的内容连接到目标字符串dest的末尾。
头文件:string.h
要求:
• 源字符串必须以 '\0' 结束。
• ⽬标字符串中也得有‘\0’ ,追加从此处开始,并且覆盖目标字符串的‘\0’
• ⽬标空间必须⾜够⼤,以确保能存放源字符串
• ⽬标空间必须可修改。
实例
//strcat的实例
int main()
{char arr1[99] = { "hello" };char arr2[] = { " world" };strcat(arr1, arr2);printf_s("%s", arr1);return 0;
}
模拟实现
//strcat的模拟实现
char* my_strcat(char* dest, char* src)
{char* ret = dest;assert(dest && src);//找到目标空间\0while (*dest){dest++;}//拷贝while (*dest++ = *src++){;}
}
注:strcat函数追加自己时,会出现找不到‘\0’而进入死循环的情况。
strcmp函数
string compare的缩写----字符串比较
格式:
int strcmp (const char* str1,const char* str2)
作用:
进行str1-str2的操作
第⼀个字符串⼤于第⼆个字符串,则返回⼤于0的数字 ;
第⼀个字符串等于第⼆个字符串,则返回0 ;
第⼀个字符串⼩于第⼆个字符串,则返回⼩于0的数字。
头文件:string.h
要求:
• 比较是按照ASCII码顺序逐个字符进行的,从两个字符串的首字符开始逐个比较,直到遇到不相等的字符或者遇到字符串结束符\0
为止
注意:比较不是按照字符串长度进行的。
实例
//strcmp的实例
int main()
{int ret = strcmp("abcabc", "abcabcabc");printf_s("%d", ret);return 0;
}
模拟实现
//strcmp的模拟实现
int my_strcmp(const char* str1, const char* str2)
{int ret = 0;while (*str1 == *str2){if (*str1 == '\0')return 0;//判断等于0的情况str1++;str2++;}return *str1 - *str2;//判断大于或小于0的情况
}
strncpy、strncat、strncmp函数
一般来说,使用n形式函数会更安全,因为它可以避免缓冲区溢出的问题。但是在使用n形式函数时需要注意,要确保目标字符串的长度足够大,以便能够容纳源字符串的内容。
它们的格式差别只不过是在后面额外增加了一个size_t num来限制字符串的长度。
对于strncpy
• 拷⻉num个字符从源字符串到⽬标空间。
• 如果源字符串的⻓度⼩于num,则拷⻉完源字符串之后,在⽬标的后边追加0,直到num个。
对于strncat
• 将source指向字符串的前num个字符追加到destination指向的字符串末尾,再追加⼀个 \0 字符。
• 如果source 指向的字符串的⻓度⼩于num的时候,只会将字符串中到 \0 的内容追加到destination指向的字符串末尾。
对于strncmp
⽐较str1和str2的前num个字符,如果相等就继续往后⽐较,最多⽐较num个字⺟,如果提前发现不一样,就提前结束,⼤的字符所在的字符串⼤于另外⼀个。如果num个字符都相等,就是相等返回0。
strstr函数
代表两个str
格式:
char * strstr ( const char * str1, const char * str2);
作用:返回字符串str2在字符串str1中第⼀次出现的位置
头文件:string,h
要求:
• 如果找到了子字符串,则返回指向该位置的指针;如果未找到,则返回NULL。
实例
int main()
{char arr1[] = "abbbcdef";char arr2[] = "bbq";char* ret =strstr(arr1, arr2);if (ret != NULL)printf("%s\n", ret);elseprintf("not found\n");return 0;
}
模拟实现
//strstr的模拟实现
char* my_strstr(const char* str1, const char* str2)
{const char* dee = str1;const char* s1 = NULL;const char* s2 = NULL;assert(str1 && str2);if (*str2 == '\0'){return (char*)str1;}while (*dee){s1 = dee;s2 = str2;while (*s1 == *s2){s1++;s2++;}if (*s2 == '\0'){return (char*)dee;}dee++;}return NULL;
}
strtok函数
string token的缩写----字符串标记
格式:
char * strtok ( char * str, const char * sep);
作用:会特别标记分隔符,并且返回分隔符前的字符串部分。
头文件:string.h
要求:
• sep参数指向一个字符串,定义了用作分隔符的字符集合。
• 第⼀个参数指定整个字符串,它包含了0个或者多个由sep字符串中⼀个或者多个分隔符分割的标 记。
• strtok函数找到str中的下⼀个标记,并将其用 \0 结尾,返回⼀个指向这个标记的指针。(注: strtok函数会改变被操作的字符串, 所以一般会使用strcpy先拷贝一份字符串再对其进行操作)
• strtok函数的第⼀个参数不为 NULL ,函数将找到str中第⼀个标记,strtok函数将保存它在字符串 中的位置。(即具有记忆功能)
• strtok函数的第⼀个参数为 NULL ,函数将在同⼀个字符串中被保存的位置开始,查找下⼀个标 记。(根据此特性,通常使用循环来使得将由分隔符分割的所有字符串的部分全部依次打印出来)
• 如果字符串中不存在更多的标记,则返回 NULL 指针。
实例
//strtok的实例
int main() {char str[] = "Hello,world;this,is;a,test";char* token = strtok(str, ",;");while (token != NULL) {printf("%s\n", token);token = strtok(NULL, ",;");}return 0;
}
模拟实现
//strtok的模拟实现
char* my_strtok(char* str, const char* sep)
{static char* lastToken = NULL;//用于保留上一次分割的位置char* token;if (str != NULL) //不指向NULL的情况{lastToken = str;}if (lastToken == NULL)//指向NULL的情况 {return NULL;}token = lastToken;while (*lastToken != '\0') //遍历整个字符串{if (strchr(sep, *lastToken) != NULL) {*lastToken = '\0';lastToken++;return token;}lastToken++;}lastToken = NULL;return token;
}
strerror/perror函数
string error的缩写----字符串错误
格式:
char * strerror ( int errnum );
作用:返回参数部分对应的错误信息
头文件:
stdio.h
string.h
errno.h
要求:
• strerror函数只能做到返回错误信息,还需要使用printf将其打印出来;所以我们也可以使用perror函数,它的作用是在得到错误信息的同时还会将错误信息直接打印。