本文共 4778 字,大约阅读时间需要 15 分钟。
strtok函数
头文件:#include <string.h> 函数原型:char * strtok (char *str, const char * delimiters); 参数:str:待分割的字符串(c-string);delimiters:分割符字符串。 该函数用来将字符串分割成一个个片段。参数str指向欲分割的字符串,参数delimiters则为分割字符串中包含的所有字符。当strtok()在参数s的字符串中发现参数delimiters中包涵的分割字符时,则会将该字符改为\0 字符。在第一次调用时,strtok()必需给予参数s字符串,往后的调用则将参数s设置成NULL。每次调用成功则返回指向被分割出片段的指针。 需要注意的是,使用该函数进行字符串分割时,会破坏被分解字符串的完整,调用前和调用后的s已经不一样了。第一次分割之后,原字符串str是分割完成之后的第一个字符串,剩余的字符串存储在一个静态变量中,因此多线程同时访问该静态变量时,则会出现错误。代码举例:
例1:将字符串通过’,’分割开,打印子串并判断原字符串(被分割的字符串)是否发生改变
#include <stdio.h>
#include <string.h>int main()
{ char str[]="ab,cd,ef"; char *ptr; printf("before strtok: str=%s\n",str); printf("begin:\n"); ptr = strtok(str, ","); while(ptr != NULL){ printf("str=%s\n",str); printf("ptr=%s\n",ptr); ptr = strtok(NULL, ","); } return 0; } 输出结果: before strtok: str=ab,cd,ef begin: str=ab ptr=ab str=ab ptr=cd str=ab ptr=ef例2:MSDN例子,字符串中含有多个分隔符
#include <string.h>
#include <stdio.h>char string[] = "A string\tof ,,tokens\nand some more tokens";//被分割的字符串
char seps[] = " ,\t\n";//分隔符集 char *token;//用指针作为标记void main( void )
{ printf( "%s\n\nTokens:\n", string ); /* 建立字符串并获取第一个标记(指向子串的首地址) */ token = strtok( string, seps ); while( token != NULL ) { /* 在“string”中有标记*/ printf( " %s\n", token ); /* 得到下一个标记*/ token = strtok( NULL, seps ); } } 输出结果: A string of ,,tokens and some more tokensTokens:
A string of tokens and some more tokens结论:strtok在切割字符串的过程,实际上就是将被分割的字符串的分隔字符替换为‘\0’ 并且返回标记字符串的首地址,直到返回NULL结束。
stotok函数的实现原理
函数代码:
#include<stdio.h>
#include<string.h> //根据函数原型实现strtok()函数 char* myStrtok_origin(char* str_arr,const char* delimiters,char** temp_str) { //定义一个指针来指向待分解串 char* b_temp; /* * 1、判断参数str_arr是否为空,如果是NULL就以传递进来的temp_str作为起始位置; * 若不是NULL,则以str为起始位置开始切分。 */ if(str_arr == NULL) { str_arr =*temp_str; } //2、跳过待分解字符串 //扫描delimiters字符开始的所有分解符 str_arr += strspn(str_arr, delimiters);//寻找第一个子串,返回子串的长度 //3、判断当前待分解的位置是否为'\0',若是则返回NULL,否则继续 if(*str_arr =='\0') { return NULL; } /* * 4、保存当前的待分解串的指针b_temp,调用strpbrk()在b_temp中找分解符, * 如果找不到,则将temp_str赋值为待分解字符串末尾部'\0'的位置, * b_temp没有发生变化;若找到则将分解符所在位置赋值为'\0', * b_temp相当于被截断了,temp_str指向分解符的下一位置。 */ b_temp = str_arr; str_arr = strpbrk(str_arr, delimiters); if(str_arr == NULL) { *temp_str = strchr(b_temp,'\0'); } else { *str_arr ='\0'; *temp_str = str_arr +1; } //5、函数最后部分无论找没找到分解符,都将b_temp返回。 return b_temp; } //使用myStrtok来简化myStrtok_origin函数 char* myStrtok(char* str_arr,const char* delimiters) { static char* last;//静态变量 return myStrtok_origin(str_arr, delimiters,&last); } int main(void) { char buf[]="hello@boy@this@is@heima"; //1、使用myStrtok_origin()函数 char*temp_str = NULL; char*str = myStrtok_origin(buf,"@",&temp_str); while(str) { printf("%s ",str); str = myStrtok_origin(NULL,"@",&temp_str); } //2、使用myStrtok()函数 char*str1 = myStrtok(buf,"@"); while(str1) { printf("%s ",str1); str1 = myStrtok(NULL,"@"); } return 0; } 输出结果: hello boy this is heima hellostrtok_s函数
strtok_s是Windows下的一个分割字符串安全函数,其函数原型 char *strtok_s( char *strToken, const char *strDelimit, char **buf); 数将剩余的字符串存储在buf变量中,而不是静态变量中,从而保证了安全性。代码示例:
例1:使用strtok_s函数分隔字符串
#include <stdio.h>
#include <string.h>int main()
{ char str[]="ab,cd,ef";char *ptr;
printf("before strtok: str=%s\n",str);
printf("begin:\n");char *pTmp = NULL;
ptr = strtok_s(str,",",&pTmp);while(ptr != NULL)
{ printf("str=%s\n",str); printf("ptr=%s\n",ptr); ptr = strtok_s(NULL,",",&pTmp); } return 0; } 输出结果: before strtok: str=ab,cd,ef begin: str=ab ptr=ab str=ab ptr=cd str=ab ptr=efstrtok_r函数
strtok_s函数是linux下分割字符串的安全函数,函数声明如下: char *strtok_r(char *str, const char *delim, char **saveptr); (1)该函数也会破坏带分解字符串的完整性,但是其将剩余的字符串保存在saveptr变量中,保证了安全性。 (2)在函数strtok中剩余字符串是存储在一个静态变量中,因此,多线程在使用该静态变量时引起冲突;而strtok_r则使用用户传入的指针为每个用户saveptr重新申请变量,因而可以保证线程安全。 (3)strtok_r函数是strtok函数的可重入版本,也即线程安全版本。str为要分解的字符串,delim为分隔符字符串。char *saveptr参数是一个指向char 的指针变量,用来在strtok_r内部保存切分时的上下文,以应对连续调用分解相同源字符串。代码示例:
#include <stdio.h>
#include <string.h>int main()
{ char str[]="ab,cd,ef"; char *ptr; char *p; printf("before strtok: str=%s\n",str); printf("begin:\n"); ptr = strtok_r(str, ",", &p); while(ptr != NULL){ printf("str=%s\n",str); printf("ptr=%s\n",ptr); ptr = strtok_r(NULL, ",", &p); } return 0; } 输出结果: 拓展: 可重入函数: (1)重入即表示重复进入,首先它意味着这个函数可以被中断,其次意味着它除了使用自己栈上的变量以外不依赖于任何环境(包括static),这样的函数就是purecode(纯代码)可重入,可以允许有该函数的多个副本在运行,由于它们使用的是分离的栈,所以不会互相干扰。如果确实需要访问全局变量(包括static),一定要注意实施互斥手段。可重入函数在并行运行环境中非常重要,但是一般要为访问全局变量付出一些性能代价。 (2)指一个可以被多个任务调用的函数(过程),任务在调用时不必担心数据是否会出错。 不可重入函数: 如果函数接口的代码实现中在块内定义和使用了static存储类型的变量,这种函数将是不可重入函数。它在实时系统中是不安全函数。 参考:http://blog.csdn.net/jiangqin115/article/details/48545895 http://www.cnblogs.com/Bob-tong/p/6610806.html http://blog.csdn.net/lavorange/article/details/47134121 ———————————————— 版权声明:本文为CSDN博主「yishizuofei」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.csdn.net/yishizuofei/article/details/78232946