字符串切割函数strtok、strtok_s、strtok

字符串切割函数strtok、strtok_s、strtok_r的区别

阅读量：4223 次

发布时间：2019-05-26

本文共 4778 字，大约阅读时间需要 15 分钟。

strtok函数

头文件：#include <string.h>

函数原型：char * strtok (char *str, const char * delimiters);

参数：str：待分割的字符串（c-string）；delimiters：分割符字符串。

该函数用来将字符串分割成一个个片段。参数str指向欲分割的字符串，参数delimiters则为分割字符串中包含的所有字符。当strtok()在参数s的字符串中发现参数delimiters中包涵的分割字符时，则会将该字符改为\0 字符。在第一次调用时，strtok()必需给予参数s字符串，往后的调用则将参数s设置成NULL。每次调用成功则返回指向被分割出片段的指针。

需要注意的是，使用该函数进行字符串分割时，会破坏被分解字符串的完整，调用前和调用后的s已经不一样了。第一次分割之后，原字符串str是分割完成之后的第一个字符串，剩余的字符串存储在一个静态变量中，因此多线程同时访问该静态变量时，则会出现错误。

代码举例：

例1：将字符串通过’，’分割开，打印子串并判断原字符串（被分割的字符串）是否发生改变

#include <stdio.h>

#include <string.h>

int main()

{

char str[]="ab,cd,ef";

char *ptr;

printf("before strtok: str=%s\n",str);

printf("begin:\n");

ptr = strtok(str, ",");

while(ptr != NULL){

printf("str=%s\n",str);

printf("ptr=%s\n",ptr);

ptr = strtok(NULL, ",");

}

return 0;

}

输出结果：

before strtok: str=ab,cd,ef

begin:

str=ab

ptr=ab

str=ab

ptr=cd

str=ab

ptr=ef

例2：MSDN例子，字符串中含有多个分隔符

#include <string.h>

#include <stdio.h>

char string[] = "A string\tof ,,tokens\nand some more tokens";//被分割的字符串

char seps[] = " ,\t\n";//分隔符集

char *token;//用指针作为标记

void main( void )

{

printf( "%s\n\nTokens:\n", string );

/* 建立字符串并获取第一个标记（指向子串的首地址） */

token = strtok( string, seps );

while( token != NULL )

{

/* 在“string”中有标记*/

printf( " %s\n", token );

/* 得到下一个标记*/

token = strtok( NULL, seps );

}

输出结果：

A string of ,,tokens

and some more tokens

Tokens:

string

tokens

and

some

tokens

结论：strtok在切割字符串的过程，实际上就是将被分割的字符串的分隔字符替换为‘\0’ 并且返回标记字符串的首地址，直到返回NULL结束。

stotok函数的实现原理

函数代码：

#include<stdio.h>

#include<string.h>

//根据函数原型实现strtok()函数

char* myStrtok_origin(char* str_arr,const char* delimiters,char** temp_str)

{

//定义一个指针来指向待分解串

char* b_temp;

* 1、判断参数str_arr是否为空，如果是NULL就以传递进来的temp_str作为起始位置；

* 若不是NULL，则以str为起始位置开始切分。

if(str_arr == NULL)

{

str_arr =*temp_str;

}

//2、跳过待分解字符串

//扫描delimiters字符开始的所有分解符

str_arr += strspn(str_arr, delimiters);//寻找第一个子串，返回子串的长度

//3、判断当前待分解的位置是否为'\0'，若是则返回NULL，否则继续

if(*str_arr =='\0')

{

return NULL;

}

* 4、保存当前的待分解串的指针b_temp，调用strpbrk()在b_temp中找分解符，

* 如果找不到，则将temp_str赋值为待分解字符串末尾部'\0'的位置，

* b_temp没有发生变化；若找到则将分解符所在位置赋值为'\0',

* b_temp相当于被截断了，temp_str指向分解符的下一位置。

b_temp = str_arr;

str_arr = strpbrk(str_arr, delimiters);

if(str_arr == NULL)

{

*temp_str = strchr(b_temp,'\0');

}

else

{

*str_arr ='\0';

*temp_str = str_arr +1;

}

//5、函数最后部分无论找没找到分解符，都将b_temp返回。

return b_temp;

}

//使用myStrtok来简化myStrtok_origin函数

char* myStrtok(char* str_arr,const char* delimiters)

{

static char* last;//静态变量

return myStrtok_origin(str_arr, delimiters,&last);

}

int main(void)

{

char buf[]="hello@boy@this@is@heima";

//1、使用myStrtok_origin()函数

char*temp_str = NULL;

char*str = myStrtok_origin(buf,"@",&temp_str);

while(str)

{

printf("%s ",str);

str = myStrtok_origin(NULL,"@",&temp_str);

}

//2、使用myStrtok()函数

char*str1 = myStrtok(buf,"@");

while(str1)

{

printf("%s ",str1);

str1 = myStrtok(NULL,"@");

}

return 0;

}

输出结果：

hello boy this is heima hello

strtok_s函数

strtok_s是Windows下的一个分割字符串安全函数，其函数原型

char *strtok_s( char *strToken, const char *strDelimit, char **buf);

数将剩余的字符串存储在buf变量中，而不是静态变量中，从而保证了安全性。

代码示例：

例1：使用strtok_s函数分隔字符串

#include <stdio.h>

#include <string.h>

int main()

{

char str[]="ab,cd,ef";

char *ptr;

printf("before strtok: str=%s\n",str);

printf("begin:\n");

char *pTmp = NULL;

ptr = strtok_s(str,",",&pTmp);

while(ptr != NULL)

{

printf("str=%s\n",str);

printf("ptr=%s\n",ptr);

ptr = strtok_s(NULL,",",&pTmp);

}

return 0;

}

输出结果：

before strtok: str=ab,cd,ef

begin:

str=ab

ptr=ab

str=ab

ptr=cd

str=ab

ptr=ef

strtok_r函数

strtok_s函数是linux下分割字符串的安全函数，函数声明如下：

char *strtok_r(char *str, const char *delim, char **saveptr);

（1）该函数也会破坏带分解字符串的完整性，但是其将剩余的字符串保存在saveptr变量中，保证了安全性。

（2）在函数strtok中剩余字符串是存储在一个静态变量中，因此，多线程在使用该静态变量时引起冲突；而strtok_r则使用用户传入的指针为每个用户saveptr重新申请变量，因而可以保证线程安全。

（3）strtok_r函数是strtok函数的可重入版本，也即线程安全版本。str为要分解的字符串，delim为分隔符字符串。char *saveptr参数是一个指向char 的指针变量，用来在strtok_r内部保存切分时的上下文，以应对连续调用分解相同源字符串。

代码示例：

#include <stdio.h>

#include <string.h>

int main()

{

char str[]="ab,cd,ef";

char *ptr;

char *p;

printf("before strtok: str=%s\n",str);

printf("begin:\n");

ptr = strtok_r(str, ",", &p);

while(ptr != NULL){

printf("str=%s\n",str);

printf("ptr=%s\n",ptr);

ptr = strtok_r(NULL, ",", &p);

}

return 0;

}

输出结果：

拓展：

可重入函数：

（1）重入即表示重复进入，首先它意味着这个函数可以被中断，其次意味着它除了使用自己栈上的变量以外不依赖于任何环境（包括static），这样的函数就是purecode（纯代码）可重入，可以允许有该函数的多个副本在运行，由于它们使用的是分离的栈，所以不会互相干扰。如果确实需要访问全局变量（包括static），一定要注意实施互斥手段。可重入函数在并行运行环境中非常重要，但是一般要为访问全局变量付出一些性能代价。

（2）指一个可以被多个任务调用的函数（过程），任务在调用时不必担心数据是否会出错。

不可重入函数：

如果函数接口的代码实现中在块内定义和使用了static存储类型的变量，这种函数将是不可重入函数。它在实时系统中是不安全函数。

参考：http://blog.csdn.net/jiangqin115/article/details/48545895

http://www.cnblogs.com/Bob-tong/p/6610806.html

http://blog.csdn.net/lavorange/article/details/47134121

————————————————

原文链接：https://blog.csdn.net/yishizuofei/article/details/78232946

你可能感兴趣的文章

C++文件操作详解

查看>>

STL标准