设为首页 加入收藏

TOP

C语言字符串分割——strtok
2013-07-22 17:57:44 来源: 作者: 【 】 浏览:309
Tags:语言 字符串 分割 strtok

  之前遇到字符串分割的需求时,都是自己去实现,最近发现其实c标准库已经提供了这个功能。对标准库还是不熟悉啊,导致重复造车轮了,有必要把标准库看一下。。。

  先看一下之前自己实现的字符串分割函数:

  [cpp]

  void strsplit(const char *str, char *delim, void (*visitor)(const char *, int, int)){

  int i, k_s, k_e, s_len, d_len;

  s_len = strlen(str);

  d_len = strlen(delim);

  assert(str!=NULL && delim!=NULL && visitor!=NULL);

  k_s = k_e = 0;

  while(k_e < s_len){

  if( (k_e + d_len <= s_len) && strncmp(str+k_e, delim, d_len) == 0 ){

  if(k_e > k_s)

  visitor(str, k_s, k_e);

  k_s = k_e = k_e + d_len;

  }else{

  k_e++;

  }

  }

  if(k_e > k_s){

  visitor(str, k_s, k_e);

  }

  }

  str:要分割的字符串的字符串。

  delim:分隔符,可以是多个字符的字符串。

  visitor:函数指针,在识别出子串时调用。

  对于字符串"abc##123###a##",分隔符是"##",会将其分割为"abc","123",“#a”。也就是说,要分割的字符串中的子串必须与分割字符串相等,才算做分隔符,而不是只要包含在分割字符串就算做分隔符,这个与标准库的有点不同。但是对于分隔符只有一个字符的情况与标准库的执行结果是相同的,比如:如果上面的字符串的分割符是"#",那么最后结果就是"abc",“123”,"a"。

  出现这个不一致,是因为如果某个子串与分割字符串相等,那么直接跳过strlen(分割字符串)个字符,然后继续检查。如果这里改成跳到下一个字符然后继续检查,那么就会和标准库的函数得到一样的结果。就是把第13行替换为:

  [cpp]

  k_e++;

  k_s = k_e + (d_len - 1);

  上面介绍了分割字符串的实现,下面看一下标准库提供的函数strtok。

  [cpp]

  char *strtok(char *str, const char *delim);

  str:要分割的字符串。

  delim:分割字符串,包含在分割字符串中的字符都会被当做是分割字符而丢弃掉。

  看个例子:

  [cpp]

  #include <string.h>

  #include <stdio.h>

  #include <stdlib.h>

  int

  main(int argc, char **argv){

  char *s, *d, *t;

  if(argc < 3){

  printf("%s\n", "wrong args. usage: str delim");

  exit(1);

  }

  s = argv ;

  d = argv ;

  t = strtok(s, d);

  while(t != NULL){

  printf("%s\n", t);

  t = strtok(NULL, d);

  }

  }

  第一次调用strtok需要传入要分割的字符串str进行初始化,随后对同一个字符串继续分割传入NULL即可。这个地方需要注意,如果不传入NULL,那么就会出现死循环,一直返回str第一个被分割出的子串。

  分割字符串delim每次都可以传入不同的字符串,也就是说可以根据不同的分隔符分割字符串,不过这样的需求还是比较不常用的。

  通过这个函数以后完成配置文件的解析就比较方便了,不用再被各种各样的bug打扰。

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到: 
上一篇处理C语言之vfprintf的段错误 下一篇C语言的数据类型转换

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容: