c语言 sscanf,scanf,fscanf正则表达式用法

 更新时间:2018年04月19日 16:22:13   投稿:mdxy-dxy  
每种语言都对正则表达式有着不同程度的支持,在C语言中,有输入功能的这三个函数对正则表达式的支持并不强大,但是我们还是有必要了解一下

每种语言都对正则表达式有着不同程度的支持,在C语言中,有输入功能的这三个函数对正则表达式的支持并不强大,但是我们还是有必要了解一下。

首先来看看他们的原型:

#include <stdio.h>
int scanf(const char *format, ...);
int fscanf(FILE *stream, const char *format, ...);
int sscanf(const char *str, const char *format, ...);

均可以接受变参,sscanf与scanf类似,可以将标准输入(stdin)作为输入源。最关键的部分,就是format这个参数了。它可以是一个或者多个 {%[*] [width] [{h | l | I64 | L}]type | ' ' | '\t' | '\n' | 非%符号}。

参数解释:

  1、 * 亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中)

  2、{a|b|c}表示a,b,c中选一,[d],表示可以有d也可以没有d。

  3、width表示读取宽度。

  4、{h | l | I64 | L}:参数的size,通常h表示单字节size,I表示2字节 size,L表示4字节size(double例外),l64表示8字节size。

  5、type : 就是%s,%d之类。

  6、特别的:%*[width] [{h | l | I64 | L}]type 表示满足该条件的被过滤掉,不会向目标参数中写入值

支持的集合操作:%[a-z] 表示匹配a到z中任意字符,贪婪性(尽可能多的匹配)%[aB'] 匹配a、B、'中一员,贪婪性%[^a] 匹配非a的任意字符,贪婪性

返回值

这三个函数返回成功匹配和分配的输入项。意思就是你在format参数列表中的格式,返回值可以比你提供的匹配项目数少(有些将会匹配失败)。提前匹配失败则返回0。如果达到文件末尾,则返回EOF,当发生错误的时候也将返回EOF。你可以通过输出errno来查看错误代码。

如果使用fscanf来判断文件是否结束,将会存在安全隐患,如果每次读取的时候都是匹配失败,那么返回值永远都不会是EOF。scanf族的函数都是要先将数据读入缓冲区,然后在冲缓冲里读取。

注意:scanf族函数会忽略一行开始的空白

sscanf/scanf正则用法

%[ ] 的用法:

 %[ ] 表示要读入一个字符集合 , 如果 [ 后面第一个字符是 ”^” ,则表示反意思。

[ ] 内的字符串可以是 1 或更多字符组成。空字符集( %[] )是违反规定的,可

导致不可预知的结果。 %[^] 也是违反规定的。

%[a-z] 读取在 a-z 之间的字符串,如果不在此之前则停止,如

char s[]="hello, my friend” ; // 注意 : , 逗号在不 a-z 之间
sscanf( s, “%[a-z]”, string ) ; // string=hello

%[^a-z] 读取不在 a-z 之间的字符串,如果碰到 a-z 之间的字符则停止,如

char s[]="HELLOkitty” ;// 注意 : , 逗号在不 a-z 之间
sscanf( s, “%[^a-z]”, string ) ; // string=HELLO

%*[^=] 前面带 * 号表示不保存变量。跳过符合条件的字符串。

char s[]="notepad=1.0.0.1001" ;
char szfilename [32] = "" ;
int i = sscanf( s, "%*[^=]", szfilename ) ; // szfilename=NULL, 因为没保存
int i = sscanf( s, "%*[^=]=%s", szfilename ) ; // szfilename=1.0.0.1001

%40c 读取 40 个字符

The run-time
library does not automatically append a null terminator to the string, nor does reading 40 characters
automatically terminate the scanf() function. Because the library uses buffered input, you must press the ENTER key to terminate the string scan. If you press the ENTER before the scanf() reads 40 characters, it is displayed normally, and the library continues to prompt for additional input until it reads 40 characters

%[^=] 读取字符串直到碰到 '=' 号, '^' 后面可以带更多字符 , 如:

char s[]="notepad=1.0.0.1001" ;
char szfilename [32] = "" ;
int i = sscanf( s, "%[^=]", szfilename ) ; // szfilename=notepad 

如果参数格式是: %[^=:] ,那么也可以从 notepad:1.0.0.1001 读取 notepad

使用例子:

char s[]="notepad=1.0.0.1001" ;
char szname [32] = "" ;
char szver [32] = “” ;
sscanf( s, "%[^=]=%s", szname , szver ) ; // szname=notepad, szver=1.0.0.1001

总结: %[] 有很大的功能,但是并不是很常用到,主要因为:

1 、许多系统的 scanf 函数都有漏洞 . ( 典型的就是 TC 在输入浮点型时有时会出错 ).
2 、用法复杂 , 容易出错 .
3 、编译器作语法分析时会很困难 , 从而影响目标代码的质量和执行效率 .

个人觉得第 3 点最致命,越复杂的功能往往执行效率越低下。而一些简单的字符串分析我们可以自已处理。

C语言中scanf(),sscanf(),fscanf()的用法和区别

scanf(),sscanf(),fscanf()区别:
第一个是从控制台(键盘)输入;
第二个是从字符串输入;
第三个是从文件输入;
scanf
scanf()函数根据由format(格式)指定的格式从stdin(标准输入)读取,并保存数据到其它参数.

int main()
{
  int a,b,c;
  printf("输入:a,b,c\n");
  scanf("%d,%d,%d",&a,&b,&c);
  printf("a = %d b = %d c = %d",a,b,c);
  return 0;
}

sscanf
函数sscanf()和scanf()类似, 只是输入从buffer(缓冲区)中读取.
sscanf与scanf类似,都是用于输入的,只是后者以屏幕(stdin)为输入源,前者以固定字符串为输入源

用法:
%[ ]表示要读入一个字符集合, 如果[ 后面第一个字符是”^”,则表示反意思。[ ]内的字符串可以是1或更多字符组成。空字符集(%[])是违反规定的,可导致不可预知的结果。%[^]也是违反规定的。

1. 常见用法。

char buf[512] ;
sscanf("123456 ", "%s", buf);//此处buf是数组名,它的意思是将123456以%s的形式存入buf中!
printf("%s\n", buf);
结果为:123456

2. 取指定长度的字符串。如在下例中,取最大长度为4字节的字符串。

sscanf("123456 ", "%4s", buf);
printf("%s\n", buf);
结果为:1234

3. 取到指定字符为止的字符串。如在下例中,取遇到空格为止字符串。

sscanf("123456 abcdedf", "%[^ ]", buf);
printf("%s\n", buf);
结果为:123456

4. 取仅包含指定字符集的字符串。如在下例中,取仅包含1到9和小写字母的字符串。

sscanf("123456abcdedfBCDEF", "%[1-9a-z]", buf);
printf("%s\n", buf);
结果为:123456abcdedf
当输入: sscanf("123456abcdedfBCDEF","%[1-9A-Z]",buf);
printf("%s\n",buf);
结果为:123456

5. 取到指定字符集为止的字符串。如在下例中,取遇到大写字母为止的字符串。

sscanf("123456abcdedfBCDEF", "%[^A-Z]", buf);
printf("%s\n", buf);
结果为:123456abcdedf

6、给定一个字符串iios/12DDWDFF@122,获取 / 和 @ 之间的字符串,

先将 "iios/"过滤掉,再将非'@'的一串内容送到buf中
sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf);
printf("%s\n", buf);
结果为:12DDWDFF

7、给定一个字符串“hello, world”,仅保留world。

(注意:“,”之后有一空格,%s遇空格停止,加*则是忽略第一个读到的字符串)
sscanf(“hello, world”, "%*s%s", buf);
printf("%s\n", buf);
结果为:world
%*s表示第一个匹配到的%s被过滤掉,即“hello,”被过滤了
如果没有空格则结果为NULL。

相关文章

  • C语言实现链队列基本操作

    C语言实现链队列基本操作

    这篇文章主要为大家详细介绍了C语言实现链队列基本操作,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-09-09
  • c++ decltype关键字的用法

    c++ decltype关键字的用法

    这篇文章主要介绍了c++ decltype关键字的用法,帮助大家更好的理解和学习c++,感兴趣的朋友可以了解下
    2020-10-10
  • C语言零基础彻底掌握预处理下篇

    C语言零基础彻底掌握预处理下篇

    在C语言的程序中包括各种以符号#开头的编译指令,这些指令称为预处理命令。预处理命令属于C语言编译器,而不是C语言的组成部分,通过预处理命令可扩展C语言程序设计的环境
    2022-08-08
  • c++ priority_queue用法入门超详细教程

    c++ priority_queue用法入门超详细教程

    priority_queue即优先级队列,它的使用场景很多,它底层是用大小根堆实现的,可以用log(n)的时间动态地维护数据的有序性,这篇文章主要介绍了c++ priority_queue用法入门超详细教程,需要的朋友可以参考下
    2023-12-12
  • C语言 指针的初始化赋值案例详解

    C语言 指针的初始化赋值案例详解

    这篇文章主要介绍了C语言 指针的初始化赋值案例详解,本篇文章通过简要的案例,讲解了该项技术的了解与使用,以下就是详细内容,需要的朋友可以参考下
    2021-08-08
  • C++ Opencv imfill孔洞填充函数的实现思路与代码

    C++ Opencv imfill孔洞填充函数的实现思路与代码

    在Matlab下,使用imfill可以很容易的完成孔洞填充操作,下面这篇文章主要给大家介绍了关于C++ Opencv imfill孔洞填充函数的实现思路与代码,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2021-09-09
  • 面向对象三大特性的意义讲解

    面向对象三大特性的意义讲解

    今天小编就为大家分享一篇关于面向对象三大特性的意义讲解,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-12-12
  • 基于ROS 服务通信模式详解

    基于ROS 服务通信模式详解

    今天小编就为大家分享一篇基于ROS 服务通信模式详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • C语言数据结构之串插入操作

    C语言数据结构之串插入操作

    这篇文章主要介绍了C语言数据结构之串插入操作的相关资料,希望通过本文能帮助到大家,让大家实现这样的功能,需要的朋友可以参考下
    2017-10-10
  • C语言中反斜杠的作用及说明

    C语言中反斜杠的作用及说明

    这篇文章主要介绍了C语言中反斜杠的作用及说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-07-07

最新评论