C++从文件中提取英文单词的实现方法

 更新时间:2022年06月16日 10:02:14   作者:想吃读研的苦  
本文主要介绍了C++从文件中提取英文单词的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

首先,要准备好words.txt(英文文章)置于工程目录下

思路:

1.打开文件

2.读取每一行

3.找到特殊的标点符号的位置,进行删除。

4.根据空格截取单词 find(" ");

5.将拿到的每一个单词放在链表中

一:读取一行,去除该行标点符号

#include<iostream>
using namespace std;
#include<fstream>
#include<string>
#include<list>
void test_word_split();
 
int main()
{
	test_word_split();
	return 0;
}
 
void test_word_split()
{
	fstream fs;
	char filename[20] = {0};
	cout<<"请输入打开的文件名:";
	cin>>filename;
	//打开文件
	fs.open(filename);
	cout<<"打开成功"<<filename<<endl;
	char buf[1024] = {0};
	fs.getline(buf,1024);//读取每一行
	cout<<buf<<endl;
	size_t pos;   //找到位置
	string line;  //接替buf职责
	line = buf;
	pos = line.find_first_of(",.;:'?!()/\"");  //找特殊的标点符号
	while(pos!=string::npos)
	{   //删除单个字符
		line.erase(pos,1);
		//再找下一个单个的字符
	   pos = line.find_first_of(",.;:'?!()/\""); 
	}
	cout<<line.c_str()<<endl; //string 转char
}
 

二:截取单词

#include<iostream>
using namespace std;
#include<fstream>
#include<string>
#include<list>
void test_word_split();
 
int main()
{
	test_word_split();
	return 0;
}
 
void test_word_split()
{
	fstream fs;
	char filename[20] = {0};
	cout<<"请输入打开的文件名:";
	cin>>filename;
	//打开文件
	fs.open(filename);
	cout<<"打开成功"<<filename<<endl;
	char buf[1024] = {0};
	fs.getline(buf,1024);//读取每一行
	cout<<buf<<endl;
	size_t pos;
	string line,word;
	line = buf;
	pos = line.find_first_of(",.;:'?!()/\"");  //找特殊的标点符号
	while(pos!=string::npos)
	{   //删除单个字符
		line.erase(pos,1);   //从什么位置开始删除多长的字符
		//再找下一个单个的字符
	    pos = line.find_first_of(",.;:'?!()/\""); 
	}
	cout<<line.c_str()<<endl; //string 转char
	//根据空格截取单词 find("")  111 222 333
	pos = line.find(" ");
	while(pos!=string::npos)
	{
		//截取单词
		word = line.substr(0,pos);//从0开始,一直截到空格所在位置
		cout<<word<<endl;     
		//把第一个单词以及空格删除
		line.erase(0,pos+1);  //从什么位置开始删除多长的字符(如删111 )因此pos+1
		pos = line.find(" "); //寻找下一个空格
	}
}
 

三:将拿到的每一个单词都放在链表中

#include<iostream>
using namespace std;
#include<fstream>
#include<string>
#include<list>
void test_word_split();
 
int main()
{
	test_word_split();
	return 0;
}
 
void test_word_split()
{
	list<string> wordList;//链表
	fstream fs;
	char filename[20] = {0};
	cout<<"请输入打开的文件名:";
	cin>>filename;
	fs.open(filename);
	cout<<"打开成功"<<filename<<endl;
	char buf[1024] = {0};
	string line,word;  //初始化定义
	while(fs.getline(buf, 1024))//读取每一行
	{
		size_t pos;  //找到位置
		line = buf;  //接替buf职责
		pos = line.find_first_of(",.;:'?!()/\"");
		while(pos!=string::npos)//!=npos就找到
		{
			line.erase(pos,1);  //从什么位置开始删除多长字符
			pos = line.find_first_of(",.;:'?!()/\"");//寻找下一个标点符号
		}
		pos = line.find(" ");  //寻找空格所在位置
		while(pos!=string::npos)
		{
			word = line.substr(0,pos);//从0开始,一直截到空格所在位置
			wordList.push_back(word); //拿到的单词放在链表中
			//把第一个单词以及空格删除
			line.erase(0, pos+1);//从什么位置开始删除多长的字符(如删111 )因此pos+1
			pos = line.find(" ");//寻找下一个空格
		}
	}
	cout<<"验证一下"<<endl;
	list<string>::iterator it;
	for(it = wordList.begin();it!=wordList.end();it++)
	{
		cout<<(*it).c_str()<<endl;
	}
	cout<<"总的个数:"<<wordList.size();
	fs.close();
}

最后的结果:

 到此这篇关于C++从文件中提取英文单词的实现方法的文章就介绍到这了,更多相关C++ 文件中提取英文单词内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • MFC对话框自定义消息映射的方法

    MFC对话框自定义消息映射的方法

    这篇文章主要介绍了MFC对话框自定义消息映射的方法,实例分析了MFC自定义消息映射的消息定义、响应、声明及实现消息映射的相关技巧,需要的朋友可以参考下
    2015-07-07
  • C/C++实现crc码计算和校验

    C/C++实现crc码计算和校验

    循环冗余校验(Cyclic Redundancy Check, CRC)是一种根据网络数据包或计算机文件等数据产生简短固定位数校验码的一种信道编码技术。本文主要介绍了C++实现crc码计算和校验的方法,需要的可以参考一下
    2023-03-03
  • C++学习之命名空间详解

    C++学习之命名空间详解

    C++中,命名空间(namespace)是一个重要的概念。命名空间可以为函数、变量、类等定义作用域,避免与其他定义的名称发生冲突。下面我们就来了解一下如何使用C++命名空间,以及一些常见的操作吧
    2023-04-04
  • C++进一步认识类与对象

    C++进一步认识类与对象

    类是创建对象的模板,一个类可以创建多个对象,每个对象都是类类型的一个变量;创建对象的过程也叫类的实例化。每个对象都是类的一个具体实例(Instance),拥有类的成员变量和成员函数
    2021-10-10
  • c++ typeid关键字的使用

    c++ typeid关键字的使用

    这篇文章主要介绍了c++ typeid关键字的使用,帮助大家更好的理解和使用c++,感兴趣的朋友可以了解下
    2020-11-11
  • C语言举例讲解转义字符的使用

    C语言举例讲解转义字符的使用

    转义字符是很多程序语言、数据格式和通信协议的形式文法的一部分。对于一个给定的字母表,一个转义字符的目的是开始一个字符序列,使得转义字符开头的该字符序列具有不同于该字符序列单独出现(没有转义字符开头)时的语义。因此转义字符开头的字符序列被叫做转义序列
    2022-05-05
  • C++11 并发指南之std::mutex详解

    C++11 并发指南之std::mutex详解

    这篇文章主要介绍了C++11 并发指南之std::mutex详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-02-02
  • C++中md5 算法实现代码

    C++中md5 算法实现代码

    在网上找了份c++ MD5的代码,就简单保存一下,需要的朋友可以参考下
    2017-07-07
  • C++如何实现字符串的部分复制

    C++如何实现字符串的部分复制

    这篇文章主要介绍了C++如何实现字符串的部分复制问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-08-08
  • c++内联函数(inline)使用详解

    c++内联函数(inline)使用详解

    这篇文章主要介绍了c++内联函数(inline)使用详解,需要的朋友可以参考下
    2014-04-04

最新评论