批处理从html格式(接收到的邮件)中读取数据的操作方法
通过第三方批处理getmail可以获取到邮箱里的邮件。获取后经其自身解码,得到一个Extract*.out文件,大致看一下其格式应该为html的写法,并且内容只分一行。
<div dir="auto">here is the content</div>
显然我邮件发送的原内容为:
here is the content
现在要提取出其中的原内容并且将所有内容合并到一行。问题在于,邮箱不一定每次都接收到这样简单的文件。例如内容当中出现换行:
<div dir="auto">abababababababab<br /><br />abababababababab<br /><br /></div>
有时内容含特殊字符,解码之后也无法正常显示(某些字符):
i wanna get these words # $ % & * @ ? !
<div dir="auto">i wanna get these words # $ % & * @ ? !</div>
有时发送的内容经过复制粘贴,不小心留下了其他信息:
<div dir="auto">hey get it <span style="font-family:sans-serif">hey get it </span><br style="font-family:sans-serif" /><span style="font-family:sans-serif">hey get it </span><span style="font-family:sans-serif">hey get it </span><br style="font-family:sans-serif" /></div>
显然需要忽略<>标签里的所有内容才能得到原内容,并且需要还原未正常显示的符号。
可能要用到第三方了……
到此这篇关于批处理从html格式(接收到的邮件)中读取数据的操作方法的文章就介绍到这了,更多相关批处理html格式读取数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
批处理一键安装JDK/一键安装JRE和自动配置Java环境变量
对于java或安卓初学者来说,配置java环境变量是一件比较头疼的事情,在此我向大家分享一个一键安装JDK和自动配置java环境变量的bat批处理方法,需要的朋友可以参考下2018-01-01批处理BAT替换与截取字符串的用法t1=%a:~3%是什么意思
在bat编写中,我们经常越到t1=%a:~3%之类的代码,这里简单介绍下用法,需要的朋友可以参考下2013-05-05无法使用GHOST及避免出现A:\GHOSTERR.TXT的解决方法
昨天我遇到这样一个问题在一台联想U2240新机上无法用GHOST安装系统,从光盘启动自动一键GHOST11.0到C盘时,图象出现在还没进入GHOST11.0 就象死机一样停在那里不能动了 尝试过分区;换GHOST8.0一样无效。将GHOST拷贝到D盘,进入DOS,也还是无法运行GHOST。百般无奈只好用安装光盘进行安装了,系统虽然可以成功安装好,但却浪费我好多时间。2008-05-05
最新评论