如何用声音来操控IE浏览器及语音识别引擎的使用
最近做字幕的时候发现一个通过声音控制IE浏览器的方法。本来是要制作字幕的,后来想想如果纯手工制作字幕的话那么效率肯定非常低,做为程序员,本能的想到了让计算机来帮忙。做字幕就是从声音识别出文字,然后在校对时间轴。很机械化的操作,非常适合计算机的来做。通过搜索很快找到了解决方案。使用Microsoft Speech SDK+Python+PythonWin。虽然微软的语音识别引擎已经很强大了,但是要用它来制作字幕还有很长的路要走。字幕做不成了,不过用它来操控浏览器还是错错有余的。发现使用语音功能操作IE浏览器还是非常方便,只要设置好语句,IE浏览器就可以自动进行相关的操作。
下面是我已经实现的一些功能。(=>符号前面是你要说的话,后面是浏览器执行的操作)
“显示浏览器”=>打开浏览器,“谷歌”=>进入谷歌的页面,“百度”=>进入百度的页面,“优酷”=>进入优酷的页面等等,“后退”=>返回上一个页面,“最大化”=>最大化浏览器,“下拉”=>下拉网页,“上拉”=>上拉网页,“放大”=>放大网页,“缩小”=>缩小网页,“关闭浏览器”=>关闭浏览器。
搭建测试环境:
1.从微软官网下载SpeechSDK51.exe和SpeechSDK51LangPack.exe

2.下载Python2.6+PythonWin+wxPython和启动语音识别的脚本文件。从这里打包下载。
3.安装SpeechSDK51.exe,SpeechSDK51LangPack.exe
4.安装Python2.6,PythonWin,wxPython
5.运行开始菜单->所有程序->Python2.6— >PythonWin,选择Tools -> COM MakePy utility -> Microsoft Speech Object Library 5.0
6.在控制面板的语音里面,在语言里选Microsoft Simplified Chinese Recognizer,在语音选择里选Microsoft Simplified Chinese


环境搭建完成,运行SpeechGui.py脚本就可以来用声音操控浏览器。不过由于Python+PythonWin的强大威力,不单单只有IE浏览器可以进行该操作,只要软件能够支持com的应用就都可以显示语音操控,比如微软的Windows Media Player,Word,Excel等软件。强烈建议大家自己手动去发掘和制作更多有意思的功能。
相关文章
目前 Edge 浏览器的“...”设置菜单占据大量屏幕空间,尤其是在窗口模式下,用户体验较差,在最新版本dege中,微软精简了“...”设置菜单,提升了用户体验2025-03-24
在工作和生活中,我们可能常常会遇到需要从百度网盘导出文件的情况,下面跟大家分享一下具体办法2025-03-21
微软在Canary频道发布了最新版的Microsoft Edge浏览器,其中最引人注目的变化莫过于设置页面的全面焕新,这次更新不仅精简了菜单,新增了矩形按钮,还优化了子目录设置,并2025-03-10
如何在Firefox中实现垂直标签页? 火狐浏览器垂直标签页设置方法
Firefox默认的标签页是水平显示的,但有一个方法可以将它们转换为垂直显示,下面我们就来看看设置方法2025-03-05
Firefox 136 正式发布,这个版本增了大家期待已久的「垂直标签页」布局,下面我们就来看看详细更新内容2025-03-05
浏览器怎么开启阅读模式? Chrome/Edge/Safari/Firefox开启方法
阅读模式是浏览器提供的一种功能,可以去除网页上的广告、按钮、背景图等杂乱信息,使内容更加简洁易读,不同浏览器的阅读模式开启方法略有不同,以下是几种常见浏览器的开2025-02-25
今天下载一个app需要用到gmail的邮箱,这个邮箱不论是安全与隐私保护都是比较好的,但因为国内的原因不容易注册,这里就为大家分享一下解决方法2025-02-24
避免打印出来的效果不理想,浪费纸张,打印预览是指在打印文档之前,预先查看文档的打印效果,打印预览在哪里?详细如下2025-02-13
怎么把图片背景变成透明? 教你一个免费在线图片去白底变透明的方法
浏览器下载的图片有白底,想要变成透明底,方便当素材直接导入,该怎么操作呢?之前介绍很多方法都用到了软件,今天教大家一个在线处理方法2025-01-31
如何在Edge浏览器中安装第三方翻译插件? Edge浏览器插件安装全攻略
Edge浏览器作为微软推出的新一代浏览器软件,不仅界面简洁、速度快,还支持用户自由安装插件来扩展其功能,今天,我们就来详细讲解一下Edge浏览器安装插件的方法2025-01-30










最新评论