基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 中文完整pdf扫描版[71MB]

基于R语言的自动数据收集下载

  • 书籍大小:71.1MB
  • 书籍语言:简体中文
  • 书籍类型:国产软件
  • 书籍授权:免费软件
  • 书籍类别:编程其它
  • 应用平台:PDF
  • 更新时间:2017-02-10
  • 购买链接:
  • 网友评分:
360通过 腾讯通过 金山通过

情介绍

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南由资深社会科学家撰写,从社会科学研究角度系统且深入阐释利用R语言进行自动化数据抓取和分析的工具、方法、原则和*佳实践。作者深入剖析自动化数据抓取和分析各个层面的问题,从网络和数据技术到网络抓取和文本挖掘的实用工具箱,重点阐释利用R语言进行自动化数据抓取和分析,能为社会科学研究者与开发人员设计、开发、维护和优化自动化数据抓取和分析提供有效指导。

本书共17章,第1章是概述,阐述数据挖掘的意义与实际应用。第2~8章介绍网络和数据技术基础知识,内容涉及互联网上通信、交换、保存和显示信息的基础技术(如HTTP、HTML、XML、JSON、AJAX、SQL等),并讲解用于查询网络文档和数据集的基本技术(XPath和正则表达式)。第9~11章介绍网络抓取和文本挖掘的实用工具箱,其中第9章讲解多种网络抓取技术,涉及正则表达式的使用、XPath、各类API接口、其他数据类型以及开源社区相关的技术;第10章深入介绍用于统计性文本处理的技术;第11章给出关于用R管理数据的项目中常见问题的一些见解。第12~17章介绍实际案例分析,涉及美国参议院里的合作网络、从半结构化文档解析信息、利用Twitter预测2014年奥斯卡奖、绘制姓氏地理分布图、采集关于手机的数据、分析产品评论里的情绪等。这些案例分析针对日常的数据抓取和文本处理的工作流程、真实环境数据中的陷阱以及规避它们的方法等问题提供一些实用的见解。

目录

第1章概述
第一部分网络和数据技术入门
第2章HTML
第3章XML和JSON
第4章XPath
第5章HTTP
第6章AJAX
第7章SQL和关系型数据库
第8章正则表达式和基本字符串函数
第二部分网络抓取和文本挖掘实用工具箱
第9章网络抓取
第10章统计性文本处理
第11章管理数据项目
第三部分一组案例分析
第12章美国参议院里的合作网络
第13章从半结构化文档解析信息
第14章利用Twitter预测2014年奥斯卡奖
第15章绘制姓氏地理分布图
第16章采集关于手机的数据
第17章分析产品评论里的情绪

载地址

下载错误?【投诉报错】

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 中文完整pdf扫描版[71MB]

      气书籍

      载声明

      ☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
      ☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
      ☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
      ☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
      ☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
      ☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
      ☉ 本站提供的基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 中文完整pdf扫描版[71MB]资源来源互联网,版权归该下载资源的合法拥有者所有。