关于我们
书单推荐
新书推荐
|
数据采集与预处理技术应用 读者对象:本书适合作为高等院校大数据、云计算、计算机和软件专业相关课程的教材,或是相关领域培训机构的培训教材
本书共有九章,从数据采集与预处理概述开始,介绍了大数据环境的搭建,并对数据采集与数据预处理的技术方法进行了系统介绍。数据采集的内容包括Flume日志数据采集、Kafka日志数据采集、Fluentd与Logstach等一系列数据采集技术;数据预处理的内容包括网络爬虫采集Web数据、Python数据预处理技术、Kettle数据处理技术、Pig和OpenRefine这些数据预处理技术。旨在让读者了解并基本掌握当下主要的数据采集与预处理技术、工具,以及它们的使用方法。
你还可能感兴趣
我要评论
|