本书将开发适用于文科专业、财经类以及管理类专业的,具有很强实际操作性质的关于数据科学思维、技术以及实践的数据科学导论教材。该教材不是简单的罗列相关技术,而是利用现有的工具来实现项目的实践,让学生学会分析问题的思想和方法,培养学生对数据科学技术的兴趣与热情。本书面对的是零基础的文科类和财经类学生,技术要求相对比较简单,同时在课程设计上尽量以图像化编程工具让学习接触到数据科学的应用。本书对数据挖掘感兴趣的一般社会读者也有一定参考价值。
邓莎莎
上海外国语大学国际工商管理学院副教授、博士生导师,营销科学系副系主任、人工智能与数据科学应用实验室副主任。在中南大学获得计算机应用硕士学位,在上海交通大学获得管理科学与工程博士学位,研究方向为社交媒体数据分析、商务分析、自然语言分析等。目前主持国家自然科学基金面上项目及青年项目、企业横向课题,作为主要人员参与国家自然科学基金重点项目、国家社会科学基金重大项目。在 MISQ、Journal of Advertising、Information & Management等顶级期刊发表高水平论文二十余篇。获国家教学成果二等奖、上海市教学成果一等奖、校三八红旗手和教育奖励基金教学科研奖等奖项。担任中国人工智能学会智慧医疗专委会委员、中国管理现代化研究会电子商务与网络空间管理专委会会员等社会兼职。
第1章 数据科学缘起
1.1 数据科学基础概念
1.2 大数据内涵
1.3 大数据技术
1.4 数据科学思维
数据采集与预处理篇
第2章 数据爬取
2.1 数据爬取的基本原理
2.2 数据爬取工具概述
2.3 UiPath数据爬取
2.4 Python
第3章 数据预处理
3.1 探索性数据分析
3.2 数据清洗
3.3 数据变换
3.4 数据集成与数据规约
数据可视化篇
第4章 数据可视化
4.1 数据可视化基础
4.2 数据可视化工具包
4.3 Tableau数据连接与数据类型
4.4 Tableau视图与筛选器
第5章 Tableau图表深入学习
5.1 文本表
5.2 条形图
5.3 树状图
5.4 折线图
5.5 组合图
5.6 散点图
5.7 直方图
5.8 仪表盘
第6章 电话营销可视化分析示例
6.1 案例数据
6.2 连接数据源
6.3 用户画像
6.4 客户群的年龄分布
6.5 转化率与职业的关系
6.6 转化的一致性
6.7 宏观经济因素分析
6.8 设计仪表盘
数据建模篇
第7章 机器学习的一般流程
7.1 机器学习概述
7.2 特征工程
7.3 可视化建模工具
第8章 机器学习算法
8.1 分类算法
8.2 聚类算法
8.3 模型评估与选择
8.4 H20数据建模分析实例
第9章 社交网络分析
9.1 概述
9.2 社交网络的类型
9.3 社交网络分析工具
9.4 社交网络分析指标
第10章 基于链家租房网数据的租房价格预测示例
10.1 房价数据爬取(全量数据)
10.2 房屋数据预处理
10.3 房屋地理信息爬取
10.4 租房价格数据可视化
10.5 租房价格预测建模
自然语言处理篇
第11章 自然语言处理
11.1 概述
11.2 自然语言处理开发工具
11.3 自然语言处理的基础任务
第12章 自然语言处理工具
12.1 综合性分析工具
12.2 分词与词性标注工具
12.3 综合性Python工具
第13章 自然语言处理案例:情感分析
13.1 场景介绍
13.2 算法应用