数据科学的理论基础是数学。本书共六章。前三章系统介绍了数据科学里广泛使用的线性代数、概率论、微积分以及最优化理论的相关基础知识;后三章简练阐述了网络分析、量子算法、大模型的基本数学原理和一些代表性算法。书中部分应用案例源自作者的原创性工作,通过发现问题、分析问题、解决问题的逻辑链条,生动展示了数据建模在解决实际问题中的应用路径。
更多科学出版社服务,请扫码获取。
兰州大学硕士,北京理工大学博士1997年起在郑州大学工作,2006年破格评为教授,2008年起被聘为博士生导师,2015年起被聘为河南省特聘教授。研究方向为应用数学和数据科学,擅长基于问题驱动的数学研究,在Acta Mater., Appl. Phys. Lett., Info. Sci., J. Stat. Phys., J. Stat. Mech., J. Nonlinear Sci., Phys. Rev. B和Phys. Rev. E.等数学、统计、力学、物理、材料类期刊发表SCI论文八十多篇,其中《中国科学数学》、《中国科学物理(英文版)》、《中国科学材料(英文版)》各一篇。中国工业与应用数学学会理事,SCI期刊Discrete and Continuous Dynamical Systems-S编委
目录
前言
第1章 线性代数 1
1.1 线性代数的基本概念 1
1.1.1 线性空间 1
1.1.2 正交性 4
1.1.3 格拉姆–施密特过程 9
1.1.4 特征值和特征向量 9
1.2 线性回归 14
1.2.1 QR分解 14
1.2.2 最小二乘问题 15
1.2.3 线性回归与最小二乘问题的关系 17
1.3 主成分分析 18
1.3.1 奇异值分解 18
1.3.2 低秩矩阵逼近 20
1.3.3 主成分分析方法 21
1.4 习题 26
第2章 概率论 28
2.1 概率分布 28
2.1.1 概率公理 28
2.1.2 条件概率 29
2.1.3 离散型随机变量 30
2.1.4 连续型随机变量 33
2.2 独立变量和随机抽样 36
2.2.1 联合概率分布 36
2.2.2 相关性和依赖性 39
2.2.3 随机抽样 41
2.3 最大似然估计 42
2.3.1 随机抽样的最大似然估计 42
2.3.2 最小二乘问题的概率表示 43
2.4 习题 44
第3章 微积分与优化 45
3.1 连续性和导数 45
3.1.1 极限与连续性 45
3.1.2 导数 47
3.1.3 泰勒定理 54
3.2 无约束最优化.56
3.2.1 局部最小值的充分必要条件 56
3.2.2 凸性和全局最小值 59
3.2.3 梯度下降 64
3.3 logistic回归 65
3.4 k均值 67
3.5 支持向量机 69
3.6 神经网络 71
3.6.1 数学公式 71
3.6.2 激活函数 73
3.6.3 代价函数 74
3.6.4 反向传播概念 74
3.6.5 反向传播算法 75
3.7 习题 76
第4章 网络分析 77
4.1 图模型 77
4.2 谱图二分类 84
4.3 网络嵌入 89
4.4 基于网络的流感预测 90
4.4.1 流感及其预测的背景 90
4.4.2 基于空间网络的数据分析 93
4.4.3 ANN 方法用于预测 97
4.5 基于稀疏识别的材料微观结构研究 106
4.5.1 材料背景介绍 106
4.5.2 稀疏识别算法 107
4.5.3 模型构建和模型性能 108
4.6 习题.112
第5章 量子计算 114
5.1 基本概念 114
5.1.1 量子比特 114
5.1.2 计算基态 115
5.1.3 张量积 116
5.2 量子门 117
5.2.1 单量子比特门 117
5.2.2 双量子比特门 121
5.2.3 多量子比特门 123
5.3 量子测量 125
5.4 量子编码 126
5.4.1 基态编码 126
5.4.2 角度编码 126
5.4.3 振幅编码 126
5.5 量子电路 127
5.6 量子算法 128
5.6.1 Deutsch算法 128
5.6.2 Deutsch-Jozsa算法 130
5.7 习题.132
第6章 大模型 133
6.1 基本概念 133
6.1.1 大模型与小模型 133
6.1.2 发展历程 133
6.1.3 分类 134
6.2 预训练与微调 135
6.2.1 预训练阶段 135
6.2.2 微调阶段 135
6.3 循环神经网络 136
6.3.1 RNN的结构 136
6.3.2 RNN的应用 140
6.4 长短期记忆神经网络 140
6.4.1 LSTM的结构 140
6.4.2 LSTM的应用 142
6.5 Transformer架构 142
6.5.1 自注意力机制 143
6.5.2 多头注意力机制 145
6.5.3 位置编码 146
6.5.4 编码器 146
6.5.5 解码器 147
6.5.6 交叉注意力机制 149
6.5.7 Transformer架构的应用 150
6.6 习题 151
参考文献 152