R统计软件是目前应用* 广泛的统计软件之一,已广泛应用于医学、财经和社会科学等领域中进行数据管理和数据分析处理。本书以Windows操作系统下的R软件为基础,以实践中常用的统计分析方法为基本内容,介绍了R语言的编写以及结果解释。本书重点介绍了各种多元统计分析方法的基本原理及其应用,包括方差分析、多元线性回归、Logistic回归分析、生存分析、主成分分析、因子分析、聚类分析、判别分析以及典型相关分析等。每一章详细讨论了统计分析方法的基本原理和分析过程,介绍了R语言的使用方法及应用实例说明、结果解释及结论分析等。
由R知名专家执笔。作者深入理解了R的内涵和精髓,结合自己丰富的培训经验,以及大量的一线工程实践经验,潜心编写而成。
软件版本采用当前新的R版本,在知识点讲解过程中穿插了新功能的讲述与应用。
知识全面、系统,科学安排内容的层次架构,由浅入深,循序渐进,适合读者的学习规律。
理论与实践应用紧密结合。基础理论知识穿插在知识点的讲述中,言简意赅、目标明确,其目的是使读者知其然,亦知其所以然,达到学以致用的目的。
知识点 针对每个知识点的小实例 综合实例的讲述方式,可以使读者快速地学习并掌握R软件操作及应用该知识点解决实践中的问题。综合实例部分,深入细致地剖析数据统计分析应用的流程、细节、难点、技巧,起到融会贯通的作用。
为了让本书内容尽可能接近各个领域的实际情况,作者从心理学、社会学、医学、生物、商业和工程等诸多领域选取了一些例子。所有的这些例子都不需要读者具备这些领域的专业知识。
本书附带所有实例操作的数据和R程序。
本书由汪海波、罗莉、汪海玲编著,参与编写的还有郝旭宁、李建鹏、赵伟茗、刘钦、于志伟、张永岗、周世宾、姚志伟、曹文平、张应迁、张洪才、邱洪钢、张青莲、陆绍强、李成。
汪海波,SAS知名专家,畅销书《SAS统计分析与应用从入门到精通》作者。作者深入理解了SAS内涵、精髓,结合自己丰富的工作经验,并结合大量的一线工程实践经验,潜心编写而成。
* 一篇 R基础与入门篇
* 1章 R入门2
1.1 R简介2
1.1.1 R特点2
1.1.2 R支持资料3
1.2 R的获取、安装和启动4
1.2.1 R的获取4
1.2.2 R的安装5
1.2.3 R的启动7
1.3 R菜单操作7
1.4 工作空间10
1.5 程序包11
1.5.1 什么是程序包11
1.5.2 安装程序包11
1.6 R使用以及图形界面12
1.7 本章小结13
* 2章 R编程入门14
2.1 R语言14
2.1.1 数据集的概念14
2.1.2 R运算符21
2.2 R常用函数及其应用23
2.2.1 数学函数24
2.2.2 样本统计函数26
2.2.3 概率函数27
2.2.4 字符处理函数28
2.2.5 其他实用函数30
2.3 数据的输入31
2.3.1 使用键盘输入数据31
2.3.2 数据集的导入32
2.4 本章小结34
第3章 基本数据管理35
3.1 创建新变量36
3.2 向量运算37
3.2.1 添加或删除向量元素37
3.2.2 向量运算和逻辑运算37
3.2.3 用∶运算符创建向量37
3.2.4 使用seq()函数创建向量38
3.3 处理数据对象的实用函数38
3.4 变量的重编码39
3.5 变量的重命名40
3.6 缺失值41
3.7 日期值42
3.8 类型转换44
3.9 数据排序45
3.10 数据集的合并45
3.11 数据集取子集46
3.11.1 选入观测46
3.11.2 选入变量47
3.11.3 剔除变量48
3.11.4 subset()函数49
3.12 本章小结49
第4章 样本量和检验效能估计50
4.1 样本量估算以及R程序包50
4.1.1 样本量影响因素50
4.1.2 检验效能分析pwr包52
4.2 t检验53
4.2.1 单样本与已知总体检验时样本
量的估计及R程序53
4.2.2 两总体均数比较样本量的估计
及R程序54
4.2.3 配对设计两样本均数比较样本
量的估计及R程序55
4.3 方差分析56
4.4 相关分析57
4.5 线性模型58
4.6 分类资料的样本量估计59
4.6.1 单样本与已知总体检验时样
本量的估计及R程序59
4.6.2 两样本率比较样本量的估计及
R程序60
4.6.3 配对设计总体率比较样本量的
估计及R程序61
4.7 本章小结62
第5章 高 级数据管理63
5.1 控制语句63
5.1.1 重复和循环63
5.1.2 条件执行65
5.2 数据处理综合实例67
5.3 转置与整合70
5.3.1 转置70
5.3.2 整合数据71
5.4 本章小结72
* 二篇 统计方法与R分析实例
第6章 定量资料的统计描述74
6.1 统计描述基础理论知识74
6.1.1 集中趋势描述75
6.1.2 离散趋势描述77
6.1.3 正态分布79
6.2 统计描述分析实例81
6.2.1 summary()函数分析实例81
6.2.2 sapply()函数分析实例83
6.2.3 describe()函数分析实例85
6.2.4 stat.desc()函数分析实例89
6.2.5 分组计算描述性统计量91
6.2.6 对数正态分布资料的统计
描述94
6.3 本章小结95
第7章 t检验96
7.1 单样本t检验96
7.1.1 单样本t检验的基础理论96
7.1.2 单样本t检验分析实例97
7.1.3 无原始数据的单样本t检验R
程序98
7.2 配对设计资料的t检验98
7.2.1 配对设计资料t检验的基础
理论98
7.2.2 配对t检验实例100
7.2.3 无原始数据的配对设计的
t检验分析实例102
7.3 两独立样本的t检验103
7.3.1 两独立样本t检验的基础
理论103
7.3.2 独立样本t检验分析
实例105
7.3.3 无原始数据的两独立样本
t检验分析实例107
7.4 本章小结107
第8章 方差分析108
8.1 方差分析及ANOVA模型拟合概述108
8.1.1 方差分析的基本思想108
8.1.2 方差分析基本术语110
8.1.3 ANOVA模型拟合111
8.2 完全随机设计资料的方差分析112
8.2.1 单因子方差分析介绍113
8.2.2 单因子方差分析的R程序
实例113
8.3 随机区组设计资料的方差分析118
8.3.1 随机区组方差分析介绍119
8.3.2 随机区组方差分析的R程序
实例121
8.4 拉丁方设计资料的方差分析126
8.4.1 拉丁方方法介绍126
8.4.2 拉丁方分析的R程序实例128
8.5 析因设计资料的方差分析131
8.5.1 析因设计方法介绍131
8.5.2 析因方差分析的R程序实例134
8.6 正交试验设计资料的方差分析136
8.6.1 正交试验设计方法介绍136
8.6.2 正交试验设计资料分析的R
程序实例138
8.7 重复测量资料的方差分析139
8.7.1 重复测量设计方法介绍140
8.7.2 重复测量资料分析的R
程序实例141
8.8 协方差分析144
8.8.1 协方差分析方法介绍144
8.8.2 协方差分析的R程序实例145
8.9 本章小结148
第9章 直线回归与相关149
9.1 直线相关分析149
9.1.1 直线相关分析介绍149
9.1.2 直线相关分析的R实例151
9.2 直线回归分析154
9.2.1 直线回归分析介绍155
9.2.2 直线回归分析的R程序实例157
9.3 本章小结162
* 10章 多元线性回归与相关163
10.1 多元线性回归与相关的基础理论163
10.1.1 多元线性回归163
10.1.2 复相关系数与偏相关系数176
10.2 分析实例178
10.2.1 多元线性回归方程的建立178
10.2.2 复相关系数与偏相关系数的
R程序实例183
10.3 本章小结185
* 11章 Logistic回归分析186
11.1 非条件Logistic回归186
11.1.1 非条件Logistic回归介绍187
11.1.2 非条件Logistic回归模型的
建立和检验188
11.1.3 非条件Logistic回归的R
程序190
11.2 条件Logistic回归205
11.2.1 条件Logistic回归介绍205
11.2.2 条件Logistic回归的R
程序206
11.3 本章小结207
* 12章 相对数208
12.1 相对数简介208
12.1.1 率的标准化210
12.1.2 率的假设检验212
12.2 R分析实例214
12.2.1 率的标准化R程序214
12.2.2 率的Z(U)检验的R
程序215
12.3 本章小结216
* 13章 行列表分析217
13.1 四格表资料217
13.1.1 四格表卡方检验介绍218
13.1.2 四格表卡方检验的R
程序220
13.2 配对计数资料的卡方检验224
13.2.1 四格表配对卡方检验介绍224
13.2.2 四格表配对卡方检验的R
程序225
13.3 列变量为顺序变量的行均分检验226
13.3.1 行均分检验介绍227
13.3.2 行均分检验的R程序227
13.4 行列均为顺序变量的相关检验230
13.4.1 行列均为顺序变量的相关
检验介绍230
13.4.2 行列均为顺序变量的相关
检验的R程序231
13.5 分层行列表的分析235
13.5.1 分层行列表的分析简介235
13.5.2 分层行列表的分析的R
程序236
13.6 趋势卡方检验239
13.6.1 趋势卡方检验简介239
13.6.2 趋势卡方检验的R程序239
13.7 卡方分割与卡方合并241
13.7.1 卡方的分割与合并简介241
13.7.2 卡方分割与卡方合并分析
实例241
13.8 本章小结243
* 14章 非参数统计244
14.1 单样本资料与已知总体参数的非
参数检验245
14.1.1 单组资料的符号及符号秩和
检验245
14.1.2 单组资料的非参数检验R
程序247
14.2 配对设计资料的非参数检验248
14.2.1 配对设计资料的符号及符号
秩和检验248
14.2.2 配对设计资料的非参数检验
R程序249
14.3 两组定量资料的非参数检验250
14.3.1 两组定量资料的非参数检验
方法概述251
14.3.2 两组定量资料非参数检验的
R程序252
14.4 多组定量资料的非参数检验253
14.4.1 多组定量资料的非参数检验
方法概述253
14.4.2 多组定量资料非参数检验的
R程序255
14.5 等级分组资料的非参数检验260
14.5.1 等级分组资料的非参数检验
方法概述260
14.5.2 等级分组资料非参数检验的
R程序261
14.6 随机区组资料的非参数检验264
14.6.1 随机区组资料的非参数检验
方法概述264
14.6.2 随机区组资料非参数检验的
R程序265
14.7 等级相关(秩相关)266
14.7.1 秩相关概述266
14.7.2 spearman秩相关的R程序267
14.8 本章小结268
* 15章 生存分析269
15.1 生存分析简介269
15.1.1 生存数据269
15.1.2 生存时间函数270
15.1.3 均数、中位数和半数
生存期271
15.1.4 生存分析的基本方法271
15.2 生存曲线272
15.2.1 寿命表法及R分析实例273
15.2.2 乘积极限法(Kaplan-Meier)及
R分析实例278
15.2.3 Cox回归及R分析实例280
15.3 本章小结285
* 16章 主成分分析286
16.1 主成分分析简介287
16.1.1 主成分分析的数学模型287
16.1.2 主成分分析的方法步骤288
16.1.3 主成分分析的应用290
16.2 R中的主成分分析实例291
16.3 本章小结307
* 17章 因子分析308
17.1 因子分析简介308
17.2 主成分分析与因子分析比较317
17.3 因子分析及R实例318
17.4 本章小结337
* 18章 聚类分析338
18.1 聚类分析简介338
18.2 聚类分析及R实例344
18.2.1 varclus ()函数344
18.2.2 kmean()函数348
18.2.3 hclust()函数实例352
18.3 本章小结355
* 19章 判别分析356
19.1 判别分析简介357
19.2 判别分析及R实例362
19.3 本章小结386
* 20章 典型相关分析388
20.1 典型相关简介388
20.1.1 典型相关分析的理论架构及
基本假设390
20.1.2 冗余分析391
20.1.3 典型相关系数的假设检验392
20.2 cancor()函数实例392
20.3 本章小结400
* 21章 诊断试验的ROC分析401
21.1 诊断试验简介401
21.1.1 诊断试验介绍401
21.1.2 诊断试验评价指标402
21.1.3 ROC分析资料收集与整理404
21.1.4 ROC曲线构建405
21.2 ROC分析及R分析实例406
21.3 本章小结423
* 22章 统计图425
22.1 条形图425
22.2 饼图429
22.3 散点图431
22.4 折线图433
22.5 箱线图434
22.6 直方图437
22.7 核密度图442
22.8 点图442
22.9 本章小结444
参考文献 445