本书是一本关于如何清洗、整理和理解数据的手册,还介绍了围绕构建更可靠的数据系统的最佳实践、技术和流程,并在此过程中培养团队和利益相关方对数据的信任。本书首先引入“数据宕机”的概念,然后介绍如何跨多个关键数据管道技术构建更具弹性的数据系统。还介绍了数据可靠性工作流中的主动异常检测与监测,并设置SLA、SLI和SLO,以及
本书通过构建数据价值化动态机制整合模型,介绍碳中和背景下数据价值化相关动态机制及平台技术,梳理数据基础设施、数据确权登记、数据授权运营、数据资产评估、低碳场景应用和要素市场培育的机制机理,以及横向数据确权授权运营、纵向数据资产评估和行业数据基础设施使能的具体应用,探索赋能数据价值化的实践路径,同时结合具体产业实践,详细
本书通过应用案例并借助R软件介绍统计方法在数据分析中的应用。主要内容:数据的表示及可视化,线性回归分析,逐步回归与回归诊断,广义线性模型与非线性模型,方差分析,聚类分析,判别分析,主成分分析,因子分析,对应分析,典型相关分析,高维数据分析简介。本书的最大特点是:用R软件学习数据分析的统计方法,容易入门。对于常用统计方法
利用这本书,你将学习以下内容:了解如何选择Spark转换实现优化的解决方案。探索强大的转换和归约,包括reduceByKey()、combineByKey()和mapPartitions()。理解数据分区以实现优化查询。使用PySpark设计模式构建和应用模型。对图数据应用motif查找算法。使用GraphFrames
本书是写给技术管理者、程序员的技术管理书籍。以技术团队的工作数据为基础,以技术团队为核心,用严谨的思维逻辑总结了研发容量、研发能力、研发投入率、研发人效等数据指标,以及个人胜任力、团队胜任力和技术价值等管理模型;用幽默的文字阐述了技术团队的选、用、育、留的标准,以及技术工作的衡量、评价的标准;讲述数字化技术管理的理论如
本书围绕数据中心业务如何经营这一主题展开论述,以数据中心产业演变为切入点,围绕“布局-建设-服务”三大核心环节,针对数据中心产业面临的集群化布局、低碳化建设、智能化服务的机遇与挑战,通过变革中的数据中心产业、数据中心产业面临的挑战、数据中心布局之道、数据中心低碳建设之道、数据中心智能服务之道、数据中心产业政策实施之道、
本书先带领读者了解工业网络技术的发展脉络,再以三菱iQ-FX、iQ-R、MELSEC-Q系列PLC为主控CPU,通过项目形式全面学习以太网通信、简单CPU通信、串行通信、CC-Link通信、CC-LinkIEField通信、CC-LinkIEControl通信、CC-LinkIETSN通信、Modbus通信和综合网络通
本书是中国特色高水平高职学校电气自动化技术专业的CDIO系列教材之一,是应CDIO课程改革的需要,校企合作编写的新形态教材。本书重视学生职业能力和工匠精神的培养,知识点和技能点紧密结合过程控制工程项目的实际应用,配有大量立体化教学资源,学生通过扫描二维码即可获得在线资源进行学习。本书共3个项目,项目设置结合工程实际,内
Hive是大数据领域的一个重要开发工具。本书基于Hive3.1.3版本进行编写,首先,简单介绍了Hive的起源和发展,以及Hive的安装和部署;其次,分别介绍了Hive的数据定义语言、数据操作语言、查询语言,以及各种函数,其中穿插安排了大量的综合案例练习;再次,讲解了分区表和分桶表,以及文件的压缩;最后,重点讲解了Hi
本书共分8章,主要内容如下: 第1章介绍数据的认知与研究任务,大数据概念特征及技术挑战等。 第2章介绍大数据内容、知识和结果表达概念,以及元数据和知识图谱技术。 第3章介绍数据存储基础、大数据存储要求以及应对技术和典型系统。 第4章介绍数据管理基础,新型数据管理模型及其相应大数据管理系统。 第5章介绍数据计算基础,大数