-
第一章绪论
本章主要介绍了多元统计分析的简介、应用和使用软件。通过比较分析和案例说明等方法介绍了多元统计分析的发展史、主要内容和方法,在自然科学、社会科学和大数据分析方面的应用,目前比较常用的多元统计分析使用软件。初步了解多元统计分析课程,指导学习。
-
●1.1多元统计分析的简介
本节主要介绍了多元统计分析的定义、发展史、研究的主要内容和方法。通过对多元统计分析的定义、发展史的介绍,便于了解学习多元统计分析这门课程的目的和意义。同时,利用比较法将数理统计中一元统计分析的知识与多元统计分析的知识进行对比介绍,加深对多元统计分析这门课程的研究内容和方法的认识和理解。
-
●1.2多元统计分析应用前景
本节主要通过案例介绍了多元统计分析方法在自然科学、社会科学和大数据分析方面的应用,指出大数据分析师的统计分析技能主要是多元统计分析方法,最后,总结了多元统计分析理论方法的作用。
-
●1.3使用软件简介
本节主要通过介绍目前比较常用的多元统计分析使用软件:SAS软件、MATLAB软件、R软件和SPSS软件的简介,了解各软件的特点和功能,便于多元统计分析应用时选择适宜的应用软件。
-
第二章多元数据图表示法
图形是我们直观了解、认识数据的一种可视化手段,如果能把一些多元数据直接显示在图上,便可从图形一目了然地看出多元数据之间的关系。当数据维数较少时,比如只有一、二维数据时,可以作直方图、散点图、经验分布的密度图、条形图或饼图等,而当维数大于三时,虽然仍可以用三维图形来表示,但已很困难,而在许多实际问题中,数据的维数都大于三,那么如何用图形直观表现三维以上的数据呢?本章主要介绍散点图、折线图、条形图、雷达图、星座图、脸谱图的制作方法。
-
●2.1散点图、折线图
散点图又称散布图或相关图,根据散点图中数据的分布走向和密集程度,可以大致判断变量之间的相关关系。折线图是将多个样品观测数据以折线的方式表示在平面图中的一种多变量可视化图形。本节主要介绍散点图和折线图的作法及解读。
-
●2.2条形图和雷达图
条形图是由若干平行条状的矩形所构成,而以每一个矩形的高度来代表数值的大小。雷达图是目前应用最为广泛的对多元数据进行作图的方法。本节主要介绍条形图和雷达图的作法及解读。
-
●2.3星座图和脸谱图
星座图是将高维空间的样本点投影到平面上的一个半圆内,用投影点表示样本点的多元图示方法。脸谱图是用脸谱来表达多变量的样品,由美国统计学家H.切尔诺夫于1970年首先提出。本节主要介绍星座图和脸谱图的作法及解读。
-
第三章多元正态分布
本章主要介绍了随机向量的基本概念、多元正态分布的定义和性质、参数估计。通过一维随机变量、一元正态分布和最大似然估计的理论基础上,推广到随机向量的基本概念、多元正态分布的定义和性质、多元正态分布的参数估计。该章的内容是多元正态分布的理论基础。
-
●3.1随机向量的基本概念
本节主要通过一维随机变量的定义、分布函数和数字特征的理论基础,结合实例介绍了随机向量的定义,多维随机向量的分布函数和密度函数的定义和性质,多元变量的独立性定义,随机向量的数字特征。
-
●3.2多元正态分布的定义及性质
本节主要通过一元正态分布的定义、性质的理论基础上,介绍了多元正态分布的定义和性质,对多元正态分布参数、正态随机向量的独立性和多元正态向量的线性变换等性质做了具体说明。
-
●3.3多元正态分布的参数估计
本节主要通过随机样本的基础,介绍了样本的数字特征:样本的均值向量、离差阵、协方差阵和相关阵,以及多元正态分布的参数:均值向量和协方差阵的最大似然估计和性质。
-
第四章多元正态分布的假设检验
本章主要介绍了多元常见分布及抽样分布、多总体均值向量的检验和多总体协方差阵的检验。通过数理统计的常用三个分布、一元正态分布参数假设检验的理论基础,介绍了多元统计分析的Wishart分布、T2分布和Wilks分布三个分布,协方差阵已知和未知条件下均值向量的检验,高维和多样本、低维和少样本条件下协方差阵的检验。
-
●4.1常见分布及抽样
本节主要通过数理统计常用三个分布:2分布、 t 分布和F分布的理论基础上,推广介绍了Wishart分布、T2分布和Wilks分布的定义和性质,以及从多元正态分布总体中抽得样本的分布。这几个常见分布是多元正态分布进行假设检验的理论基础。
-
●4.2多总体均值向量的检验
本节主要通过一元均值检验的理论基础上,结合实例分别从一个多元正态分布总体的协方差阵已知和未知条件下,介绍了多元均值向量的检验,以及从两个多元正态分布总体的协方差阵已知和未知相等条件下,介绍了两总体均值向量的检验。
-
●4.3多总体协方差阵的检验
本节主要通过高维和多样本、低维和少样本条件下,分别介绍了一个和多个总体协方差阵的检验。
-
第五章多元方差分析
本章主要介绍了多元方差分析(MANOVA)基本思想,作为一个多变量过程,多元方差分析在有两个或多个因变量时使用,并且通常后面是分别涉及各个因变量的显着性检验,要解决的问题与一元方差分析统计检验原理基本相同。检验各个因素对实验指标的影响是否显著、估计出各个因子不同水平的效应值、估计出各个因子水平之间的交互效应值、估计出协方差阵等等。其中首要任务是检验各个因素对实验指标的影响是否显著。为此,需要进行假设检验,较常使用的检验统计量有wilks检验统计量。该检验统计量经过适当变形,可以转化为服从F分布的检验统计量。本章分别介绍了单因素方差分析和双因素方差分析的基本概念、基本思想理论等。
-
●5.1单因素多元方差分析(一)
本小节主要通过回顾一元方差分析引入多元方差分析基本概念、分类,并给出单因素方差分析的数学模型、单因素完全随机多指标试验资料表等内容。
-
●5.2单因素多元方差分析(二)
本小节继续介绍单因素多元方差分析的总离差阵分解、单因素多元方差分析表、多重检验等内容,并结合实例介绍了单因素多元方差分析的基本思想及步骤。
-
●5.3单因素多元方差分析(三)
本小节主要通过具体实例巩固单因素多元方差分析的基本思想、理论及解题步骤。
-
●5.4多因素多元方差分析(一)
本小节主要通过双因素方差分析为例来讲解多因素多元方差分析基本思想及理论。包括双因素多元方差分析的数学模型、双因素完全随机多指标试验资料表、总离差阵分解、双因素多元方差分析表、多重检验等内容。
-
●5.5多因素多元方差分析(二)
本小节结合具体实例巩固双因素多元方差分析的基本思想及解题步骤,即在实际问题中如何应用双因素多元方差分析法。
-
第六章回归分析
回归分析是多元统计分析中应用最广泛的方法,是研究一个或多个因变量与多个自变量之间相互依赖关系的一种统计方法。根据自变量的多少回归分析可分为一元回归和多元回归,根据回归函数形式回归分析又可分为线性回归和非线性回归。在多元回归分析中,最简单的是多元线性回归,而许多非线性回归可通过变量代换转化为多元线性回归,可见,多元线性回归是回归分析的中心。下面在一元线性回归分析的基础上介绍多元线性回归的有关问题,包括回归模型的建立、参数的估计及其基本性质、模型和参数的检验,还有非线性回归等方法。
-
●6.1多元线性回归分析(一)
多元回归分析是研究因变量与多个自变量的相关关系,本节主要介绍多元回归分析的数学模型。
-
●6.2多元线性回归分析(二)
一般情况下,事先不能判定因变量与自变量是否具有确定的线性关系,在求出线性回归方程之前,线性回归模型只是一种假设,但在求出线性回归方程之后,需要对因变量与自变量之间是否有线性关系进行显著性检验。
-
●6.3多元线性回归分析(三)
在多元线性回归中,最难的是如何选择自变量的问题,在模型中选入最合适的自变量,建立起既合理又简单实用的线性回归模型是非常重要的。下面介绍一些自变量选择的准则,以及求“最优”回归方程的方法。
-
●6.4多元线性回归分析(四)
本节介绍多元线性回归分析的上机实现。
-
●6.5非线性回归(一)
二元logistic回归是研究因变量为二分类变量时其与因素间的影响关系的一种分析方法,其应用非常广泛,是处理分类结果资料的有力方法,常用来研究某些疾病的发生与相应因素间的关系,如疾病的预后素分析及临床试验的效果评价等。 Logistic回归模型的适用于因变量为二分类的分类变量或某事件的发生率,并且是数值型变量;残差和因变量都要服从二项分布;自变量和Logistic概率是线性关系;各观测对象间相互独立。
-
●6.6有序多分类logistic回归分析
有序logistic回归适用于因变量为有等级或者程度的变量,自变量一般为二分类或多分类的变量,也可为连续数值型变量。有序logistic回归需要注意的是,因变量的赋值应以疾病严重程度越严重、满意度越高,对应的阿拉伯数字越大,这样更方便于对统计结果的理解和解释。
-
●6.7无序多分类Logistic回归分析
无序多分类logistic回归(multinomial logistic regression),其基本思想是选择因变量Y中其中一个类别作为参照类别,对剩余类别相对于参照类别拟合回归模型.无序多分类logistic线性回归适用于因变量为多分类的变量,自变量一般为二分类或多分类的变量,也可为连续数值型变量。
-
第七章聚类分析
在现实生活中,经常会遇到分类的问题。在分类学中,随着多元分析技术的引入,逐渐形成了聚类分析。由于聚类分析能解决许多实际问题,所以很受人们的重视。聚类分析按照分类对象在性质上的相似性或疏远程度进行科学的分类,聚类结果是同一类中的个体有较大的相似性,不同类中的个体差异很大。聚类分析主要是根据样品的多个观测指标,找到一些能够度量样品或变量之间相似程度的统计量,然后将样品或变量进行归类。聚类分析给人们提供了丰富多彩的分类方法,本章将重点介绍一些常见的分类统计量和常用的聚类方法。
-
●7.1聚类分析(一)
本节介绍聚类分析的基本思想。
-
●7.2聚类分析(二)
度量相似性的指标通常有距离和相似系数两种。在Q型聚类中,常用“距离”;在R型聚类中,常用“相似系数”。下面分别介绍几种常用的距离和相似系数。
-
●7.3聚类分析(三)
本节介绍聚类分析中类与类之间的距离计算方法。
-
●7.4聚类分析(四)
系统聚类是应用较为广泛的一种聚类方法。系统聚类思想源于古老的植物分类学。在植物分类学中,分类单位为门、纲、目、科、属和种,其中种是分类的基本单位。分类单位越小它所包含的植物种类就越少,植物间的共同特征就越多,本节介绍系统聚类的基本思想和方法。
-
●7.5聚类分析(五)
系统聚类不仅需要计算出不同样品或变量的距离,还要在聚类的每一步里都要计算“类间距离”,计算量较大。尤其当样本容量很大时,需要占据非常大的计算机内存空间。如果我们要分类的问题已明确需要分成几类,则可以采用K-均值聚类,也称快速聚类或动态聚类。
-
第八章判别分析
判别分析是根据判别对象若干个指标的观测结果判定其应属于哪一类的统计学方法,产生于20世纪30年代。判别分析的应用十分广泛。在日常生活和工作中,常常会遇到判别分析问题,即根据已知类别的资料确定一种判别方法,判定一个新的样品归属哪一类。本章主要介绍判别分析方法。
-
●8.1距离判别法
本节介绍判别分析的基本原理。
-
●8.2贝叶斯判别法
判别分析的基本原理是根据已掌握的每个类别若干样本指标观察值,建立判别公式和判别准则,将分类未知的新样本点观测值带入判别公式和判别准则,判别该样本点所属类别,本节介绍常用的判别分析方法距离判别法。
-
●8.3贝叶斯判别法的软件计算
本节介绍Bayes判别法。
-
●8.4Fisher判别法
Fisher判别法是根据方差分析的思想建立起来的一种能较好区分各个总体的线性判别法,该判别方法对总体的分布不做任何要求。本节介绍常用的判别分析方法Fisher判别法。
-
●8.5Fisher判别法的软件计算
本节介绍Fisher判别法的上机实现。
-
第九章主成分分析
主成分分析也称主分量分析,在多数实际问题中,不同指标之间有一定的相关性,由于指标较多及指标间有一定的相关性,势必增加分析问题的复杂性,主成分分析就是设法将原有指标重新组合成一组新的互相无关的综合指标,同时根据实际需要从中选取较少的几个综合指标来尽可能多地反映原来的指标信息。
-
●9.1主成分分析(一)
本节介绍主成分分析的基本思想。
-
●9.2主成分分析(二)
本节介绍主成分分析的几何意义。
-
●9.3主成分分析(三)
本节介绍主成分分析的数学模型和主成分推导。
-
●9.4主成分分析(四)
本节介绍主成分性质。
-
●9.5主成分分析(五)
本节介绍主成分分析分析的应用。
-
●9.6主成分分析(六)
本节介绍主成分分析分析的上机实现。
-
●9.7主成分分析(七)
本节介绍主成分回归。
-
第十章因子分析
因子分析是一种数据简化的技术,它通过研究变量之间的关系,找出能综合原始变量的少数几个因子,使得少数因子能够反映原始变量的绝大部分信息,然后根据相关性的大小将原始变量分组,使得组内的变量之间相关性较高,而不同组的变量之间相关性较低。例如,在企业形象或品牌形象的研究中,消费者可以通过一个有24个指标构成的评价体系,评价百货商场的24个方面的优劣,但消费者主要关心的是三个方面,即商店的环境、商店的服务和商品的价格。因子分析可以通过24个变量,找出反映商店环境、商店服务水平和商品价格的三个潜在的因子,对商店进行综合评价。
-
●10.1因子分析(一)
本节介绍因子分析的基本理论。
-
●10.2因子分析(二)
因子分析主要是由确定因子载荷,因子旋转及计算因子得分这三个步骤来完成。本节主要介绍因子载荷的求解方法。
-
●10.3因子分析(三)
因子分析的目的在于要找公共因子,知道每一个公共因子的实际意义,以便对问题进行分析,本节介绍公因子重要性分析。
-
●10.4因子分析(四)
本节介绍因子分析的上机实现。
-
第十一章相关分析
在对研究对象进行综合研究时,往往涉及到许多变量(指标)。这些变量(指标)通常会有有一定的信息重叠性,有的有一定的关联性。但为了突出事物属性的关键变量(指标),我们首先就需要剔除重叠性和关联性等,这就是所谓的变量之间的相关性分析。简单相关分析主要研究两变量间的相关性,通常定义一个相关系数来量化两个变量之间的相关程度。
-
●11.1简单相关分析
它常被用于衡量两个指标间的相关性或相似性,如施肥量和植物生长素的两者之间的相关性。两个变量之间的相关性是变量间相关性分析的基础。
-
●11.2偏相关分析
在相关分析中,由于变量之间存在错综复杂的关系,某些现象可能会干扰人们对于本质的认识。偏相关系数是排除了其他变量的影响下所计算的某两变量之间的相关系数,设法用一定的方法控制其他变量。
-
●11.3典型相关分析
典型相关分析是利用综合变量对之间的相关关系来反映两个变量组之间的整体相关性的多元统计分析方法。典型相关分析避免了孤立地对两个变量的研究,分析结果较为全面,且各组中变量的个数不受限制,应用十分广泛。





