zhcn 技术 WebSphere 假设检验:什么、如何以及为什么 [+ 5 个学习资源]

假设检验:什么、如何以及为什么 [+ 5 个学习资源]

假设检验是私营和政府部门许多分析师使用的一种方法,用于对人口数据做出合理的陈述和假设。

如果您使用或研究人口数据,您可能已经遇到过这个重要的假设检验工具。

许多方法可用于做出假设,但并非所有方法都能提供高精度。

此外,如果您不确定自己的数据但仍想使用它,则可能会给您的组织带来风险。

假设检验是实现更高准确度的好策略。对于人口分析很有用。

本文解释了什么是假设检验、它是如何工作的、它的好处以及使用示例。

那么让我们开始吧!

什么是假设检验?

假设检验是分析师使用的一种统计推断方法,用于测试可用的总体数据是否足以支持特定的假设,并据此提出假设。

这种方法使分析师能够轻松评估假设并根据手头的数据确定其准确性。

简单来说,它是一个基于推论统计的测试过程,可以让你根据收集到的样本数据对总体数据做出判断。

一般来说,分析人员几乎不可能发现整个群体的特征或特定参数。然而,假设检验允许您根据样本数据及其准确性做出明智的预测和决策。

假设检验的类型

不同类型的假设检验是:

  • 零假设:统计数据表明样本数据是突然的,并且给定样本数据中的两个变量之间不存在相关性。
  • 备择假设:证明主假设并反对原假设。这是测试过程的主要驱动因素,因为它显示了样本数据中两个变量之间的相关性。
  • 非定向假设:这种类型的假设检验作为双向假设。这说明样本数据中的两个变量之间不存在方向性,真实值与预测值并不相同。
  • 方向假设:方向假设表达两个变量之间的某种关系。在这里,样本数据中的一个变量可以影响其他变量。
  • 统计假设:帮助分析师评估数据和值是否满足某些假设。当对样本总体参数的结果做出陈述或假设时,这非常有用。

接下来,我们将解释如何检验假设。

假设检验方法

方法软测试
方法软测试

作为分析师,评估特定假设是否正确需要大量可信的证据才能得出结论。该测试过程在开始评估之前建立零假设和替代假设。

假设检验不仅仅涉及一种方法,而是涉及多种评估样本数据是否有利的方法。分析师必须考虑他们的数据和样本量,以选择适合他们的假设检验方法。

正态性检验

这是分析样本数据正态分布的标准假设检验方法。在测试过程中,将检查围绕平均值分组的数据点,看看它们是否低于或高于平均值。

通过此统计检验,分数高于或低于平均值的可能性是相同的。形成钟形曲线,均匀分布在平均值的两侧。

测试 Z 检验

这是总体数据呈正态分布时使用的另一种假设检验。当数据方差已知时,测试两个不同总体参数的均值是否不同。

分析总体数据时,如果数据的样本量大于 30,则可能会使用此类型。此外,中心极限定理指出,随着样本量的增加,样本变得呈正态分布,这是 Z 检验合适的另一个原因。

T检验

当样本量有限且通常是分布的时,使用 T 检验假设检验。一般情况下,如果样本量小于30且某个参数的标准差未知,则主要采用标准差。

执行 T 检验时,您执行它是为了计算特定总体数据的置信区间。

卡方检验

卡方检验是一种常见的假设检验过程,通常用于评估数据分布的拟合度和完整性。

资料来源: wikipedia.org
图像-227
图像-227

但是,使用此假设类型的主要原因是当您想要根据假设或已知值的总体方差检验总体方差时。执行各种卡方检验,但最常见的类型是方差和独立性的卡方检验。

方差分析检验

方差分析检验
方差分析检验

这缩写为方差分析,是一种统计测试方法,可用于比较两个样本数据集。但是,您可以同时比较两个或多个平均值。

我们还讨论了样本数据的因变量和自变量。方差分析的使用与 Z 检验和 T 检验的使用非常相似,尽管后两者仅限于两种测量。

假设检验如何进​​行?

所有利用假设检验的分析师都利用随机样本数据进行分析和测量。在测试过程中,使用随机样本数据来测试原假设和备择假设。

如前所述,原假设和备择假设是完全互斥的,并且只有一个假设在检验结果中为真。

然而,零假设可能会被拒绝。另类假设并不总是正确的。

来源: 分析步骤
假设验证工作
假设验证工作

p值:在测试过程开始时,涉及p值或概率值,表明结果是否显着。不仅如此,p 值还表明在检验过程中拒绝或不拒绝原假设时发生错误的概率。生成的 p 值为 0 或 1,然后与显着性或 alpha 水平进行比较。

这里的显着性水平定义了测试期间拒绝原假设的可接受风险。重要的是要记住,假设检验的结果可能会导致两种类型的错误。

  • 当检验结果被拒绝时,即使零假设为真,也会发生类型 1 错误
  • 当原假设为假但被样本结果接受时,就会出现第 2 类错误

所有导致拒绝原假设的值都存储在临界区域中。而区分重要区域和其他区域的正是临界值。

执行假设检验的步骤

来源: 媒体
假设步骤
假设步骤

假设检验涉及四个主要步骤。

  • 定义你的假设:第一步,你作为分析师的工作是定义两个假设,确保只有一个是正确的。原假设指出平均 BMI 没有差异,而备择假设指出平均 BMI 存在显着差异。
  • 规划:下一步需要设计一个关于如何分析样本数据的分析计划。执行抽样来收集样本数据非常重要,以确保其旨在检验您的假设。
  • 分析样本数据:一旦决定如何评估数据,就开始该过程。必须对样本数据进行物理分析,以确保没有冗余。分析数据时,必须确保样本彼此独立,并且两个样本量都足够大。
  • 计算检验统计量:在这个阶段,我们需要计算检验统计量并找到p值。 p 值是在假设原假设成立的情况下确定的。
  • 评估结果:在最后一步中,您需要评估假设检验的结果。在这里,您可以根据样本数据决定是否拒绝原假设或声明其有效性。

接下来,让我们看看假设检验的好处。

假设检验的优点

优点1
优点1

假设检验的好处是:

  • 这有助于分析反对数据决策的论据的强度。
  • 分析师可以创建一个可信的环境来确定样本数据。
  • 这使您可以确定假设检验中包含的样本数据是否具有统计显着性。
  • 这有助于评估系统测试过程中测试结果的可靠性和有效性。

这有助于根据您的要求将样本阶段的数据外推到更大的群体。

使用假设检验的示例

假设检验用于各个领域,以更好地估计样本数据的准确性。假设检验的一个实际例子是:

#1.临床试验

假设检验在临床试验中被广泛使用,因为它可以帮助医疗专业人员根据样本数据确定新药、治疗或程序是否有效。

医生可能认为治疗可能会降低某些患者的钾水平。医生可能会测量一组患者的钾水平,然后在进行治疗之前仔细检查该水平。

临床试验-1
临床试验-1

接下来,医生进行 H0:Uafter = Ubefore 的假设检验。这表明施用治疗后的钾水平与之前相同。另一个假设指出 Ha: Uafter < Ubefore,即治疗应用后钾水平下降。

因此,如果 p 值小于显着性水平,医生可以得出结论,治疗可以降低钾水平。

#2.制造业

制造工厂使用假设检验来帮助主管确定新方法或技术是否有效。

例如,一些制造部门可能会使用假设检验来查看新方法是否有助于减少每批次的缺陷品数量。假设每批缺陷品数量为 300 件。

制造工厂-
制造工厂-

制造商必须确定使用此方法之前和之后制造的缺陷产品的平均总数。他们可以执行假设检验并使用假设 H0:Uafter = Ubefore。在这种情况下,应用新方法后产生的平均不良品数量与之前相同。

另一个假设指出 HA:Uafter 不等于 Ubefore。这意味着应用新方法后产生的缺陷产品总数并不相同。

经过测试,如果 p 值小于显着性水平,则制造单位可以断定制造的缺陷产品数量发生了变化。

#3。农业

假设检验通常用于查明化肥或农药是否会导致植物生长和免疫力。生物学家可以使用此测试来证明特定植物在施用新肥料后可以生长 15 英寸或更长。

农业
农业

生物学家可能会施肥一个月来收集样本数据。当生物学家进行测试时,他假设 H0 U=15 英寸。这表明肥料并不能促进植物的平均生长。

另一个假设指出,HA:U> 15 英寸,这意味着肥料促进了植物的平均生长。在测试 p 值是否小于显着性水平后,生物学家现在可以证明肥料导致比以前更多的生长。

学习资源

#1.统计:Udemy 的逐步介绍

图像228
图像228

Udemy 提供统计学课程,逐步介绍统计学,包括假设检验。本课程包括前 Google 数据科学家的示例和课程,可帮助您掌握置信区间、假设检验等。

#2.使用 Udemy 进行数据分析的基本统计数据

图像-229
图像-229

这门有关数据分析的基本统计的 Udemy 课程将帮助您通过实际项目、有趣的活动、假设检验、概率分布、回归分析等来学习统计。

#3。数据科学和商业分析统计

图像-230
图像-230

Udemy 提供这门数据科学和商业分析统计课程,旨在帮助您学习假设检验。它涵盖了各种统计主题,并帮助数据科学家和业务分析师学习和掌握它们。涵盖推论和描述性统计以及回归分析。

#4。吉姆·弗罗斯特的假设检验

这本书可以在亚马逊上购买,是一本直观的指南,可以帮助分析师做出数据驱动的决策。

预览产品评估价格
假设检验:制定数据驱动决策的直观指南 假设检验:制定数据驱动决策的直观指南 23.98 美元

了解假设检验的工作原理、为什么需要它、如何有效地使用置信区间、p 值、显着性水平以及许多其他主题。

#5。斯科特·哈茨霍恩 (Scott Hartshorn) 的假设检验

本书以视觉示例为特色,非常适合寻求假设检验简单指南的初学者。

预览产品评估价格
假设检验:统计显着性的直观介绍 假设检验:统计显着性的直观介绍 9.75 美元

我们将介绍统计的含义、类型和机制。不需要深入的统计学知识,一切都可以直观地解释。

最后一句话

假设检验可帮助您验证假设并根据您的评估创建统计数据。它广泛应用于从制造和农业到临床试验和 IT 等各个领域。这种方法不仅准确,而且可以帮助组织做出数据驱动的决策。

接下来,查看我们成为业务分析师的学习资源。

假设检验是私营和政府部门许多分析师使用的一种方法,用于对人口数据做出合理的陈述和假设。

如果您使用或研究人口数据,您可能已经遇到过这个重要的假设检验工具。

许多方法可用于做出假设,但并非所有方法都能提供高精度。

此外,如果您不确定自己的数据但仍想使用它,则可能会给您的组织带来风险。

假设检验是实现更高准确度的好策略。对于人口分析很有用。

本文解释了什么是假设检验、它是如何工作的、它的好处以及使用示例。

那么让我们开始吧!

什么是假设检验?

假设检验是分析师使用的一种统计推断方法,用于测试可用的总体数据是否足以支持特定的假设,并据此提出假设。

这种方法使分析师能够轻松评估假设并根据手头的数据确定其准确性。

简单来说,它是一个基于推论统计的测试过程,可以让你根据收集到的样本数据对总体数据做出判断。

一般来说,分析人员几乎不可能发现整个群体的特征或特定参数。然而,假设检验允许您根据样本数据及其准确性做出明智的预测和决策。

假设检验的类型

不同类型的假设检验是:

  • 零假设:统计数据表明样本数据是突然的,并且给定样本数据中的两个变量之间不存在相关性。
  • 备择假设:证明主假设并反对原假设。这是测试过程的主要驱动因素,因为它显示了样本数据中两个变量之间的相关性。
  • 非定向假设:这种类型的假设检验作为双向假设。这说明样本数据中的两个变量之间不存在方向性,真实值与预测值并不相同。
  • 方向假设:方向假设表达两个变量之间的某种关系。在这里,样本数据中的一个变量可以影响其他变量。
  • 统计假设:帮助分析师评估数据和值是否满足某些假设。当对样本总体参数的结果做出陈述或假设时,这非常有用。

接下来,我们将解释如何检验假设。

假设检验方法

方法软测试
方法软测试

作为分析师,评估特定假设是否正确需要大量可信的证据才能得出结论。该测试过程在开始评估之前建立零假设和替代假设。

假设检验不仅仅涉及一种方法,而是涉及多种评估样本数据是否有利的方法。分析师必须考虑他们的数据和样本量,以选择适合他们的假设检验方法。

正态性检验

这是分析样本数据正态分布的标准假设检验方法。在测试过程中,将检查围绕平均值分组的数据点,看看它们是否低于或高于平均值。

通过此统计检验,分数高于或低于平均值的可能性是相同的。形成钟形曲线,均匀分布在平均值的两侧。

测试 Z 检验

这是总体数据呈正态分布时使用的另一种假设检验。当数据方差已知时,测试两个不同总体参数的均值是否不同。

分析总体数据时,如果数据的样本量大于 30,则可能会使用此类型。此外,中心极限定理指出,随着样本量的增加,样本变得呈正态分布,这是 Z 检验合适的另一个原因。

T检验

当样本量有限且通常是分布的时,使用 T 检验假设检验。一般情况下,如果样本量小于30且某个参数的标准差未知,则主要采用标准差。

执行 T 检验时,您执行它是为了计算特定总体数据的置信区间。

卡方检验

卡方检验是一种常见的假设检验过程,通常用于评估数据分布的拟合度和完整性。

资料来源: wikipedia.org
图像-227
图像-227

但是,使用此假设类型的主要原因是当您想要根据假设或已知值的总体方差检验总体方差时。执行各种卡方检验,但最常见的类型是方差和独立性的卡方检验。

方差分析检验

方差分析检验
方差分析检验

这缩写为方差分析,是一种统计测试方法,可用于比较两个样本数据集。但是,您可以同时比较两个或多个平均值。

我们还讨论了样本数据的因变量和自变量。方差分析的使用与 Z 检验和 T 检验的使用非常相似,尽管后两者仅限于两种测量。

假设检验如何进​​行?

所有利用假设检验的分析师都利用随机样本数据进行分析和测量。在测试过程中,使用随机样本数据来测试原假设和备择假设。

如前所述,原假设和备择假设是完全互斥的,并且只有一个假设在检验结果中为真。

然而,零假设可能会被拒绝。另类假设并不总是正确的。

来源: 分析步骤
假设验证工作
假设验证工作

p值:在测试过程开始时,涉及p值或概率值,表明结果是否显着。不仅如此,p 值还表明在检验过程中拒绝或不拒绝原假设时发生错误的概率。生成的 p 值为 0 或 1,然后与显着性或 alpha 水平进行比较。

这里的显着性水平定义了测试期间拒绝原假设的可接受风险。重要的是要记住,假设检验的结果可能会导致两种类型的错误。

  • 当检验结果被拒绝时,即使零假设为真,也会发生类型 1 错误
  • 当原假设为假但被样本结果接受时,就会出现第 2 类错误

所有导致拒绝原假设的值都存储在临界区域中。而区分重要区域和其他区域的正是临界值。

执行假设检验的步骤

来源: 媒体
假设步骤
假设步骤

假设检验涉及四个主要步骤。

  • 定义你的假设:第一步,你作为分析师的工作是定义两个假设,确保只有一个是正确的。原假设指出平均 BMI 没有差异,而备择假设指出平均 BMI 存在显着差异。
  • 规划:下一步需要设计一个关于如何分析样本数据的分析计划。执行抽样来收集样本数据非常重要,以确保其旨在检验您的假设。
  • 分析样本数据:一旦决定如何评估数据,就开始该过程。必须对样本数据进行物理分析,以确保没有冗余。分析数据时,必须确保样本彼此独立,并且两个样本量都足够大。
  • 计算检验统计量:在这个阶段,我们需要计算检验统计量并找到p值。 p 值是在假设原假设成立的情况下确定的。
  • 评估结果:在最后一步中,您需要评估假设检验的结果。在这里,您可以根据样本数据决定是否拒绝原假设或声明其有效性。

接下来,让我们看看假设检验的好处。

假设检验的优点

优点1
优点1

假设检验的好处是:

  • 这有助于分析反对数据决策的论据的强度。
  • 分析师可以创建一个可信的环境来确定样本数据。
  • 这使您可以确定假设检验中包含的样本数据是否具有统计显着性。
  • 这有助于评估系统测试过程中测试结果的可靠性和有效性。

这有助于根据您的要求将样本阶段的数据外推到更大的群体。

使用假设检验的示例

假设检验用于各个领域,以更好地估计样本数据的准确性。假设检验的一个实际例子是:

#1.临床试验

假设检验在临床试验中被广泛使用,因为它可以帮助医疗专业人员根据样本数据确定新药、治疗或程序是否有效。

医生可能认为治疗可能会降低某些患者的钾水平。医生可能会测量一组患者的钾水平,然后在进行治疗之前仔细检查该水平。

临床试验-1
临床试验-1

接下来,医生进行 H0:Uafter = Ubefore 的假设检验。这表明施用治疗后的钾水平与之前相同。另一个假设指出 Ha: Uafter < Ubefore,即治疗应用后钾水平下降。

因此,如果 p 值小于显着性水平,医生可以得出结论,治疗可以降低钾水平。

#2.制造业

制造工厂使用假设检验来帮助主管确定新方法或技术是否有效。

例如,一些制造部门可能会使用假设检验来查看新方法是否有助于减少每批次的缺陷品数量。假设每批缺陷品数量为 300 件。

制造工厂-
制造工厂-

制造商必须确定使用此方法之前和之后制造的缺陷产品的平均总数。他们可以执行假设检验并使用假设 H0:Uafter = Ubefore。在这种情况下,应用新方法后产生的平均不良品数量与之前相同。

另一个假设指出 HA:Uafter 不等于 Ubefore。这意味着应用新方法后产生的缺陷产品总数并不相同。

经过测试,如果 p 值小于显着性水平,则制造单位可以断定制造的缺陷产品数量发生了变化。

#3。农业

假设检验通常用于查明化肥或农药是否会导致植物生长和免疫力。生物学家可以使用此测试来证明特定植物在施用新肥料后可以生长 15 英寸或更长。

农业
农业

生物学家可能会施肥一个月来收集样本数据。当生物学家进行测试时,他假设 H0 U=15 英寸。这表明肥料并不能促进植物的平均生长。

另一个假设指出,HA:U> 15 英寸,这意味着肥料促进了植物的平均生长。在测试 p 值是否小于显着性水平后,生物学家现在可以证明肥料导致比以前更多的生长。

学习资源

#1.统计:Udemy 的逐步介绍

图像228
图像228

Udemy 提供统计学课程,逐步介绍统计学,包括假设检验。本课程包括前 Google 数据科学家的示例和课程,可帮助您掌握置信区间、假设检验等。

#2.使用 Udemy 进行数据分析的基本统计数据

图像-229
图像-229

这门有关数据分析的基本统计的 Udemy 课程将帮助您通过实际项目、有趣的活动、假设检验、概率分布、回归分析等来学习统计。

#3。数据科学和商业分析统计

图像-230
图像-230

Udemy 提供这门数据科学和商业分析统计课程,旨在帮助您学习假设检验。它涵盖了各种统计主题,并帮助数据科学家和业务分析师学习和掌握它们。涵盖推论和描述性统计以及回归分析。

#4。吉姆·弗罗斯特的假设检验

这本书可以在亚马逊上购买,是一本直观的指南,可以帮助分析师做出数据驱动的决策。

预览产品评估价格
假设检验:制定数据驱动决策的直观指南 假设检验:制定数据驱动决策的直观指南 23.98 美元

了解假设检验的工作原理、为什么需要它、如何有效地使用置信区间、p 值、显着性水平以及许多其他主题。

#5。斯科特·哈茨霍恩 (Scott Hartshorn) 的假设检验

本书以视觉示例为特色,非常适合寻求假设检验简单指南的初学者。

预览产品评估价格
假设检验:统计显着性的直观介绍 假设检验:统计显着性的直观介绍 9.75 美元

我们将介绍统计的含义、类型和机制。不需要深入的统计学知识,一切都可以直观地解释。

最后一句话

假设检验可帮助您验证假设并根据您的评估创建统计数据。它广泛应用于从制造和农业到临床试验和 IT 等各个领域。这种方法不仅准确,而且可以帮助组织做出数据驱动的决策。

接下来,查看我们成为业务分析师的学习资源。