仮説検定は、人口データについてありそうな記述や仮定を行うために、民間部門や政府部門の多くのアナリストによって利用されている方法です。
人口データを扱ったり研究したりしている人なら、この仮説検証の重要なツールに出会ったことがあるはずです。
仮定を立てるために多くの方法を使用できますが、すべての方法で高い精度が得られるわけではありません。
また、自分のデータについてよくわからないが、それでも使用したい場合は、組織にとってリスクが生じる可能性があります。
仮説テストは、より高いレベルの精度を達成するための優れた戦略です。人口分析に役立っています。
この記事では、仮説テストとは何か、その仕組み、利点、使用例について説明します。
それでは、さっそく始めましょう!
仮説検定とは何ですか?
仮説検定は、アナリストが利用可能な母集団データが特定の仮説を十分に裏付けているかどうかをテストし、そこから仮説を立てるために使用する統計的推論方法です。
この方法により、アナリストは仮説を簡単に評価し、手元のデータに基づいてその仮説がどの程度正確であるかを判断できます。
簡単に言うと、これは、収集されたサンプル データに基づいて母集団データについての判断を下すことを可能にする、推論統計に基づくテスト プロセスです。
一般に、分析者が母集団全体の特性や特定のパラメーターを見つけることはほとんど不可能です。しかし、仮説テストを行うことで、サンプル データとその精度に基づいて、情報に基づいた予測と意思決定を行うことができます。
仮説検定の種類
さまざまなタイプの仮説検定は次のとおりです。
- 帰無仮説: 統計は、サンプル データが突然であり、指定されたサンプル データ内の 2 つの変数間に相関関係がないことを示しています。
- 対立仮説: 主な仮説を実証し、帰無仮説に反対します。これはサンプル データ内の 2 つの変数間の相関関係を示すため、テスト プロセスの主な原動力となります。
- 非方向性仮説: このタイプの仮説検定は、両側仮説として機能します。これは、サンプル データ内の 2 つの変数間に方向性がなく、真の値が予測値と同じではないことを示しています。
- 方向性仮説: 方向性仮説は、2 つの変数間の何らかの関係を表します。ここで、サンプル データ内の 1 つの変数が他の変数に影響を与える可能性があります。
- 統計的仮説: アナリストがデータと値が特定の仮説を満たすかどうかを評価するのに役立ちます。これは、サンプル母集団パラメータの結果に関する記述や仮定を行う場合に非常に役立ちます。
次に、仮説検証の方法について説明します。
仮説検定の方法

分析者として特定の仮説が正しいかどうかを評価するには、結論を出すために多くのもっともらしい証拠が必要になります。このテスト プロセスでは、評価を開始する前に帰無仮説と対立仮説が設定されます。
仮説検定には 1 つの方法だけではなく、サンプルデータが好ましいかどうかを評価するための多くの方法が含まれます。アナリストは、データとサンプルサイズを考慮して、自分に合った仮説検定方法を選択する必要があります。
正規性テスト
これは、サンプル データの正規分布を分析するための標準的な仮説検定方法です。テスト プロセス中に、平均値付近のグループ化されたデータ ポイントが平均値を下回っているか上回っているかがチェックされます。
この統計的検定では、ポイントが平均を上回るか下回る可能性が同様にあります。釣鐘曲線が形成され、平均値の両側に均等に分布します。
Z テストのテスト
これは、母集団データが正規分布している場合に使用される、別のタイプの仮説検定です。データの分散がわかっている場合、2 つの別個の母集団パラメータの平均が異なるかどうかを検定します。
人口データを分析する際、データのサンプル サイズが 30 を超える場合は、このタイプを使用する可能性が高くなります。さらに、中心極限定理は、サンプル サイズが増加するとサンプルが正規分布することを示すため、Z テストが適切になるもう 1 つの理由です。
T テストのテスト
T テストの仮説検定は、サンプル サイズが限られており、通常は分散されている場合に使用されます。一般に、サンプル サイズが 30 未満で、パラメータの標準偏差が不明な場合は、主に標準偏差が適用されます。
T 検定を実行するときは、特定の母集団データの信頼区間を計算するために実行します。
カイ二乗検定
カイ二乗検定は、データの分布の適合性と完全性を評価するためによく使用される、一般的な仮説検定プロセスです。

ただし、この仮説タイプを使用する主な理由は、仮定された値または既知の値の母集団分散に対して母集団分散をテストする場合です。さまざまなカイ二乗検定が実行されますが、最も一般的なタイプは分散と独立性のカイ二乗検定です。
分散分析テスト

これは分散分析と略され、2 つのサンプルのデータセットを比較するのに役立つ統計的検定方法です。ただし、一度に 2 つ以上の平均を比較できます。
サンプルデータの従属変数と独立変数についても説明します。 ANOVA の使用法は Z 検定と T 検定の使用法に非常に似ていますが、後者の 2 つは 2 つの手段のみに制限されています。
仮説検定はどのように機能するのでしょうか?
仮説検定を利用するすべてのアナリストは、分析と測定のためにランダムなサンプル データを利用します。テスト中に、帰無仮説と対立仮説をテストするためにランダムなサンプル データが利用されます。
前に説明したように、帰無仮説と対立仮説は完全に相互排他的であり、テストの結果において真となるのは 1 つだけです。
ただし、帰無仮説が棄却される場合もあります。対立仮説は常に真であるとは限りません。

p 値: 検定プロセスの開始中に、p 値または確率値が関係し、結果が有意かどうかを示します。それだけでなく、p 値は、検定中に帰無仮説を棄却した場合または棄却しなかった場合のエラーの発生確率も示します。結果の p 値は 0 または 1 のいずれかであり、その後、有意水準またはアルファ水準と比較されます。
ここでの有意水準は、検定中に帰無仮説を棄却する際の許容可能なリスクを定義します。仮説検定の結果は 2 種類のエラーにつながる可能性があることを覚えておくことが重要です。
- タイプ 1 エラーは、 検定結果が帰無仮説が真であっても棄却される場合に発生します。
- タイプ 2 エラーは、 帰無仮説が偽であるにもかかわらずサンプル結果によって受け入れられる場合に発生します。
帰無仮説の棄却を引き起こすすべての値が臨界領域に格納されます。そして、重要な領域を他の領域から区別するのは重要な値です。
仮説検定を実行する手順

仮説検証には主に 4 つのステップが含まれます。
- 仮説を定義する: 最初のステップでは、アナリストとしての仕事は、1 つだけが真実となるように 2 つの仮説を定義することです。帰無仮説は平均 BMI に差がないことを示しますが、対立仮説は平均 BMI に有意な差があると示します。
- 計画: 次のステップでは、サンプル データを分析する方法に関する分析計画を設計する必要があります。仮説を検証するように設計されていることを確認するために、サンプリングを実行してサンプル データを収集することが重要です。
- サンプル データの分析: データをどのように評価するかを決定したら、プロセスを開始します。冗長性がないよう、サンプル データを物理的に分析する必要があります。データを分析する際には、サンプルが互いに独立していること、および両方のサンプル サイズが十分に大きいことを確認する必要があります。
- 検定統計量の計算: この段階では、検定統計量を計算して p 値を見つける必要があります。 p 値は、帰無仮説が真であると仮定して決定されます。
- 結果を評価する: 最後のステップでは、仮説テストの結果を評価する必要があります。ここでは、サンプル データに基づいて帰無仮説を棄却するか、その妥当性を宣言するかを決定します。
次に、仮説検証の利点を見ていきます。
仮説検定の利点

仮説検証の利点は次のとおりです。
- これは、データに関する決定に対する主張の強さを分析するのに役立ちます。
- アナリストは、サンプル データを決定するための信頼できる環境を構築できます。
- これにより、仮説検定に含まれるサンプル データが統計的に有意であるかどうかを判断できます。
- これは、体系的なテスト プロセスにおけるテスト結果の信頼性と有効性を評価するのに役立ちます。
これは、要件に応じて、サンプル段階からより大きな母集団へのデータの外挿に役立ちます。
仮説検定の使用例
仮説検定は、サンプル データの精度を適切に推測するためにさまざまな分野で利用されています。仮説検証の実際の例は次のとおりです。
#1. 臨床試験
仮説検定は、医療専門家がサンプルデータに基づいて新しい薬、治療法、手順が有効かどうかを判断するのに役立つため、臨床試験中に広く利用されています。
医師は、治療により一部の患者のカリウム濃度が軽減される可能性があると考えるかもしれません。医師は、治療を行う前に患者グループのカリウム濃度を測定し、その濃度を再度確認することがあります。

次に、医師は H0:Uafter = Ubefore の仮説検定を実行します。これは、治療適用後のカリウム レベルが以前と同じであることを示します。別の仮説は、Ha: Uafter < Ubefore、つまり治療適用後にカリウムレベルが低下したことを示しています。
したがって、p 値が有意水準より小さい場合、医師は治療によりカリウム値を低下させることができると結論付けることができます。
#2. 製造業
仮説検証は製造工場で、監督者が新しい方法や技術が有効かどうかを判断するのに役立ちます。
たとえば、一部の製造部門では仮説テストを使用して、新しい方法がバッチごとの不良品の数を減らすのに役立っているかどうかを確認する場合があります。不良品の数が 1 バッチあたり 300 個であるとします。

製造業者は、この方法を使用する前後で製造された欠陥製品の総数の平均を決定する必要があります。彼らは仮説テストを実行し、仮説 H0: Uafter = Ubefore を使用する場合があります。この場合、新しい方法を適用した後に生成される不良品の平均は以前と同じです。
別の仮説は、HA:Uafter が Ubefore と等しくないことを示しています。これは、新しい方法を適用した後に生成される不良品の総数が同じではないことを意味します。
テスト後、p 値が有意水準より小さい場合、製造ユニットは、製造された不良製品の数が変化したと結論付けることができます。
#3. 農業
仮説検定は、肥料または農薬が植物の成長と免疫を引き起こしているかどうかを調べるためによく使用されます。生物学者はこの試験を利用して、新しい肥料を適用した後に特定の植物が 15 インチ以上成長する可能性があることを証明する可能性があります。

生物学者は、サンプル データを収集するために 1 か月間肥料を適用する場合があります。生物学者がテストを実行すると、H0 U=15 インチという仮説が立てられます。これは、肥料が植物の平均成長を促進しないことを示しています。
別の仮説は、HA: U> 15 インチを示しており、肥料が植物の平均成長を促進することを意味します。 p 値が有意水準より小さい場合をテストした後、生物学者は肥料が以前よりも多くの成長を引き起こすことを証明できるようになりました。
学習リソース
#1. 統計: Udemyによるステップバイステップの紹介

Udemyは、仮説検証を含む統計への段階的な入門を学ぶ統計コースを提供しています。このコースには、信頼区間や仮説検定などを習得するのに役立つ、元 Google データ サイエンティストによる例とレッスンが含まれています。
#2. Udemyによるデータ分析に必須の統計

データ分析に必須の統計に関するこのUdemyコースは、実際のプロジェクト、楽しいアクティビティ、仮説テスト、確率分布、回帰分析などを使って統計を学ぶのに役立ちます。
#3. データサイエンスとビジネス分析のための統計

データサイエンスとビジネス分析のための統計に関するこのコースは、仮説検証の学習に役立つUdemyによって提供されています。さまざまな統計トピックをカバーしており、データ サイエンティストやビジネス アナリストがそれらを学習して習得できるようにします。回帰分析とともに推論統計と記述統計をカバーします。
#4. 仮説検証 by Jim Frost
この本は Amazon で購入でき、アナリストがデータに基づいた意思決定を行うのに役立つ直感的なガイドです。
プレビュー | 製品 | 評価 | 価格 | |
---|---|---|---|---|
![]() |
仮説テスト: データに基づいた意思決定を行うための直感的なガイド | $23.98 | アマゾンで購入する |
仮説検定の仕組み、仮説検定が必要な理由、信頼区間、p 値、有意水準などを効果的に使用する方法、その他多くのトピックについて説明します。
#5. 仮説検定 by Scott Hartshorn
この本は視覚的な例が特徴的で、仮説検証に関する簡単なガイドを求めている初心者に最適です。
プレビュー | 製品 | 評価 | 価格 | |
---|---|---|---|---|
![]() |
仮説検定: 統計的有意性の視覚的入門 | $9.75 | アマゾンで購入する |
統計の意味や種類、仕組みなどを紹介します。統計に関する事前の深い知識は必要ありませんが、すべてを直感的に説明します。
最後の言葉
仮説テストは、仮説を検証し、評価に基づいて統計データを作成するのに役立ちます。製造業や農業から臨床試験やITに至るまで、さまざまな分野で活用されています。この方法は正確であるだけでなく、組織にとってデータに基づいた意思決定を行うのにも役立ちます。
次に、ビジネス アナリストになるための学習リソースを確認してください。