ビジネス データの視覚化 非公開: 時系列データの入門ガイド

時系列データの入門ガイド

データの蓄積において「時間」は重要な変数です。時系列分析では、時間はデータの重要な要素です。

時系列データの入門ガイド
時系列データの入門ガイド

時系列データとは何ですか?

時系列データは、時間順に並べられた一連のデータ ポイントを指します。これにより、一連の観測間に順序依存性が導入されます。今日のデータ主導の世界では、時系列が遍在しています。あらゆる出来事が時間の矢に従って進行するため、私たちはさまざまな時系列データと常にやり取りしています。

時系列は通常、一定の時間間隔で生成されると想定されており、定期時系列と呼ばれます。ただし、その時系列内のデータは一定の間隔で生成される必要はありません。このような例には、データが時間的に段階的なシーケンスに従う不規則な時系列が含まれます。これは、測定が定期的に行われない可能性があることを意味します。ただし、データは離散的な時間間隔で、またはバーストとして生成される場合があります。 ATM の引き出しや口座への入金は、不規則な時系列の例です。

技術的には、時系列では、1 つ以上の変数が特定の期間にわたって変化します。単一の変数が時間の経過とともに変化する場合、それは一変量時系列と呼ばれます。たとえば、部屋の温度を毎秒測定するセンサーについて考えてみましょう。ここでは、一次元の温度値のみが各瞬間(つまり秒)ごとに生成されます。逆に、複数の変数が時間の経過とともに変化する場合、それは多変量時系列と呼ばれます。たとえば、銀行の経済学を考えてみましょう。このような場合、多変量時系列は、レポ金利などの 1 つの変数に対する政策変更が他の変数 (商業銀行への融資実行など) にどのような影響を与えるかを理解するために使用されます。

時系列データは、金融、地質学、気象学、製造からコンピューティング、IoT、物理科学、社会科学に至るまで、あらゆる分野で応用されています。気象変化、出生率、死亡率、市場変動、ネットワークパフォーマンス、その他多くのアプリケーションを追跡するために使用されます。主な使用例には、監視、予測、異常検出などがあります。たとえば、時系列予測はデータベース管理システムの人気を決定する上で重要な役割を果たします。以下の図は、長年 (2019 年から 2021 年) にわたる DBMS の人気の高まりを時系列プロットで示しています。

https://www.influxdata.com/time-series-database/

時系列の主要な構成要素

時系列の観測値に影響を与える要因は、その主要な構成要素として扱われます。コンポーネントの 3 つのカテゴリには次のものがあります。

  1. トレンドまたは長期的な動き
  2. 短期的な動き
    1. 季節変動
    2. 周期的変動
  3. ランダムまたは不規則な動き

傾向

長期間にわたってデータが増加または減少する傾向は、トレンドまたは長期コンポーネントと呼ばれます。ただし、上向きまたは下向きの動きは、特定の期間にわたって必ずしも同じ方向である必要はないことに注意することが重要です。

傾向は、時間のさまざまな部分にわたって上昇、下降、または安定したままになる可能性があります。ただし、全体的な傾向は常に上昇、下降、または安定したパターンに一致する必要があります。このような移動傾向は、農業の生産性、死亡率、製造されたデバイス、工場の数などの例で明らかです。

線形および非線形トレンド

時系列値を時間に対してグラフ上にプロットすると、データ クラスタリングのパターンに基づいて傾向の種類が明らかになります。データ クラスターがほぼ直線の周囲にある場合、その傾向は線形傾向と呼ばれます。それ以外の場合、2 つの変数間の変化の比率が安定または一定ではないため、データ クラスター パターンは非線形傾向を示します。したがって、このような傾向は曲線相関とも呼ばれます。

短期的な動き

時系列では、これらのコンポーネントは一定期間にわたって繰り返される傾向があります。それらは不規則な短いバーストを持ち、研究中の変数に影響を与えます。短期的な動きの 2 つのカテゴリ タイプは次のとおりです。

季節の変化

これらのバージョンは、1 年未満の期間にわたって定期的に動作します。 12 か月間で同様またはほぼ同じパターンになる傾向があります。データが定期的に、つまり、毎時、毎日、毎週、毎月、または四半期ごとに記録される場合、このような変動は時系列の一部になります。

季節変動は人為的または自然発生的です。このような変化には、季節や気候条件の違いが重要な役割を果たします。たとえば、作物の生産は完全に季節に依存します。同様に、傘やレインコートの市場は梅雨に左右されますが、クーラーやエアコンの販売は夏の季節にピークを迎えます。

人工的な慣習には、祭り、パーティー、結婚式などの行事が含まれます。このような短期的な出来事は毎年繰り返されます。

周期的変動

1 年以上の期間にわたって発生する傾向のある時系列変動は、周期的変動と呼ばれます。企業にとって、一周期を「景気循環」といいます。業績の急上昇または下降は、経済構造、企業経営、その他の相互作用要因などのさまざまな要因に依存します。これらの周期的なビジネス変動は定期的である場合もありますが、周期的ではありません。一般に企業は、繁栄、不況、不況、復活という4段階の循環プロセスを経ます。

ビジネス開発は生成された「連続データ ポイント」に大きく依存するため、このような周期的な変動は時系列パターンに不可欠です。

ランダムまたは不規則な動き

ランダム成分は、観察中の変数に大きな変動を引き起こします。これらは、決まったパターンのない、純粋に不規則な変動です。地震、洪水、飢餓、その他の災害など、その力は予見できず、予測不可能で、性質が不安定です。

上で説明したランダム イベントは、ソース時系列データを使用して分析され、将来発生する可能性のある現実のシナリオに適切に対処します。

時系列の種類

時系列データは、決定的、非決定的、定常、非定常の 4 つのタイプに分類できます。それぞれのタイプについて詳しく見ていきましょう。

#1.決定論的時系列

決定論的な時系列は、分析式を使用して説明できます。ランダムまたは確率的な側面は含まれません。数学的には、テイラー級数展開の観点からすべての時間間隔を正確に表現できます。これは、任意の時点でその導関数がすべてわかっている場合に可能です。これらの派生語は、その時点での過去と未来を明示的に指定します。すべての条件が満たされていれば、将来の動作を正確に予測し、過去にどのように動作したかを分析することができます。

#2.非決定的な時系列

非決定的な時系列にはランダムな側面が関連付けられており、そのため明示的な記述が妨げられます。したがって、分析式は、そのような時系列を表現するのに十分なソリューションではありません。次の理由により、時系列は非決定的になる可能性があります。

  1. それを説明するために必要な情報は完全には入手できません。データは原理的に存在する可能性がありますが、明示的に定量化できるものとして扱うことはできません。
  2. データ生成プロセスは本質的にランダムです。

ランダムな要因により、非決定的な時系列は確率的な法則に従います。したがって、データは統計用語で扱われます。これは、データがさまざまな形の確率分布と平均によって定義されることを意味します。これには、分散の手段と尺度、つまり分散が含まれます。

#3.定常時系列

定常時系列では、平均、分散などの統計的特性は時間の側面に依存しません。定常時系列は、その統計的特性が過去に観察されたものと同じままであると確信を持って言えるため、予測が容易です。したがって、さまざまな統計的予測方法は、時系列はほぼ定常であるという議論に基づいています。これは、単純な数学的変換を適用することで時系列が近似的に定常であると見なせることを意味します。

#4.非定常時系列

非定常系列では、統計的特性は時間とともに変化します。したがって、傾向や季節性がさまざまな時間間隔で時系列の値に影響を与える可能性があるため、傾向または季節性のある時系列は非定常のカテゴリに分類されます。非定常時系列は予測不可能なデータを記述するため、モデル化や予測ができなくなります。

https://www.oreilly.com/library/view/hands-on-machine-learning/9781788992282/15c9cc40-bea2-4b75-902f-2e9739fec4ae.xhtml

時系列分析と予測

時系列分析と予測は、さまざまな種類の重要なプロセスやオブジェクトの進化とダイナミクスを観察、分析、研究するための便利なツールです。それぞれをさらに詳しく見てみましょう。

時系列分析

時系列分析は、一定期間にわたって収集されたデータを分析するプロセスとして定義されます。ここでは、データ アナリストが一定の期間にわたって一定の間隔でデータを記録します。データ観測レート、つまり時間間隔は、数秒から数年まで変化します。

時系列データは、特定の期間にわたる変動パターンの詳細な分析を提供するため、検査対象の変数を記述します。分析に必要なパラメータは、ドメインや分野によって異なる場合があります。例としては次のようなものがあります。

  • 科学機器 – 1 日あたりに記録されるデータ
  • 商用 Web サイト – 1 日あたりの顧客の訪問数
  • 株式市場 – 週ごとの株価
  • 季節 – 年間雨の日

一貫性と信頼性を確保するために、時系列分析は大量のデータ ポイントに対して実行されます。適切なサンプル サイズは、発見された傾向やパターンの信頼性を微妙に表現します。

さらに、時系列分析は、過去の記録データに基づいて将来のイベントを予測するのにも適しています。

時系列予測

時系列分析により、組織は時間の経過に伴う傾向の変動の根本原因を特定できます。データを入手すれば、企業はさらに研究を進め、未知の傾向に対処し、今後のイベントを予測する方法をよりよく理解できるようになります。企業は通常、データのこのような異常を判断するためにデータ視覚化技術を採用しています。

時系列予測は、次の 2 つの重要な要素を中心に展開します。

  1. 過去のデータの動作に基づいて将来の出来事を予測します。
  2. 今後の傾向は過去のデータ パターンと類似していると仮定します。

予測の主な目的は、基本的に、データ ポイントが将来的にどのように変化し続けるかを予測することです。時系列分析と予測のニュアンスをより深く理解するために、さまざまな業界セクターの例をいくつか紹介します。

  • 株式市場 – 毎日の株価終値を予測します。
  • 売上 – 毎日の店舗の製品売上を予測します。
  • 価格設定 – 毎日の平均燃料価格を予測します。

時系列予測に使用される一般的な統計手法には、単純移動平均 (SMA)、指数平滑法 (SES)、自己回帰統合移動平均 (ARIMA)、ニューラル ネットワーク (NN) などがあります。

クラウド内の時系列データ

時系列データの価値を明らかにするには、企業はデータを迅速に保存してクエリできる必要があります。資本市場企業は、リアルタイムのデータ分析を採用し、影響力のあるビジネス上の意思決定を行うために、大量の履歴データとストリーミング データに依存しています。これには、株価の脆弱性の予測、純資本要件の決定、または為替レートの予測が含まれる場合があります。柔軟性を提供し、データをシームレスに処理するために、多くの企業は時系列データベースのクラウドへの移行を選択しています。

時系列データベースをクラウドに移行すると、組織はオンデマンドで無制限のリソースにアクセスできるようになります。これにより、企業は数百のコアを利用して、遅延の問題を発生させることなくネットワーク スループットを最大化するタスクを達成できます。

クラウド インフラストラクチャの時系列データベースは、コンピューティング集中型のワークロードに適しています。これには、リアルタイムの市場動向に応じてリスク計算を実行することが含まれます。金融会社はデータセンターのオーバーヘッドを排除し、リソースの活用に重点を置いてワークロードの生産性を向上させることができます。

AWS などのクラウド ベンダーは、時系列データセットの読み込み、保存、分析を容易にする時系列データベース サービスである Amazon Timestream を提供しています。これらは、トランザクション集中型のワークロードを管理するためのストレージ、リアルタイム分析ツール、およびイベントの発生時に機能するデータ ストリーミング機能を提供します。

したがって、クラウド インフラストラクチャは、時系列データの利点を増幅および拡張します。

時系列の応用

時系列モデルは 2 つの目的に役立ちます。

  1. 特定のパターンのデータを生成した根本的な要因を理解します。
  2. 分析に基づいて、予測および監視するモデルを適合させます。

時系列データのアプリケーションの使用例をいくつか見てみましょう。

#1.財務およびビジネス領域の時系列

すべての財務、ビジネス、投資に関する意思決定は、現在の市場動向と需要予測に基づいて行われます。時系列データは、動的な金融市場を説明、相関付け、予測するために使用されます。金融専門家は財務データを調査して、リスクの軽減、価格設定と取引の安定化に役立つアプリケーションの予測を行うことができます。

時系列分析は財務分析において重要な役割を果たします。金利の予測、株式市場のボラティリティの予測などに使用されます。ビジネスの利害関係者や政策立案者は、製造、購入、リソースの割り当てについて情報に基づいた意思決定を行い、事業運営を最適化できます。

この分析は、投資分野で証券金利とその時間の経過に伴う変動を監視するために効果的に使用されます。証券価格は、短期 (つまり、1 時間または 1 日あたりの記録データ) または長期 (つまり、数か月または数年にわたる観察) で観察することもできます。時系列分析は、長期間にわたる証券、資産、または経済変数のパフォーマンスを追跡するのに便利なツールです。

#2.医療領域の時系列

ヘルスケアはデータ駆動型の分野として急速に台頭しています。財務分析やビジネス分析に加えて、医療分野でも時系列分析が大いに活用されています。

がん患者の治療中に、時系列データ、医学的に調整された手順、データ マイニング技術の相乗効果が必要なシナリオを考えてみましょう。このようなハイブリッドフレームワークは、収集された時系列データ(つまり、患者のX線画像)からの特徴抽出機能を利用して、医療団体が提供する治療に対する患者の進行状況と反応を追跡するために使用できます。

ヘルスケア分野では、絶えず変化する時系列データから推論を導き出すことが非常に重要です。さらに、高度な医療行為では、患者の健康状態をより良く可視化するために、患者の記録を長期にわたって接続することが求められています。また、患者の健康状態をより明確に把握するには、患者の健康パラメータを定期的に正確に記録する必要があります。

高度な医療機器の登場に伴い、時系列分析はヘルスケア領域での地位を確立しました。以下の例を考えてみましょう。

  • ECG デバイス: 心臓の電気パルスを記録することによって心臓の状態を監視するために発明されたデバイス。
  • EEG デバイス: 脳内の電気活動を定量化するために使用されるデバイス。

このようなデバイスにより、医療従事者は時系列分析を実行して、より迅速で効果的かつ正確な医療診断を行うことができるようになりました。

さらに、ウェアラブル センサーやポータブル ヘルスケア デバイスなどの IoT デバイスの出現により、人々は最小限の入力で長期にわたって自分の健康変数を定期的に測定できるようになりました。これにより、病気の人と健康な人の両方について、時間依存の医療データの一貫したデータ収集が可能になります。

#3.天文学における時系列

天文学と天体物理学は、時系列データが大きく活用されている 2 つの現代の学問です。

基本的に、天文学には、地球の大気を超えた宇宙をより深く理解するために、宇宙物体の軌道と天体のプロットと正確な測定の実行が含まれます。この要件により、天文学の専門家は、複雑な機器の校正と構成、および関心のある天体の研究をしながら、時系列データの処理に熟練しています。

時系列データは長い間天文学の分野と関連付けられてきました。紀元前 800 年に、黒点の時系列データが一定の間隔で収集されました。それ以来、時系列分析は次の目的で使用されるようになりました。

  • 恒星間距離に基づいて遠くの星を発見し、
  • 超新星などの宇宙現象を観察して、宇宙の起源をより深く理解しましょう。

この場合の時系列データは、星、天体、または物体が発する光の波長と強度に関連します。天文学者は、このようなライブ ストリーミング データを常に監視して、宇宙の出来事を発生時にリアルタイムで検出します。

最近では、データマイニング、機械学習、計算知能、統計などのさまざまな分野を融合した、宇宙情報学や宇宙統計学などの研究分野が出現しています。これらの新しい研究分野における時系列データの役割は、天体を迅速かつ効率的に検出して分類することです。

#4.天気予報の時系列

アリストテレスは、古代の気象変化で観察された原因と影響をよりよく理解するために、気象パターンを広範囲に研究しました。日が経つにつれて、科学者たちは大気の変数を計算するための「気圧計」などの機器に気象関連データを記録し始めました。データは定期的に収集され、さまざまな場所に保管されました。

時間が経つにつれ、やがて天気予報が新聞で取り上げられるようになりました。今日に遡ると、正確な気象変数を収集するために、ユビキタスな気象予測ステーションが世界中のさまざまな地域に設置されています。

このような観測所には、さまざまな場所から気象データを収集して関連付けるために相互接続された高度な機能デバイスが備えられています。相関データは、要件に応じてあらゆる時点での気象状況を予測するために使用されます。

#5.事業開発における時系列

時系列データにより、企業はビジネス上の意思決定を行うことができます。これは、プロセスが過去のデータを分析して将来の出来事を導き出し、起こり得る可能性を明らかにすることで実現されます。過去のデータ パターンは、次のパラメータを導出するために使用されます。

  • ビジネスの成長 : 全体的な財務およびビジネスのパフォーマンスを評価し、成長を測定するには、時系列データが最も適切で信頼できる資産です。
  • 傾向の推定 : さまざまな時系列手法を使用して、新たな傾向を推定できます。たとえば、これらの方法は、特定の電子デバイスの売上の増減を反映するために、一定期間にわたるデータ観察を分析することを考えてみましょう。
  • 季節パターンを明らかにする : 記録されたデータ ポイントにより、データ予測に役立つ変動や季節パターンが明らかになります。季節ごとに製品価格が変動する市場では、取得したデータ情報が重要な役割を果たします。このようなデータは、企業がより適切な製品計画と開発を行うのに役立つ可能性があります。

結論👨‍🏫

要約すると、時系列データは、一定期間にわたって収集された複雑なデータ ポイントの特性として見ることができます。時系列分析、モデリング、予測は、IoT ガジェット、スマート家電、ポータブル デバイスの出現により、私たちの日常生活に不可欠な部分になりました。さらに、時系列データは、医療、天体物理学、経済学、工学、ビジネスなど、さまざまな分野で応用されています。

「時系列データの入門ガイド」についてわかりやすく解説!絶対に観るべきベスト2動画

Pythonで時系列分析してみよう#1〜時系列データの基本〜
Pandas入門講座|13.Pandasで時系列データを扱う方法【PythonのライブラリPandas】

データの蓄積において「時間」は重要な変数です。時系列分析では、時間はデータの重要な要素です。

時系列データの入門ガイド
時系列データの入門ガイド

時系列データとは何ですか?

時系列データは、時間順に並べられた一連のデータ ポイントを指します。これにより、一連の観測間に順序依存性が導入されます。今日のデータ主導の世界では、時系列が遍在しています。あらゆる出来事が時間の矢に従って進行するため、私たちはさまざまな時系列データと常にやり取りしています。

時系列は通常、一定の時間間隔で生成されると想定されており、定期時系列と呼ばれます。ただし、その時系列内のデータは一定の間隔で生成される必要はありません。このような例には、データが時間的に段階的なシーケンスに従う不規則な時系列が含まれます。これは、測定が定期的に行われない可能性があることを意味します。ただし、データは離散的な時間間隔で、またはバーストとして生成される場合があります。 ATM の引き出しや口座への入金は、不規則な時系列の例です。

技術的には、時系列では、1 つ以上の変数が特定の期間にわたって変化します。単一の変数が時間の経過とともに変化する場合、それは一変量時系列と呼ばれます。たとえば、部屋の温度を毎秒測定するセンサーについて考えてみましょう。ここでは、一次元の温度値のみが各瞬間(つまり秒)ごとに生成されます。逆に、複数の変数が時間の経過とともに変化する場合、それは多変量時系列と呼ばれます。たとえば、銀行の経済学を考えてみましょう。このような場合、多変量時系列は、レポ金利などの 1 つの変数に対する政策変更が他の変数 (商業銀行への融資実行など) にどのような影響を与えるかを理解するために使用されます。

時系列データは、金融、地質学、気象学、製造からコンピューティング、IoT、物理科学、社会科学に至るまで、あらゆる分野で応用されています。気象変化、出生率、死亡率、市場変動、ネットワークパフォーマンス、その他多くのアプリケーションを追跡するために使用されます。主な使用例には、監視、予測、異常検出などがあります。たとえば、時系列予測はデータベース管理システムの人気を決定する上で重要な役割を果たします。以下の図は、長年 (2019 年から 2021 年) にわたる DBMS の人気の高まりを時系列プロットで示しています。

https://www.influxdata.com/time-series-database/

時系列の主要な構成要素

時系列の観測値に影響を与える要因は、その主要な構成要素として扱われます。コンポーネントの 3 つのカテゴリには次のものがあります。

  1. トレンドまたは長期的な動き
  2. 短期的な動き
    1. 季節変動
    2. 周期的変動
  3. ランダムまたは不規則な動き

傾向

長期間にわたってデータが増加または減少する傾向は、トレンドまたは長期コンポーネントと呼ばれます。ただし、上向きまたは下向きの動きは、特定の期間にわたって必ずしも同じ方向である必要はないことに注意することが重要です。

傾向は、時間のさまざまな部分にわたって上昇、下降、または安定したままになる可能性があります。ただし、全体的な傾向は常に上昇、下降、または安定したパターンに一致する必要があります。このような移動傾向は、農業の生産性、死亡率、製造されたデバイス、工場の数などの例で明らかです。

線形および非線形トレンド

時系列値を時間に対してグラフ上にプロットすると、データ クラスタリングのパターンに基づいて傾向の種類が明らかになります。データ クラスターがほぼ直線の周囲にある場合、その傾向は線形傾向と呼ばれます。それ以外の場合、2 つの変数間の変化の比率が安定または一定ではないため、データ クラスター パターンは非線形傾向を示します。したがって、このような傾向は曲線相関とも呼ばれます。

短期的な動き

時系列では、これらのコンポーネントは一定期間にわたって繰り返される傾向があります。それらは不規則な短いバーストを持ち、研究中の変数に影響を与えます。短期的な動きの 2 つのカテゴリ タイプは次のとおりです。

季節の変化

これらのバージョンは、1 年未満の期間にわたって定期的に動作します。 12 か月間で同様またはほぼ同じパターンになる傾向があります。データが定期的に、つまり、毎時、毎日、毎週、毎月、または四半期ごとに記録される場合、このような変動は時系列の一部になります。

季節変動は人為的または自然発生的です。このような変化には、季節や気候条件の違いが重要な役割を果たします。たとえば、作物の生産は完全に季節に依存します。同様に、傘やレインコートの市場は梅雨に左右されますが、クーラーやエアコンの販売は夏の季節にピークを迎えます。

人工的な慣習には、祭り、パーティー、結婚式などの行事が含まれます。このような短期的な出来事は毎年繰り返されます。

周期的変動

1 年以上の期間にわたって発生する傾向のある時系列変動は、周期的変動と呼ばれます。企業にとって、一周期を「景気循環」といいます。業績の急上昇または下降は、経済構造、企業経営、その他の相互作用要因などのさまざまな要因に依存します。これらの周期的なビジネス変動は定期的である場合もありますが、周期的ではありません。一般に企業は、繁栄、不況、不況、復活という4段階の循環プロセスを経ます。

ビジネス開発は生成された「連続データ ポイント」に大きく依存するため、このような周期的な変動は時系列パターンに不可欠です。

ランダムまたは不規則な動き

ランダム成分は、観察中の変数に大きな変動を引き起こします。これらは、決まったパターンのない、純粋に不規則な変動です。地震、洪水、飢餓、その他の災害など、その力は予見できず、予測不可能で、性質が不安定です。

上で説明したランダム イベントは、ソース時系列データを使用して分析され、将来発生する可能性のある現実のシナリオに適切に対処します。

時系列の種類

時系列データは、決定的、非決定的、定常、非定常の 4 つのタイプに分類できます。それぞれのタイプについて詳しく見ていきましょう。

#1.決定論的時系列

決定論的な時系列は、分析式を使用して説明できます。ランダムまたは確率的な側面は含まれません。数学的には、テイラー級数展開の観点からすべての時間間隔を正確に表現できます。これは、任意の時点でその導関数がすべてわかっている場合に可能です。これらの派生語は、その時点での過去と未来を明示的に指定します。すべての条件が満たされていれば、将来の動作を正確に予測し、過去にどのように動作したかを分析することができます。

#2.非決定的な時系列

非決定的な時系列にはランダムな側面が関連付けられており、そのため明示的な記述が妨げられます。したがって、分析式は、そのような時系列を表現するのに十分なソリューションではありません。次の理由により、時系列は非決定的になる可能性があります。

  1. それを説明するために必要な情報は完全には入手できません。データは原理的に存在する可能性がありますが、明示的に定量化できるものとして扱うことはできません。
  2. データ生成プロセスは本質的にランダムです。

ランダムな要因により、非決定的な時系列は確率的な法則に従います。したがって、データは統計用語で扱われます。これは、データがさまざまな形の確率分布と平均によって定義されることを意味します。これには、分散の手段と尺度、つまり分散が含まれます。

#3.定常時系列

定常時系列では、平均、分散などの統計的特性は時間の側面に依存しません。定常時系列は、その統計的特性が過去に観察されたものと同じままであると確信を持って言えるため、予測が容易です。したがって、さまざまな統計的予測方法は、時系列はほぼ定常であるという議論に基づいています。これは、単純な数学的変換を適用することで時系列が近似的に定常であると見なせることを意味します。

#4.非定常時系列

非定常系列では、統計的特性は時間とともに変化します。したがって、傾向や季節性がさまざまな時間間隔で時系列の値に影響を与える可能性があるため、傾向または季節性のある時系列は非定常のカテゴリに分類されます。非定常時系列は予測不可能なデータを記述するため、モデル化や予測ができなくなります。

https://www.oreilly.com/library/view/hands-on-machine-learning/9781788992282/15c9cc40-bea2-4b75-902f-2e9739fec4ae.xhtml

時系列分析と予測

時系列分析と予測は、さまざまな種類の重要なプロセスやオブジェクトの進化とダイナミクスを観察、分析、研究するための便利なツールです。それぞれをさらに詳しく見てみましょう。

時系列分析

時系列分析は、一定期間にわたって収集されたデータを分析するプロセスとして定義されます。ここでは、データ アナリストが一定の期間にわたって一定の間隔でデータを記録します。データ観測レート、つまり時間間隔は、数秒から数年まで変化します。

時系列データは、特定の期間にわたる変動パターンの詳細な分析を提供するため、検査対象の変数を記述します。分析に必要なパラメータは、ドメインや分野によって異なる場合があります。例としては次のようなものがあります。

  • 科学機器 – 1 日あたりに記録されるデータ
  • 商用 Web サイト – 1 日あたりの顧客の訪問数
  • 株式市場 – 週ごとの株価
  • 季節 – 年間雨の日

一貫性と信頼性を確保するために、時系列分析は大量のデータ ポイントに対して実行されます。適切なサンプル サイズは、発見された傾向やパターンの信頼性を微妙に表現します。

さらに、時系列分析は、過去の記録データに基づいて将来のイベントを予測するのにも適しています。

時系列予測

時系列分析により、組織は時間の経過に伴う傾向の変動の根本原因を特定できます。データを入手すれば、企業はさらに研究を進め、未知の傾向に対処し、今後のイベントを予測する方法をよりよく理解できるようになります。企業は通常、データのこのような異常を判断するためにデータ視覚化技術を採用しています。

時系列予測は、次の 2 つの重要な要素を中心に展開します。

  1. 過去のデータの動作に基づいて将来の出来事を予測します。
  2. 今後の傾向は過去のデータ パターンと類似していると仮定します。

予測の主な目的は、基本的に、データ ポイントが将来的にどのように変化し続けるかを予測することです。時系列分析と予測のニュアンスをより深く理解するために、さまざまな業界セクターの例をいくつか紹介します。

  • 株式市場 – 毎日の株価終値を予測します。
  • 売上 – 毎日の店舗の製品売上を予測します。
  • 価格設定 – 毎日の平均燃料価格を予測します。

時系列予測に使用される一般的な統計手法には、単純移動平均 (SMA)、指数平滑法 (SES)、自己回帰統合移動平均 (ARIMA)、ニューラル ネットワーク (NN) などがあります。

クラウド内の時系列データ

時系列データの価値を明らかにするには、企業はデータを迅速に保存してクエリできる必要があります。資本市場企業は、リアルタイムのデータ分析を採用し、影響力のあるビジネス上の意思決定を行うために、大量の履歴データとストリーミング データに依存しています。これには、株価の脆弱性の予測、純資本要件の決定、または為替レートの予測が含まれる場合があります。柔軟性を提供し、データをシームレスに処理するために、多くの企業は時系列データベースのクラウドへの移行を選択しています。

時系列データベースをクラウドに移行すると、組織はオンデマンドで無制限のリソースにアクセスできるようになります。これにより、企業は数百のコアを利用して、遅延の問題を発生させることなくネットワーク スループットを最大化するタスクを達成できます。

クラウド インフラストラクチャの時系列データベースは、コンピューティング集中型のワークロードに適しています。これには、リアルタイムの市場動向に応じてリスク計算を実行することが含まれます。金融会社はデータセンターのオーバーヘッドを排除し、リソースの活用に重点を置いてワークロードの生産性を向上させることができます。

AWS などのクラウド ベンダーは、時系列データセットの読み込み、保存、分析を容易にする時系列データベース サービスである Amazon Timestream を提供しています。これらは、トランザクション集中型のワークロードを管理するためのストレージ、リアルタイム分析ツール、およびイベントの発生時に機能するデータ ストリーミング機能を提供します。

したがって、クラウド インフラストラクチャは、時系列データの利点を増幅および拡張します。

時系列の応用

時系列モデルは 2 つの目的に役立ちます。

  1. 特定のパターンのデータを生成した根本的な要因を理解します。
  2. 分析に基づいて、予測および監視するモデルを適合させます。

時系列データのアプリケーションの使用例をいくつか見てみましょう。

#1.財務およびビジネス領域の時系列

すべての財務、ビジネス、投資に関する意思決定は、現在の市場動向と需要予測に基づいて行われます。時系列データは、動的な金融市場を説明、相関付け、予測するために使用されます。金融専門家は財務データを調査して、リスクの軽減、価格設定と取引の安定化に役立つアプリケーションの予測を行うことができます。

時系列分析は財務分析において重要な役割を果たします。金利の予測、株式市場のボラティリティの予測などに使用されます。ビジネスの利害関係者や政策立案者は、製造、購入、リソースの割り当てについて情報に基づいた意思決定を行い、事業運営を最適化できます。

この分析は、投資分野で証券金利とその時間の経過に伴う変動を監視するために効果的に使用されます。証券価格は、短期 (つまり、1 時間または 1 日あたりの記録データ) または長期 (つまり、数か月または数年にわたる観察) で観察することもできます。時系列分析は、長期間にわたる証券、資産、または経済変数のパフォーマンスを追跡するのに便利なツールです。

#2.医療領域の時系列

ヘルスケアはデータ駆動型の分野として急速に台頭しています。財務分析やビジネス分析に加えて、医療分野でも時系列分析が大いに活用されています。

がん患者の治療中に、時系列データ、医学的に調整された手順、データ マイニング技術の相乗効果が必要なシナリオを考えてみましょう。このようなハイブリッドフレームワークは、収集された時系列データ(つまり、患者のX線画像)からの特徴抽出機能を利用して、医療団体が提供する治療に対する患者の進行状況と反応を追跡するために使用できます。

ヘルスケア分野では、絶えず変化する時系列データから推論を導き出すことが非常に重要です。さらに、高度な医療行為では、患者の健康状態をより良く可視化するために、患者の記録を長期にわたって接続することが求められています。また、患者の健康状態をより明確に把握するには、患者の健康パラメータを定期的に正確に記録する必要があります。

高度な医療機器の登場に伴い、時系列分析はヘルスケア領域での地位を確立しました。以下の例を考えてみましょう。

  • ECG デバイス: 心臓の電気パルスを記録することによって心臓の状態を監視するために発明されたデバイス。
  • EEG デバイス: 脳内の電気活動を定量化するために使用されるデバイス。

このようなデバイスにより、医療従事者は時系列分析を実行して、より迅速で効果的かつ正確な医療診断を行うことができるようになりました。

さらに、ウェアラブル センサーやポータブル ヘルスケア デバイスなどの IoT デバイスの出現により、人々は最小限の入力で長期にわたって自分の健康変数を定期的に測定できるようになりました。これにより、病気の人と健康な人の両方について、時間依存の医療データの一貫したデータ収集が可能になります。

#3.天文学における時系列

天文学と天体物理学は、時系列データが大きく活用されている 2 つの現代の学問です。

基本的に、天文学には、地球の大気を超えた宇宙をより深く理解するために、宇宙物体の軌道と天体のプロットと正確な測定の実行が含まれます。この要件により、天文学の専門家は、複雑な機器の校正と構成、および関心のある天体の研究をしながら、時系列データの処理に熟練しています。

時系列データは長い間天文学の分野と関連付けられてきました。紀元前 800 年に、黒点の時系列データが一定の間隔で収集されました。それ以来、時系列分析は次の目的で使用されるようになりました。

  • 恒星間距離に基づいて遠くの星を発見し、
  • 超新星などの宇宙現象を観察して、宇宙の起源をより深く理解しましょう。

この場合の時系列データは、星、天体、または物体が発する光の波長と強度に関連します。天文学者は、このようなライブ ストリーミング データを常に監視して、宇宙の出来事を発生時にリアルタイムで検出します。

最近では、データマイニング、機械学習、計算知能、統計などのさまざまな分野を融合した、宇宙情報学や宇宙統計学などの研究分野が出現しています。これらの新しい研究分野における時系列データの役割は、天体を迅速かつ効率的に検出して分類することです。

#4.天気予報の時系列

アリストテレスは、古代の気象変化で観察された原因と影響をよりよく理解するために、気象パターンを広範囲に研究しました。日が経つにつれて、科学者たちは大気の変数を計算するための「気圧計」などの機器に気象関連データを記録し始めました。データは定期的に収集され、さまざまな場所に保管されました。

時間が経つにつれ、やがて天気予報が新聞で取り上げられるようになりました。今日に遡ると、正確な気象変数を収集するために、ユビキタスな気象予測ステーションが世界中のさまざまな地域に設置されています。

このような観測所には、さまざまな場所から気象データを収集して関連付けるために相互接続された高度な機能デバイスが備えられています。相関データは、要件に応じてあらゆる時点での気象状況を予測するために使用されます。

#5.事業開発における時系列

時系列データにより、企業はビジネス上の意思決定を行うことができます。これは、プロセスが過去のデータを分析して将来の出来事を導き出し、起こり得る可能性を明らかにすることで実現されます。過去のデータ パターンは、次のパラメータを導出するために使用されます。

  • ビジネスの成長 : 全体的な財務およびビジネスのパフォーマンスを評価し、成長を測定するには、時系列データが最も適切で信頼できる資産です。
  • 傾向の推定 : さまざまな時系列手法を使用して、新たな傾向を推定できます。たとえば、これらの方法は、特定の電子デバイスの売上の増減を反映するために、一定期間にわたるデータ観察を分析することを考えてみましょう。
  • 季節パターンを明らかにする : 記録されたデータ ポイントにより、データ予測に役立つ変動や季節パターンが明らかになります。季節ごとに製品価格が変動する市場では、取得したデータ情報が重要な役割を果たします。このようなデータは、企業がより適切な製品計画と開発を行うのに役立つ可能性があります。

結論👨‍🏫

要約すると、時系列データは、一定期間にわたって収集された複雑なデータ ポイントの特性として見ることができます。時系列分析、モデリング、予測は、IoT ガジェット、スマート家電、ポータブル デバイスの出現により、私たちの日常生活に不可欠な部分になりました。さらに、時系列データは、医療、天体物理学、経済学、工学、ビジネスなど、さまざまな分野で応用されています。

「時系列データの入門ガイド」についてわかりやすく解説!絶対に観るべきベスト2動画

Pythonで時系列分析してみよう#1〜時系列データの基本〜
Pandas入門講座|13.Pandasで時系列データを扱う方法【PythonのライブラリPandas】