时间是数据积累的重要变量。在时间序列分析中,时间是数据的重要元素。

什么是时间序列数据?
时间序列数据是指按时间顺序排列的一系列数据点。这引入了观察集之间的顺序依赖性。在当今数据驱动的世界中,时间序列无处不在。因为所有事件都按照时间箭头进行,所以我们不断地与各种时间序列数据进行交互。
时间序列通常假设以规则的时间间隔生成,称为周期性时间序列。然而,该时间序列内的数据不必定期生成。此类示例包括不规则时间序列,其中数据遵循时间上的渐进序列。这意味着可能不会定期进行测量。然而,数据可以以离散的时间间隔或突发的方式生成。 ATM 取款和帐户存款是不规则时间序列的示例。
从技术上讲,时间序列涉及一个或多个在特定时间段内变化的变量。当单个变量随时间变化时,称为单变量时间序列。例如,考虑每秒测量房间温度的传感器。这里,每个瞬间(即秒)仅生成一维温度值。相反,如果多个变量随时间变化,则称为多元时间序列。例如,考虑银行的经济学。在这种情况下,多变量时间序列用于了解一个变量(例如回购利率)的政策变化如何影响其他变量(例如商业银行的贷款支付)。
时间序列数据的应用范围广泛,从金融、地质、气象、制造到计算、物联网以及物理和社会科学。用于跟踪天气变化、出生率、死亡率、市场波动、网络性能和许多其他应用。关键用例包括监控、预测和异常检测。例如,时间序列预测在确定数据库管理系统的受欢迎程度方面发挥着重要作用。下图以时间序列图显示了 DBMS 多年来(2019 年至 2021 年)受欢迎程度的增长情况。

时间序列的主要组成部分
影响时间序列观测值的因素被视为其主要组成部分。这三类组件是:
- 趋势或长期变动
- 短期走势
- 季节变化
- 周期性波动
- 随机或不规则的运动
趋势
数据在很长一段时间内增加或减少的趋势称为趋势或长期成分。然而,重要的是要注意,在特定时间段内向上或向下运动不一定必须处于同一方向。
趋势在不同时间段可能上升、下降或保持稳定。然而,总体趋势应始终符合向上、向下或稳定的模式。这种移民趋势在农业生产力、死亡率、制造设备和工厂数量等例子中很明显。
线性和非线性趋势
在图表上绘制时间序列值与时间的关系可以揭示基于数据聚类模式的趋势类型。当数据簇大致位于一条直线周围时,该趋势称为线性趋势。否则,由于两个变量之间的变化比率不稳定或恒定,数据聚类模式呈现非线性趋势。因此,这种趋势也称为曲线相关性。
短期走势
在时间序列中,这些组成部分往往会在一段时间内重复出现。它们具有不规则的短爆发并影响所研究的变量。短期走势的两类类型是:
季节变化
这些版本的正常运行时间不到一年。他们往往在 12 个月内遵循相似或几乎相同的模式。如果定期(即每小时、每天、每周、每月或每季度)记录数据,则此类波动将成为时间序列的一部分。
季节变化可以是人为的,也可以是自然发生的。季节和气候条件的差异在这些变化中发挥着重要作用。例如,农作物生产完全是季节性的。同样,雨伞和雨衣的市场取决于雨季,而冷却器和空调的销售在夏季达到高峰。
人造习俗包括节日、聚会和婚礼等活动。这些短期事件每年都会重复。
周期性波动
往往发生在一年或更长时间内的时间序列波动称为周期性波动。对于企业来说,一个周期称为一个经济周期。业绩的突然上升或下降取决于经济结构、公司管理等多种因素的相互作用。这些周期性的业务波动可能是周期性的,但并不是周期性的。一般来说,企业会经历四个阶段的循环过程:繁荣、衰退、衰退和复兴。
这种周期性波动对于时间序列模式至关重要,因为业务发展很大程度上依赖于生成的“连续数据点”。
随机或不规则的运动
随机成分会导致观察到的变量发生较大变化。这些纯粹是随机波动,没有固定模式。其力量是不可预知的、不可预测的、不稳定的,如地震、洪水、饥荒等灾害。
使用源时间序列数据分析上述随机事件,以更好地解决未来可能发生的现实场景。
时间序列类型
时间序列数据可以分为四种类型:确定性、非确定性、平稳和非平稳。让我们仔细看看每种类型。
#1.确定性时间序列
确定性时间序列可以使用解析公式来描述。它不包括任何随机或随机方面。从数学上讲,所有时间间隔都可以用泰勒级数展开式精确表达。如果在任何给定时间已知其所有导数,则这是可能的。这些导数明确指定了该时间点的过去和未来。如果满足所有条件,就可以准确预测未来的行为并分析其过去的行为。
#2.非确定性时间序列
非确定性时间序列具有与之相关的随机方面,这妨碍了明确的描述。因此,解析表达式不足以表示此类时间序列。由于以下原因,时间序列可能是不确定的:
- 解释它所需的信息并不完全可用。数据原则上可能存在,但不能被视为明确可量化的。
- 数据生成过程本质上是随机的。
由于随机因素的影响,非确定性时间序列遵循随机规律。因此,数据以统计术语处理。这意味着数据是由各种形式的概率分布和均值定义的。这包括分散或方差的方法和测量。
#3.平稳时间序列
在平稳时间序列中,均值、方差等统计属性不依赖于时间方面。平稳时间序列很容易预测,因为您可以自信地说它们的统计特性将与过去观察到的相同。因此,各种统计预测方法都基于时间序列近似平稳的论点。这意味着通过应用简单的数学变换可以将时间序列视为近似平稳。
#4.非定常时间序列
在非平稳序列中,统计属性随时间变化。因此,具有趋势或季节性的时间序列属于非平稳类别,因为趋势或季节性会影响时间序列在不同时间间隔的值。瞬态时间序列描述的是不可预测的数据,因此无法建模或预测。

时间序列分析与预测
时间序列分析和预测是观察、分析和研究各类重要过程和对象的演化和动态的有用工具。让我们更详细地看看每一个。
时间序列分析
时间序列分析被定义为分析一段时间内收集的数据的过程。在这里,数据分析师在一段时间内定期记录数据。数据观察率或时间间隔从几秒到几年不等。
时间序列数据描述了感兴趣的变量,因为它提供了特定时间段内变化模式的详细分析。分析所需的参数可能因领域或领域而异。示例包括:
- 科学仪器——每天记录的数据
- 商业网站——每天的客户访问量
- 股票市场 – 每周股票价格
- 季节 – 一年中的雨天
为了确保一致性和可靠性,对大量数据点进行时间序列分析。足够的样本量可以细致地体现所发现的趋势和模式的可靠性。
此外,时间序列分析还适用于根据过去记录的数据预测未来事件。
时间序列预测
时间序列分析使组织能够识别趋势随时间波动的根本原因。有了数据,公司就可以进行进一步的研究,以更好地了解如何应对未知趋势并预测未来事件。公司通常采用数据可视化技术来确定数据中的此类异常情况。
时间序列预测围绕两个关键要素:
- 根据过去的数据行为预测未来事件。
- 假设未来趋势与历史数据模式类似。
预测的主要目的本质上是预测数据点在未来将如何继续变化。为了更好地理解时间序列分析和预测的细微差别,我们将介绍一些来自不同行业的示例。
- 股票市场 – 预测每日股票收盘价。
- 销售 – 预测每日商店产品销售量。
- 定价 – 预测平均每日燃油价格。
用于时间序列预测的常见统计技术包括简单移动平均 (SMA)、指数平滑 (SES)、自回归积分移动平均 (ARIMA) 和神经网络 (NN)。
云端时间序列数据
为了释放时间序列数据的价值,企业需要能够快速存储和查询数据。资本市场公司采用实时数据分析,并依靠大量历史数据和流数据来做出有影响力的业务决策。这可能包括预测股价漏洞、确定净资本要求或预测汇率。为了提供灵活性并无缝处理数据,许多公司选择将时间序列数据库迁移到云端。
将时间序列数据库迁移到云端使组织可以按需访问无限的资源。这使得企业能够利用数百个核心来完成最大化网络吞吐量的任务,而不会出现延迟问题。
云基础设施中的时间序列数据库适合计算密集型工作负载。这包括根据实时市场趋势进行风险计算。金融公司可以消除数据中心开销并专注于资源利用率以提高工作负载生产力。
AWS 等云供应商提供Amazon Timestream,这是一种时间序列数据库服务,可以轻松加载、存储和分析时间序列数据集。它们提供用于管理事务密集型工作负载的存储、实时分析工具以及在事件发生时充当数据流功能。
因此,云基础设施放大并扩展了时间序列数据的优势。
时间序列的应用
时间序列模型有两个目的。
- 了解生成特定数据模式的根本因素。
- 根据您的分析,调整预测和监控模型。
让我们看一下时间序列数据的一些应用程序用例。
#1. 金融和商业领域的时间序列
所有财务、业务和投资决策均基于当前市场趋势和需求预测。时间序列数据用于解释、关联和预测动态金融市场。金融专业人士可以检查金融数据,对有助于降低风险并稳定定价和交易的应用程序进行预测。
时间序列分析在财务分析中占有重要地位。它用于预测利率、预测股市波动等。业务利益相关者和政策制定者可以就制造、采购和资源分配做出明智的决策,以优化业务运营。
该分析有效地应用于投资领域,以监控证券利率及其随时间的波动。证券价格也可以短期观察(即每小时或每天记录的数据)或长期观察(即数月或数年观察)。时间序列分析是跟踪证券、资产或经济变量长期表现的有用工具。
#2. 医疗领域时间序列
医疗保健正在迅速成为一个数据驱动的领域。除了财务和商业分析之外,时间序列分析也大量应用于医疗领域。
考虑这样一个场景:在癌症患者的治疗过程中需要时间序列数据、医学定制程序和数据挖掘技术的协同作用。这种混合框架利用从收集的时间序列数据(即患者 X 射线图像)中提取特征的功能来跟踪患者的进展和对医疗组织提供的治疗的反应。
在医疗保健领域,从不断变化的时间序列数据中得出推论至关重要。此外,先进的医疗实践需要患者记录的长期连接,以便更好地了解患者的健康状况。另外,为了更清楚地了解患者的健康状况,需要定期准确记录患者的健康参数。
随着先进医疗设备的出现,时间序列分析已在医疗保健领域站稳了脚跟。考虑以下示例。
- 心电图设备:发明的一种通过记录心脏电脉冲来监测心脏状况的设备。
- 脑电图设备:用于量化大脑电活动的设备。
此类设备使医疗专业人员能够执行时间序列分析,以做出更快、更有效、更准确的医疗诊断。
此外,可穿戴传感器和便携式医疗设备等物联网设备的出现使人们能够以最少的输入定期测量自己的健康变量。这使得能够对病人和健康人的随时间变化的医疗数据进行一致的数据收集。
#3.天文学中的时间序列
天文学和天体物理学是两个严重依赖时间序列数据的现代学科。
从本质上讲,天文学涉及绘制空间物体的轨道和天体,并进行精确测量,以更好地了解地球大气层以外的宇宙。这一要求使得天文学家能够熟练地处理时间序列数据,同时校准和配置复杂的仪器以及研究感兴趣的天体。
时间序列数据长期以来一直与天文学领域联系在一起。公元前 800 年,太阳黑子时间序列数据被定期收集。从那时起,时间序列分析已用于:
- 根据星际距离发现遥远的恒星,
- 观察超新星等宇宙现象,以更好地了解宇宙的起源。
在这种情况下,时间序列数据与恒星、天体或物体发出的光的波长和强度有关。天文学家不断监控此类实时流数据,以实时检测发生的宇宙事件。
近年来,出现了空间信息学和空间统计等研究领域,它们结合了数据挖掘、机器学习、计算智能和统计学等各个领域。时间序列数据在这些新研究领域的作用是快速有效地检测和分类天体。
#4.天气预报时间序列
亚里士多德广泛研究了天气模式,以更好地了解古代天气变化中观察到的原因和影响。随着时间的推移,科学家开始在“气压计”等仪器上记录与天气相关的数据,以计算大气变量。定期收集数据并存储在不同地点。
随着时间的推移,天气预报最终开始出现在报纸上。快进到今天,世界各地已经安装了无处不在的天气预报站,以收集准确的天气变量。
这些站配备了功能强大的设备,这些设备相互连接以收集和关联来自不同地点的天气数据。相关数据用于根据您的要求预测任何时间点的天气状况。
#5.业务发展的时间序列
时间序列数据使公司能够做出业务决策。这是通过分析过去的数据以得出未来事件并发现可能的结果的过程来完成的。历史数据模式用于得出以下参数:
- 业务增长:为了评估整体财务和业务绩效并衡量增长,时间序列数据是最相关和最可靠的资产。
- 估计趋势:可以使用各种时间序列技术来估计新兴趋势。例如,考虑这些方法分析一段时间内的数据观察结果以反映特定电子设备销量的增加或减少。
- 发现季节性模式:记录的数据点揭示波动和季节性模式,有助于数据预测。在产品价格季节性波动的市场中,获取的数据信息发挥着重要作用。这些数据可以帮助企业更好地进行产品规划和开发。
结论👨🏫
总之,时间序列数据可以被视为在一段时间内收集的复杂数据点的属性。随着物联网设备、智能家电和便携式设备的出现,时间序列分析、建模和预测已成为我们日常生活中不可或缺的一部分。此外,时间序列数据在医学、天体物理学、经济学、工程和商业等多个领域都有应用。




![2021 年如何设置 Raspberry Pi Web 服务器 [指南]](https://i0.wp.com/pcmanabu.com/wp-content/uploads/2019/10/web-server-02-309x198.png?w=1200&resize=1200,0&ssl=1)

