参赛任务:
目标:针对中国各个市区的不同年份二氧化碳排放量,预测未来年份的二氧化碳排放量。
不同与之前我学习过的波士顿房价预测机器学习-波士顿房价预测-CSDN博客
房价预测是通过学习与房价有关的很多特征,训练出一个模型来预测。而这次的任务是根据时序来预测。
数据集like this:
我们考虑了两种时间序列预测模型:
·LSTM: 是一种循环神经网络(RNN)的变体,具有记忆单元和门控机制。它使用记忆单元来捕捉长期的依赖关系,并通过门控机制选择性地遗忘或更新记忆。因为可以选择性忘记一些特征,过滤掉不需要的参数,这一点优化改进了循环神经网络(RNN)的缺点:因为记录所有时序输入,越近的输入对输出结果影响越大,离得远的被稀释,记得太多了可能反而就不准确了。
·ARIMA:是一种统计模型,用于描述时间序列数据中的自回归和移动平均成分。它包含三个部分:自回归(AR)部分、差分(I)部分和移动平均(MA)部分,用于建模数据的长期依赖、趋势和季节性。
我们最终选择了ARIMA,考虑到以下几点
1.co2的产生应该是有季节性的,且长期依赖性没有很大
2.我们的数据集收集的比较少。LSTM在训练时需要大量的数据,对于ARIMA,相对较少的历史数据样本也能提供可行的建模和预测结果,它不需要大量的样本数据来构建模型。
3.数据类型:
LSTM可用于处理各种类型的数据,包括单变量时间序列和多变量时间序列。
ARIMA针对单变量时间序列数据进行建模和预测,不能直接处理多变量数据。
我们的数据是单变量时间序列。
我们同时尝试了两种方法,ARIMA的预测拟合效果更好。