基于BP神经网络非线性组合的SARIMA-GRU犯罪预测模型

翟圣昌,韩晓红,王 莉,吴永飞,王俊严

(太原理工大学 大数据学院,山西 晋中 030600)

摘 要:针对当前犯罪预测模型无法捕捉到犯罪时序数据的复合特征且无法及时反应环境变化等问题,提出基于BP神经网络非线性组合的SARIMA-GRU犯罪预测模型。该模型将SARIMA和GRU对犯罪数量的预测结果通过BP网络实现非线性组合,采用反向传播算法进行权重学习,将各层神经元所确定的权重矩阵作为两种方法在组合预测中的比重,综合利用SARIMA模型在线性时序预测中的优势和GRU网络在非线性特征挖掘上的优势,从而获得更好的预测结果。通过温哥华和旧金山的真实犯罪数据对组合后的模型与其他模型进行对比实验,结果表明,基于BP神经网络非线性组合的SARIMA-GRU模型可以捕捉到犯罪时序数据的复合特征,与其他模型相比具有更高的准确率。

关键词:犯罪预测模型;BP神经网络;GRU;SARIMA模型;组合预测

随着社会经济不断发展,智能化被应用于越来越多的领域中,各类软硬件设施在方便人们生活的同时也带来一些负面影响,导致各种新形式的违法犯罪活动层出不穷。据相关统计数据显示,近年来中国各大城市的刑事和暴力案件数量在逐渐下降,而“互联网+传统犯罪”的新型犯罪案件却屡禁不止。例如盗窃汽车及车内财物、入室盗窃以及电信诈骗等“盗抢骗”案件呈高发态势,并出现了新的特点[1],其主要原因是犯罪分子的作案手段已从传统的、静止的、个体的形式逐渐转变为智能化、动态化、有组织的犯罪形式,此类“与时俱进”的犯罪形式追赃难度大、破案率较低,严重影响着人民群众的安全感和幸福感。在信息化时代催生的新型警务模式中,基于大数据技术的犯罪预测模型是重点研究的方向,模型可以帮助公安机关科学合理地使用历史数据,深入剖析犯罪事件的时空分布规律与变化趋势,对未来可能发生的犯罪事件做出准确预测,进而为公安机关制定具体的防控策略提供决策支持,最大限度地将违法犯罪活动扼杀在摇篮里,对社会的长治久安具有重要意义。

国内外学者对于犯罪预测模型的研究已经取得了明显成效,屈茂辉等[2]使用经典的时间序列分析法,研究了1986-2010年间我国财产类犯罪的变化情况,最终得到ARMA(1,10)模型对我国财产类犯罪的定量预测具有很大的借鉴作用;侯苗苗等[3]使用SARIMA时间序列预测模型,对中国北方某大型城市的抢劫、抢夺及一般伤害犯罪进行了周期检测和趋势预测;WANG et al[4]将支持向量机(support vector machine,SVM)引入犯罪预测领域,综合运用逻辑回归和SVM来预测有作案前科人员再犯罪的可能性。随着深度学习的发展,基于人工神经网络的模型受到了研究人员的广泛关注,其中循环神经网络(recurrent neural network,RNN)善于解决预测问题,RNN及其变体已被广泛应用于犯罪预测中。沈寒蕾等[5]利用LSTM网络的长短期记忆性,同时考虑犯罪事件的时间与空间相关因素,训练出精确度和稳健性兼备的WH市入室盗窃罪预测模型;SINGH[6]对基于神经网络和统计学方法搭建的犯罪预测模型进行了对比分析,通过阿姆斯特丹犯罪数据验证了门控循环单元(gated recurrent unit,GRU)在挖掘犯罪数据时空特征方面的优势。

尽管基于深度学习和时间序列分析法搭建的犯罪预测模型已取得较好效果,但由于造成犯罪的因素比较复杂,犯罪时序数据通常同时包含线性成分和非线性成分,这就导致使用单一模型无法捕捉到犯罪数据的复合特征且无法反映环境的动态变化,预测结果的准确率和稳定性方面还有待提升。针对以上问题,本文提出基于BP神经网络非线性组合的SARIMA-GRU犯罪预测模型,该模型将SARIMA和GRU对犯罪数量的预测结果通过BP网络实现非线性组合,采用反向传播算法进行权重学习,将各层神经元所确定的权重矩阵作为两种方法在组合模型中的比重,综合利用SARIMA在线性时序预测中的优势和GRU在非线性特征挖掘上的优势,从而获得更好的预测结果。

1 相关方法

1.1 门控循环单元

门控循环单元(GRU)是对LSTM网络的改进[7],同时也是简化版的LSTM.二者都是通过门限机制来控制历史数据的记忆和遗忘程度,时序数据在隐藏层各单元之间有选择性地通过,从而有效地处理时间间隔较长的时序数据,这种机制可以很好地解决传统RNN随着网络层数加深而出现的梯度爆炸等问题[8];二者不同之处在于GRU对LSTM的“门”进行了删减整合,将遗忘门、输入门和输出门改进为更新门和重置门。由于使用的门结构更少,因此GRU神经网络在保留LSTM计算效果的同时,具有参数更少、训练速度更快等优势。GRU的内部结构如图1所示。

图1 GRU的内部结构
Fig.1 Internal structure of GRU

其中,zt表示更新门;rt为重置门;ht-1表示前一时刻的隐藏单元值;xt表示当前时刻的输入数据;是上一隐藏层状态ht-1和当前输入xt复合运算后得到的候选状态。GRU网络的计算过程如式(1)-式(4)所示,其中σ表示sigmoid激活函数,Wz,WrWh分别表示各个门神经元的参数,即需要训练的权重参数;ht表示隐藏层的输出数据。

zt=σ(Wz·[ht-1,xt]) .

(1)

rt=σ(Wr·[ht-1,xt]) .

(2)

(3)

(4)

1.2 季节性差分自回归移动平均模型

季节性差分自回归移动平均模型(seasonal auto-regressive integrated moving average model,SARIMA)是对ARIMA模型的扩展和改进,通过引入3个季节性参数和1个周期参数,从而实现对趋势和周期性时序数据的预测。在周期内SARIMA模型会提取当前时刻数据与之前数据的关联性;在周期之间会提取当前时刻数据与前几个周期相同时刻数据的关联性[9],因此SARIMA模型对序列变化情况的拟合更准确,对于不平稳的数据也能通过平稳化处理进而达到预测要求。

SARIMA(p,d,q)(P,D,Q)S模型总共包含7个参数,其中pq分别表示自回归和移动平均的阶数;dD分别为趋势差分和季节差分的阶数;PQ分别为季节性自回归和季节性移动平均的阶数;S为季节周期数,该模型的具体表达如式(5)所示:

Φp(B)UP(BS)(1-B)d(1-BS)Dyt=θq(B)VQ(BS)εt.

(5)

其中,Φ(B)和θ(B)分别表示非季节性的p阶自回归多项式和q阶移动平均多项式;U(BS)和V(BS)分别为P阶季节性自回归多项式和Q阶季节性移动平均多项式;B为滞后算子,BS为季节滞后算子,(1-B)d表示经过d次逐期差分,(1-BS)D表示经过D次季节差分;yt为时间序列;εt为白噪声序列。构建SARIMA模型的过程就是确定上述参数的过程[10],传统建模方法包括序列平稳化、模型定阶、参数估计和模型检验等阶段[11]

1.3 组合预测理论

大量研究表明,单项模型在某些特定条件下具有好的预测效果,但面对复杂的环境变化时准确率可能会降低[12-13];同时针对同一预测问题往往可以采用多种模型进行求解。因此可以按照一定规则将多个模型进行组合,通过多角度分析数据,同时利用这些方法所提供的有效信息,从而提高模型的预测精度及稳定性,获得更好的预测效果[14]

组合预测可以分为线性组合与非线性组合两种。常见的线性组合方法有优势矩阵法、等权重法和最小二乘法等,此类方法都是寻找单项模型间的最优权重来实现组合预测[12];如果仅通过线性相加的方式来组合模型,则会削减组合预测的意义[15],因此需要引入非线性组合来增加全面性。常见的非线性组合预测方法有加权几何平均和人工神经网络,其中人工神经网络能够反映输入和输出数据之间高度的非线性映射关系。将k种方法得到的预测结果作为网络的输入,实际值yi作为输出,基于梯度下降算法对神经网络进行训练,最终各层神经元所确定的权重矩阵即为各种方法在组合模型中的权重[16]。国内学者已经验证,非线性组合预测的总体效果要优于线性组合预测,而且基于神经网络的非线性组合方法具有更高的预测精度[12]

2 模型搭建

2.1 数据来源和预处理

由于国内的犯罪数据具有保密性,因此本文选取数据公开且被广泛用于研究的温哥华市犯罪记录作为数据集(可从kaggle或温哥华市开放数据目录网站获取)。原始数据集中包含了2003年1月1日至2017年7月13日当地警察局接报的案发记录总共530 652条,其中主要字段表示的意义以及数据类型如表1所示。

表1 原始数据的字段及其数据类型
Table 1 Field and data types in data sets

数据项实际意义数据类型Type案件类型stringYear案发时间/年intMonth案发时间/月intDay案发时间/日intHundred block案发地所在街道stringNeighborhood案发地所属城区stringLatitude案发地纬度坐标floatLongitude案发地经度坐标float

在所有犯罪记录中,难免会夹杂一些不准确、不完整的数据,如果将这些低质量的数据也输入模型中,就会导致拟合速度变慢并影响预测结果的精度。因此需要对原始犯罪数据进行预处理,首先将案发记录中的离群值和无效数据进行剔除;然后对案件类型和时空信息都相同的记录进行去重;对案件时空信息不完整不精确的记录进行补全和修正,以保证模型的训练效果。

选择的研究区域越小,犯罪预测模型的应用价值就越高[17]。因此本文对研究区域进行了等面积的网格划分,考虑到温哥华城市面积仅为115 km2,取所有案发记录中经纬度的最值进行10 km×10 km的网格划分,得到每个网格的面积约为1 km2,这样不仅达到了社区级的预测精度,而且有利于后续防治工作的开展。按照从左到右、先上后下的顺序对网格进行编号,并根据每个案件的经纬度坐标将其映射到相应网格中,得到每个网格的犯罪频数时间序列。本文选取第65号网格作为研究区域,其具体位置及周围的网格编号如图2所示,网格划分也是进一步分析犯罪事件空间相关性的基础。在时间维度上,本文探索以天为单位的预测结果,考虑到2003年至2017年间城市常驻人口数量的变化以及新基建的出现,较长的时间跨度可能会影响预测结果的准确性,因此本文选取1 000 d连续数据进行实验;对原始数据中的年、月、日信息进行整合并重新排序,将没有案件发生的日期的案发次数补成0,确保输入模型的时间序列是以天为单位的连续数据。

图2 网格划分及区域编号图
Fig.2 Grid division and area numbering

由于不同类型的犯罪案件具有不同的时空分布规律与变化趋势,需要分开预测才能制定有针对性的防治策略,本文首先对入室盗窃、商场盗窃和车辆盗窃等盗窃类犯罪事件进行研究。为提高模型的预测效果,本文将影响犯罪发生的各种环境因素也纳入研究:根据温哥华下设10个区和5个镇的地理坐标建立“案发地所属行政区”字段与网格编号间的对应关系,并通过独热编码进行数字化处理;本文还收集了温哥华市的历史天气信息,并根据每日最高温度、平均温度以及相对湿度等数据计算当天的炎热指数[18]以提升特征的丰富度;同时统计所有周末以及西方传统节假日的信息,将这些假期及其前夕所对应的日期都标注为1,剩余工作日的日期标注为0.得到包含各种环境因素且格式完整统一的犯罪时序数据后,取75%作为训练集,剩余25%为测试集。本文所搭建的模型均通过上述预处理的数据进行训练,其中SARIMA和ARIMA模型只需用到日期以及相应的犯罪数量,而使用GRU和LSTM网络进行犯罪预测时则需要用到本数据集中的全部特征。

2.2 SARIMA模型的搭建

由于多种类型的犯罪案件都与季节因素存在一定程度的相关性[19],而且犯罪数量的变化存在明显的周期规律,因此可以通过SARIMA(p,d,q)(P,D,Q)S模型对犯罪数量进行预测。首先判断原始犯罪数据是否为平稳序列,ADF的检测结果如表2所示。

表2 原始数据ADF平稳性检验
Table 2 ADF test of the stability of data

项目t统计量p-value检验统计量-5.9310.000ADF检验1%-3.443-5%-2.867-10%-2.569-

由于t统计量在1%的显著性水平下拒绝原假设并且p-value小于0.05,因此当前犯罪数据是平稳序列,即差分阶数d取0;根据自相关检验可以确定当前犯罪数据的季节周期数为12,同理可得季节性差分阶数D也取0;然后依据ACF和PACF图像来确定参数pq的值,当前犯罪时序数据的自相关函数和偏自相关函数的图像如图3所示。从图中可以发现:平稳序列的ACF图像拖尾,PACF图在第2个时间点之后呈现截尾,由此可以确定p的值取2,q值取0.

图3 犯罪时序数据的ACF曲线和PACF曲线
Fig.3 ACF and PACF curve of crime time series data

参数PQ的值较难确定,但一般不会超过2,本文采用试凑法来确定模型的最优参数[11],通过BIC准则对参数PQ分别取0、1、2的9种备选模型进行网格搜索与性能评估,选取其中BIC值最小的SARIMA(2,0,0)(1,0,1)12模型可以避免自由度降低而损失过多的原始信息,得到最佳的犯罪预测结果。最后通过Ljung-Box统计量来检验SARIMA(2,0,0)(1,0,1)12模型的残差是否为白噪声序列。由于检测结果中所有的p-value值均大于0.05,说明残差是白噪声序列,即当前模型已充分提取犯罪时序数据中的有用信息,可以使用该模型进行预测。

2.3 GRU模型的搭建

为了更好地挖掘犯罪时序数据中的隐藏关联信息,本文基于GRU神经网络搭建犯罪预测模型,利用其长期记忆功能以及在非线性特征挖掘上的优势,在考虑犯罪事件时间相关性的同时,对犯罪数据内的空间相关特征、节假日和温度等因素进行充分挖掘与利用,实现对犯罪数量的准确预测。

通过网格划分不仅可以达到社区级的预测精度,而且便于研究相邻区域之间犯罪数量的关联性。本文重点关注目标网格周围8个网格的影响[5],如果相邻网格越界或不存在,则把关联区域的犯罪数量视为0.以grid65为例,与之相邻的网格为grid54、grid55、grid56、grid64、grid66、grid74、grid75、grid76,这8个网格的犯罪频数也将被输入GRU模型中以挖掘犯罪事件在空间维度上的关联性;此外grid65的炎热指数f、城区独热编码g和节假日信息h也将作为特征输入网络。因此每一天的数据将包含12项内容:目标与周围网格的犯罪数量、对应日期的炎热指数、节假日情况以及城区编号等,将grid65在第t天的犯罪数量记为k65,t,假设第t+1天的犯罪数量与之前b天相关,则GRU模型在预测时的输入数据为x,其公式如下所示。

GRU模型的隐藏层单元数(number of hidden layer cells,NC)、时间步长(look back)以及学习率(learning rate)等超参数通过粒子群优化算法(particle swarm optimization,PSO)确定[20]。本文搭建含两个隐藏层和一个全连接层的GRU模型,选用MAE作为损失函数,ReLU作为激活函数,通过Adam优化算法对每个候选的网络结构训练1 000次。在PSO算法寻找最优超参数的过程中,每次迭代产生的群体极值gBest所代表的最佳隐藏层单元数H1H2、时间步长(look back)以及学习率α随迭代次数的变化情况如图4所示。

图4 最优粒子中H1H2、look back和α的变化
Fig.4 Change ofH1,H2, look back, andαin optimal particle

从图4可以看出,两个隐藏层的神经元个数分别稳定在62和41;时间步长最终取值为7,即根据之前7 d的数据来预测未来一天的犯罪数量可以取得最好的效果;学习率α稳定在0.001 8.找到GRU网络的最优超参数组合后,通过该模型即可深入挖掘空间相关因素、节假日以及温度等环境因素对犯罪数量的影响。

2.4 基于BP网络组合的SARIMA-GRU模型

造成犯罪的因素比较复杂,犯罪时序数据通常同时包含线性成分和非线性成分,这就导致单独使用SARIMA和GRU都无法捕捉到犯罪数据的复合特征,因此需要从组合预测角度对现有模型进行改进,通过多个角度分析犯罪数据,综合利用这些方法提供的有效信息,得到更好的预测效果。

在非线性组合预测中,BP神经网络具有自适应能力强、训练速度快以及鲁棒性强等优良特性,在构造非线性预测函数方面已显示出很大的优势[21]。因此本文提出基于BP神经网络非线性组合的SARIMA-GRU犯罪预测模型,该模型将SARIMA和GRU对犯罪数量的预测结果通过BP网络进行非线性组合,采用反向传播算法进行权重学习,将各层神经元所确定的权重矩阵作为两种方法在组合预测中的比重,兼具SARIMA在线性时序预测中的优势和GRU在非线性特征挖掘的优势,从而获得更好的预测效果。

构建BP神经网络主要包括确定输入和输出向量、确定隐藏层结构和激活函数等步骤。本文中BP网络的输入数据为SARIMA和GRU模型对犯罪数量的预测结果,输出为犯罪数量的实际值,即输入和输出层的节点数分别为2和1.理论已经证明三层BP神经网络模型可实现任意复杂的非线性函数逼近问题,而且增加隐藏层的节点数可以提高误差精度[22]。因此本文构建含一个隐藏层的BP网络,即2-j-1的网络结构,其中j为隐藏层节点数;关于隐藏层节点数的确定目前还没有统一结论,但普遍认为增加隐藏层节点数可以提高模型的预测精度。本文将在实验部分具体分析当前犯罪数据对应的最佳j值。综上所述,搭建BP-SARIMA-GRU犯罪预测模型的具体步骤如下:

Step 1 对原始犯罪数据进行预处理。得到含各种环境因素且格式完整统一的犯罪时序数据后,取75%的数据为训练集,剩余25%为测试集,对模型进行拟合与评估。

Step 2 搭建SARIMA模型。首先对犯罪时序数据进行平稳化处理,然后进行模型定阶和参数估计等操作,找到性能最优的SARIMA(p,d,q)(P,D,Q)S犯罪预测模型。

Step 3 搭建GRU模型。通过智能优化算法搜索GRU的最佳隐藏层结构和其他超参数,同时基于梯度下降算法训练模型。

Step 4 搭建BP-SARIMA-GRU模型。通过上述分析可知,本实验拟搭建的BP神经网络结构为2-j-1,选用MAE作为损失函数,ReLU作为激活函数。模型的输入数据为SARIMA和GRU在训练集上的预测结果,输出为犯罪数量的真实值,采用Adam优化算法进行权重训练。

Step 5 评估BP-SARIMA-GRU模型。将SARIMA和GRU在测试集上的预测结果作为输入,得到BP-SARIMA-GRU模型对犯罪数量的预测值最后将与犯罪数量的真实值yi进行比较,从而判断模型的预测效果,流程如图5所示。

图5 BP-SARIMA-GRU犯罪预测模型的流程
Fig.5 Flow chart of BP-SARIMA-GRU model

2.5 评价指标

由于特定区域内的犯罪数量可能为零并很少出现极端值,因此本文选取平均绝对误差(MAE)和均方根误差(RMSE)作为模型的评估标准,其中MAE可以很好地反映预测误差的实际情况;RMSE在统计预测值与真实值之间偏差的同时可以保证量纲的一致性。相应公式如式(6)、(7)所示。

(6)

(7)

其中,yi表示第i个数据的实际值;为模型输出的预测值;n为样本数。

3 实验结果与分析

本文实验的硬件环境为Intel Core i5-9300HF(2.4 GHz)中央处理器,Nvidia Geforce GTX 1660Ti的显卡,8 GB的RAM;软件环境为Python3.6,模型训练基于Tensorflow背景下的Keras框架实现[23]

首先测试BP神经网络的最佳隐藏层节点数j.按照图5所示的流程,分别将BP网络的隐藏层节点数设为5、10和15搭建BP-SARIMA-GRU犯罪预测模型,输入和输出数据以及其他超参数均保持不变,不同模型的MAE和RMSE评估结果如表3所示。可以发现当j取10时,BP-SARIMA-GRU模型的预测精度最高;进而将隐藏层节点数设为8、9、11进行模型训练,训练完成后的模型在测试集上的预测结果如表4所示。分析可知当BP网络的隐藏层节点数j取9时,BP-SARIMA-GRU模型的预测效果最好。

表3 不同BP组合模型的实验结果1
Table 3 Experimental results of different BP combination models Ⅰ

模型MAERMSEBP-SARIMA-GRU(j=5)0.8131.116BP-SARIMA-GRU(j=10)0.7891.087BP-SARIMA-GRU(j=15)0.8311.130

表4 不同BP组合模型的实验结果2
Table 4 Experimental results of different BP combination models Ⅱ

模型MAERMSEBP-SARIMA-GRU(j=8)0.7931.092BP-SARIMA-GRU(j=9)0.7861.083BP-SARIMA-GRU(j=10)0.7891.087BP-SARIMA-GRU(j=11)0.7971.094

然后通过消融实验来验证组合模型的预测效果。分别采用最优BP-SARIMA-GRU模型、组合之前的单项GRU模型、单项SARIMA以及ARIMA模型对测试集数据进行犯罪预测,消融实验的结果如图6所示。其中横坐标表示2016年11月6日到2017年7月13日之间以天为单位的日期,纵坐标表示grid65区域每天的盗窃罪数量。

图6 组合模型与单项模型的犯罪预测结果
Fig.6 Prediction results of combined model and single models

从图6可以看出,ARIMA的预测结果几乎是一条单调直线,说明该模型的拟合效果较差;SARIMA模型在ARIMA的基础上引入季节因素,可以反映出盗窃罪数量在时间维度上的周期变化规律,但由于造成犯罪的因素众多,线性的SARIMA和ARIMA模型都无法学习到空间相关等其他特征的影响,无法准确预测未来的犯罪数量;GRU模型可以挖掘犯罪时序数据中的隐藏关联信息,在学习数据长期依赖性的同时还能挖掘到各种环境因素的影响,因此GRU的预测结果更为准确。但由于GRU模型在分析时序数据时无法突出线性成分的影响,对于尖峰点等极值的拟合效果还有待提升;BP-SARIMA-GRU模型结合了SARIMA在线性时序预测中的优势和GRU模型在非线性特征挖掘上的优势,可以捕捉到犯罪时序数据的复合特征,因此预测结果最接近真实值。不同模型的MAE与RMES评价结果如表5所示,可以发现BP-SARIMA-GRU模型的MAE和RMSE值均小于3个单项模型,即组合后的模型具有更高的预测精度。

表5 组合模型与单项模型的实验结果
Table 5 Experimental results of combined model and single models

模型MAERMSEARIMA1.4401.866SARIMA1.4271.845GRU1.0281.406BP-SARIMA-GRU0.7861.083

为进一步验证BP-SARIMA-GRU犯罪预测模型的性能,本文通过最近几年犯罪预测研究中具有代表性的模型进行对比实验。分别使用经典的LSTM模型[5]、LSTM-ARIMA组合模型[24]以及基于PSO算法改进的PSO-BP[25]模型对当前犯罪数据进行分析预测。不同模型的实验结果如表6所示,该结果进一步验证了BP-SARIMA-GRU犯罪预测模型的准确性和有效性。

表6 常用犯罪预测模型的性能对比
Table 6 Performance comparison of common crime prediction models

模型MAERMSELSTM1.0281.410PSO-BP0.9371.121LSTM-ARIMA0.8521.150BP-SARIMA-GRU0.7861.083

此外,本文对温哥华市其他区域的犯罪数量也进行了预测。不失一般性,选取图2中的边角网格grid9作为研究区域, 按照前文所述的步骤分别搭建SARIMA模型、含两个隐藏层的GRU网络以及BP-SARIMA-GRU组合模型进行犯罪预测,不同模型在测试集上的预测结果如图7所示。

图7 组合模型与单项模型的犯罪预测结果
Fig.7 Prediction results of combined model and single models

从图7中可以发现,即使在城市的偏远地段,犯罪数量较少的低风险区域,BP-SARIMA-GRU模型依然取得了很好的预测结果。不同犯罪预测模型的评估结果如表7所示,该结果验证了BP-SARIMA-GRU模型的有效性,组合后的模型兼具SARIMA和GRU模型的优点,能够捕捉到犯罪时序数据的复合特征,是一种综合考虑季节因素、时间相关性和空间相关性、节假日以及温度因素的犯罪预测模型,与其他模型相比具有更高的准确率与鲁棒性。

表7 不同犯罪预测模型的实验结果1
Table 7 Experimental results 1 of different crime prediction models

模型MAERMSEARIMA0.2140.446SARIMA0.2130.486LSTM0.1450.397GRU0.1450.395LSTM-ARIMA0.1380.393BP-SARIMA-GRU0.1360.390

最后,本文还验证了BP-SARIMA-GRU模型在旧金山市犯罪数据集上的预测效果。按照前文所述的步骤对原始数据进行预处理和特征工程等操作后,对市区进行20 km×20 km的网格划分并预测grid206的犯罪数量,组合模型和单项模型输入的数据格式均保持不变,不同犯罪预测模型的实验结果如表8所示。该结果进一步验证了BP-SARIMA-GRU犯罪预测模型的可行性和有效性,与其他模型相比具有更高的预测精度,同时也具有较好的泛化能力。

表8 不同犯罪预测模型的实验结果2
Table 8 Experimental results 2 of different crime prediction models

模型MAERMSEARIMA2.1034.001SARIMA2.0593.989LSTM1.6843.443GRU1.6863.439LSTM-ARIMA1.4522.807BP-SARIMA-GRU1.3772.510

4 结论

精准的犯罪预测可以帮助公安机关制定科学合理的防控策略,将犯罪活动扼杀在摇篮里,对社会的长治久安具有重要意义。针对当前犯罪预测模型无法捕捉到数据中的复合特征而导致准确率不足等问题,提出基于BP神经网络非线性组合的SARIMA-GRU犯罪预测模型。该模型将SARIMA和GRU对犯罪数量的预测结果通过BP网络实现非线性组合,通过反向传播算法进行权重学习,将各层神经元所确定的权重矩阵作为两种方法在组合预测中的比重,从而兼具GRU在非线性特征挖掘上的优势和SARIMA模型在线性时序预测中的优势。通过温哥华的真实犯罪数据进行对比实验,结果表明:本文提出的组合预测模型可以捕捉到犯罪时序数据的复合特征,是一种综合考虑季节因素、时间相关性、空间相关性、节假日以及气候温度因素的犯罪预测模型,与其他单项模型相比具有更高的预测精度。

参考文献:

[1] 靳高风,守佳丽,林晞楠.中国犯罪形势分析与预测(2018-2019)[J].中国人民公安大学学报(社会科学版),2019,35(3):1-11.

JIN G F,SHOU J L,LIN X N.Analysis and prediction of criminal situation in China(2018-2019)[J].Journal of People's Public Security University of China(Social Science Edition),2019,35(3):1-11.

[2] 屈茂辉,郝士铭.基于ARMA模型的我国财产类犯罪人数预测研究[J].中国刑事法杂志,2013(4):100-106.

QU M H,HAO S M.Prediction of the number of property crimes in China based on ARMA model[J].Chinese Criminal Science,2013(4):100-106.

[3] 侯苗苗,胡啸峰.基于时间序列模型SARIMA的犯罪预测研究[J].中国人民公安大学学报(自然科学版),2021,27(2):67-73.

HOU M M,HU X F.Study on crime prediction based on the time-series model SARIMA[J].Journal of People's Public Security University of China( Science and Technology),2021,27(2):67-73.

[4] WANG P,MATHIEU R,JIE K,et al.Predicting criminal recidivism with support vector machine[C]∥Proceedings of 2010 International Conference on Management and Service Science,Wuhan,China.New York:IEEE,2010.

[5] 沈寒蕾,张虎,张耀峰,等.基于长短期记忆模型的入室盗窃犯罪预测研究[J].统计与信息论坛,2019,34(11):107-115.

SHEN H L,ZHANG H,ZHANG Y F,et al.Prediction of burglary crime based on LSTM[J].Statistics &Information Forum,2019,34(11):107-115.

[6] SINGH P.Time series forecasting on crime data in Amsterdam for a software company[D].Lisboa:Universidade Nova de Lisboa,2018.

[7] CHO K,MERRIENBOER B V,GULCEHRE C,et al.Learning phrase representations using RNN encoder-decoder for statistical machine translation[J].Computer Science,2014:1-15.

[8] HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.

[9] 周鑫,张锦,李果,等.基于乘积季节模型的GPRS小区流量预测[J].计算机工程,2010,36(18):76-78.

ZHOU X,ZHANG J,LI G,et al.Traffic prediction of GPRS cells based on multiple seasonal model[J].Computer Engineering,2010,36(18):76-78.

[10] 王燕.应用时间序列分析[M].北京:中国人民大学出版社,2005.

[11] 刘天,张丽杰,翁熹君,等.SARIMA模型参数设置探讨[J].实用预防医学,2019,26(12):1530-1534.

LIU T,ZHANG L J,WENG X J,et al.Discussion on parameter setting of SARIMA model[J].Practical Preventive Medicine,2019,26(12):1530-1534.

[12] 韩冬梅,牛文清,杨荣.线性与非线性最优组合预测方法的比较研究[J].情报科学,2007,25(11):1672-1678.

HAN D M,NIU W Q,YANG R.The comparative study on linear and non-linear optimal forecast-combination methods[J].Information Science,2007,25(11):1672-1678.

[13] HIBON M,EVGENIOU T.To combine or not to combine:selecting among forecasts and their combinations[J].International Journal of Forecasting,2005,21(1):15-24.

[14] BATES J M,GRANGER C.The combination of forecasts[J].Journal of the Operational Research Society,1969,20(4):451-468.

[15] 凌立文,张大斌.组合预测模型构建方法及其应用研究综述[J].统计与决策,2019(1):18-23.

LING L W,ZHANG D B.A review of construction and application of combination forecast model[J].Statistics &Decision,2019(1):18-23.

[16] 张青.基于神经网络最优组合预测方法的应用研究[J].系统工程理论与实践,2001(9):90-93.

ZHANG Q.Application research on an optimal mix forecasting method based on ANN[J].Systems Engineering-theory &Practice,2001(9):90-93.

[17] 潘仲赢.基于机器学习算法的犯罪预警系统设计与实现[D].西安:西安电子科技大学,2019.

[18] 黄卓,陈辉,田华.高温热浪指标研究[J].气象,2011,37(3):345-351.

HUANG Z,CHEN H,TIAN H.Research on the heat wave index[J].Meteorological Monthly,2011,37(3):345-351.

[19] RANSON M.Crime,weather,and climate change[J].Journal of Environmental Economics and Management,2014,67(3):274-302.

[20] 魏腾飞,潘庭龙.基于改进PSO优化LSTM网络的短期电力负荷预测[J].系统仿真学报,2021,33(8):1866-1874.

WEI T F,PAN T L.Short-term power load forecasting based on LSTM neural network optimized by improved PSO[J].Journal of System Simulation,2021,33(8):1866-1874.

[21] 鹿应荣,杨印生,刘洪霞.基于BP神经网络的非线性组合预测模型在粮食物流需求预测中的应用[J].吉林大学学报(工学版),2008,38(S2):61-64.

LU Y R,YANG Y S,LIU H X.Application of nonlinear combination forecasting model based on BP neural networks in grain logistics demand[J].Journal of Jilin University(Engineering and Technology Edition),2008,38(S2):61-64.

[22] 殷高方,张玉钧,胡丽,等.BP神经网络在水华短期预测中的应用[J].北京理工大学学报,2012,32(6):655-660.

YIN G F,ZHANG Y J,HU L,et al.Application of BP neural network in algal blooms short-term forecast[J].Transactions of Beijing Institute of Technology,2012,32(6):655-660.

[23] MANASWI K N.Understanding and working with Keras[M]∥Deep Learning with Applications Using Python.Berkeley:Apress,2018:31-43.

[24] 朱小波,次晋芳.基于改进PSO-BP神经网络算法在一般盗窃犯罪预测中的应用[J].计算机应用与软件,2020,37(1):37-42.

ZHU X B,CI J F.Application of improved PSO-BP neural network algorithm in the prediction of theft crime[J].Computer Applications and Software,2020,37(1):37-42.

[25] 姚姝宇.基于时空特征的犯罪热点数据分析与应用[D].武汉:湖北工业大学,2021.

SARIMA-GRU Crime Prediction Model Based on Nonlinear Combination of BP Neural Network

ZHAI Shengchang, HAN Xiaohong, WANG Li, WU Yongfei, WANG Junyan

(CollegeofDataScience,TaiyuanUniversityofTechnology,Jinzhong030600,China)

AbstractAiming at the problems that the current crime prediction model can not capture the composite characteristics of crime sequence data or respond to the dynamic changes of the environment in time, a SARIMA-GRU crime prediction model based on nonlinear combination of BP neural network is proposed. This model nonlinearly combines the prediction results of SARIMA and GRU models on the number of crimes through BP neural network, uses the back-propagation algorithm to learn the weight, and takes the weight matrix determined by each layer of neurons as the weight of the two methods in the combined model. Comprehensive utilization is taken of the advantages of SARIMA model in linear time series prediction and GRU in nonlinear feature mining, so as to obtain better crime prediction results. Through the open crime data of Vancouver and San Francisco to compare the combined model with other models, the experimental results show that the combined prediction model proposed in this paper can capture the composite characteristics of crime time series data, and has higher accuracy than other crime prediction models.

Keywordscrime prediction model; BP neural network; GRU; SARIMA model; combination forecast

中图分类号:TP183

文献标识码:A

DOI:10.16355/j.cnki.issn1007-9432tyut.2023.03.016

文章编号:1007-9432(2023)03-0525-09

引文格式:翟圣昌,韩晓红,王莉,等.基于BP神经网络非线性组合的SARIMA-GRU犯罪预测模型[J].太原理工大学学报,2023,54(3):525-533.

ZHAI Shengchang,HAN Xiaohong,WANG Li,et al.SARIMA-GRU crime prediction model based on nonlinear combination of BP neural network[J].Journal of Taiyuan University of Technology,2023,54(3):525-533.

收稿日期:2022-04-17;

修回日期:2022-05-13

基金项目:国家自然科学基金资助项目(61872260);山西省回国留学人员科研资助项目(HGKY2019024);国家自然科学基金青年基金资助项目(61901292)

第一作者:翟圣昌(1996-),硕士研究生,(E-mail)594426899@qq.com

通信作者:韩晓红(1973-),博士,教授,主要从事数据挖掘、人工智能、算法优化方面的研究,(E-mail)hanxiaohong@tyut.edu.cn

(编辑:朱 倩)

Baidu
map