当前位置: 首页  -  学科建设  -  科研成果  -  正文

科研成果

《中国法学》|曾赟:系列杀人犯罪侦查分析模型的创建与检验

发布时间:2018-01-15      点击量:


本文转自‘中国法学’微信公众号



曾赟:5822yh银河国际教


根据十八届四中全会精神和《意见》要求,保障无罪的人不受刑事追究和做到案件事实清楚及证据确实、充分被置于刑事诉讼活动的首要地位。那么侦查机关在侦办故意杀人案件中如何做到既能及时侦破案件,以防止系列杀手再次作案,又能准确侦破案件,以保障无罪的人不受刑事追究、防止冤假错案呢?通过对现有冤假错案的简单分析,我们可以发现一些冤假错案中的杀人真凶后来往往被证实为系列杀人凶犯。对于任一已发生的故意杀人案件,准确分析和判别该案是否属于系列杀人犯罪可谓及时、准确侦破案件和确保司法公正、防止冤假错案的基础和前提。由是观之,科学创建系列杀人犯罪侦查分析模型无疑具有重要的实践意义。当然,本研究对于维护社会公共安全和防止类似人间悲剧重演来说亦具有重要的社会意义。


一、模型数据的来源和编码


创建系列杀人犯罪侦查分析模型需要运用定量研究方法。如所周知,定量研究的前提是必须有可据以统计与分析的样本。当然,样本的选取依赖于概念界定的标准,研究者对概念界定的标准不同,其所选取的样本也就各异,所得出的结论也就不尽相同。兹在界定系列杀人、多重杀人概念标准基础上,采用多阶抽样方法收集多重杀人案例347件,采用整群抽样方法抽取单独个体多重杀人案例181件。为创建系列杀人犯罪分类与回归模型,首先,我们采用整群抽样与多阶抽样方法,从百度百科“刑事案件”名录中抽取自1980至2016年间发生的多重杀人案例名369件。其次,通过搜索百度网站和中国知网上有关多重杀人犯罪方面的相关报道和论文,在删除相同案例名后,共收集多重杀人案例名34件。经上述两种方法,共收集403件多重杀人案例名。对于所收集的403件多重杀人案例名,通过检索百度和中国知网中有关文献,逐一收集每件多重杀人案例的详细内容。案件内容收集完毕后,经初步整理,删除了56件内容无法查实的案例,保留了347件数据资料齐全的案例。在此基础上,从347件多重杀人案例中整群抽取由单独个体实施的多重杀人案例181件。根据系列杀人、特大杀人犯罪概念界定标准,181件单独个体多重杀人案例中有69件为系列杀人,有112件特大杀人,分别约占样本总量38.1%、61.9%。之所以选择由单独个体实施的多重杀人案例作为分析样本,主要基于以下两个方面的原因:

对所收集的181件单独个体实施的多重杀人案例材料,采用文本分析法对案例内容逐一进行编码。编码的依据主要来自于对案例研究的经验总结和对相关文献的梳理分析。一般认为,较早对系列杀人犯罪现场展开研究的当属美国联邦调查局国家暴力犯罪分析中心、行为科学研究处约翰·道格拉斯(John Douglas)、帕特里克·马尼拉(PatrickMullany)等,其于20世纪70年代创设了有序犯罪现场(organized crime scenes)和无序犯罪现场两种类型。虽然他们关于故意杀人犯罪现场特征的规整有助于侦查机关分析案件的性质类型和凶犯的社会特征,但因为有序和无序的类型划分视角过于狭窄,且有关两类人格特征的划分范围亦过于狭小,故其适用范围较少。基此,我们主要基于对所收集案例的经验总结,通过开放式编码方法的采用,提取首犯时间等34个概念范畴。


二、分类模型的创建及检验


如果假设181件单独个体多重杀人案例相互之间存在着程度不同的相似性(亲疏关系),那么依据可以度量案例之间相似性的统计量,就可以把相似程度较大的案例聚合为一类,把另外一些相似程度较大的案例聚合为另一类。显然,案例之间的这种“亲疏程度”是重要的,因为它直接影响最终聚类结果。本研究中我们采用K均值聚类方法对181件多重杀人案例进行分类。K均值聚类方法采用欧式距离作为相似性测度的统计量,认为两个案例之间的距离越近,相互之间的相似度就越大。在样本容量较大时,研究者需要选择一批凝聚点或给出一个初始分类,让案例按照最短距离原则向凝聚点凝聚。向凝聚点凝聚的过程就是一个不断修改凝聚点或进行迭代的过程,这一过程将一直持续至分类比较合理或迭代稳定为止。

将基于重点编码和二值编码方法取得的18项测量指标作为聚类分析的变量,将181件多重杀人案例序号作为个案依据,采用K均值聚类方法,可得初始聚类中心。经第一次迭代后,二个类的中心点分别偏移了1.770和1.237。经第七次迭代后,二个类的中心点偏移均小于系统判定标准(0.02),聚类结束,得到多重杀人犯罪最终聚类中心表(表2)。根据表2,第一类多重杀人犯罪的显著特征有:一是犯罪地偏僻;二是被害人尸体不在犯罪现场;三是杀人凶犯在杀害被害人后还有抢劫行为;四是杀人凶犯有犯罪前科。除此而外,第一类还具有以下非典型特征:一是一些杀人凶犯在作案时未携带凶器;二是杀人凶犯具有权力和控制动机欲望。第二类多重杀人犯罪的显著特征有:一是杀人凶犯的犯罪动机表现为心怀愤恨型;二是犯罪人与被害人是熟人。基于概念分析与经验观察,第一类多重杀人犯罪为系列杀人,第二类多重杀人犯罪为特大杀人。基此,根据多重杀人犯罪最终聚类中心表,得到系列杀人犯罪分类模型。依据系列杀人犯罪分类模型,侦查机关可以初步从犯罪地是否偏僻、被害人尸体是否不在犯罪现场、凶犯是否有抢劫行为、是否有犯罪前科等4个方面直观判别某一故意杀人是否属于系列杀人犯罪。当然,为能全面分析案件属性,侦查机关需根据18项二值变量,通过系列杀人犯罪分类模型来判别某一故意杀人案件是否属于系列杀人犯罪。

根据系列杀人犯罪分类模型的分类结果,181件多重杀人案例中有72件被判定为系列杀人,109件被判定为特大杀人犯罪。依据系列杀人和特大杀人犯罪概念,181件多重杀人案例中有69件为系列杀人,112件为特大杀人犯罪。为便于区分,将基于分类模型所得分类称为统计分类,将基于概念界定所作分类称为概念分类。为检验系列杀人犯罪分类模型的准确性,采用交叉列表分析法进行检验。通过交叉列表,得到概念分类与统计分类交叉列表(表3)。根据表3,统计分类中被确定为系列杀人犯罪的72件案例中有66件被概念分类定义为系列杀人犯罪。质言之,被分类模型预测为系列杀人犯罪的72件案例中有66件被准确预测,因此系列杀人犯罪分类模型的预测准确率为95.7%。统计分类中被确定为特大杀人的109件案例中有3件被概念分类定义为系列杀人犯罪。质言之,被分类模型预测为特大杀人的109件案例中有3件案例被预测错误,因此系列杀人犯罪分类模型的预测错误率为4.3%。


三、回归模型的创建及检验


依据系列杀人犯罪分类模型所得分类结果,将是否为系列杀人犯罪作为因变量,8个主范畴名下的各二值变量作为自变量,利用spss18.0统计软件,采用方差分析方法,创建8个方差分析模型。在此基础上,从中分别提取p<0.05的变量作为创建系列杀人犯罪回归模型的测量指标。通过方差分析,从8个主范畴方差分析模型中初步提取了12项因素作为系列杀人犯罪回归模型的测量指标,具体包括:(1)犯罪地是否偏僻(x1);(2)是否未携带凶器作案(x2);(3)尸体是否不在犯罪现场(x3);(4)是否采用绞杀、扼杀方法(x4);(5)是否侮辱、摧残尸体(x5);(6)是否有强奸行为(x6);(7)是否有抢劫行为(x7);(8)是否为追求刺激型(x8);(9)是否为追求利益型(x”9);(10)是否为权力和控制型(x10);(11)被害人是否属于易遭受攻击群体(x11);(12)是否有犯罪前科(x12)。

将基于系列杀人概念所得的概念分类——是否为系列杀人作为因变量,将x1、x2、x3、x4、x5、x6、x7、x10、x11、x12等10项测量指标作为自变量,通过二元逻辑回归分析,采用逐步向前进入法(似然比),运用spss18.0,创建系列杀人犯罪回归模型。所谓逐步向前进入法是指在每次引入一个新变量时对先前引入方程的老变量逐个进行检验,将对因变量不具有显著影响的变量从中剔除,直至没有剔除的变量方再引入新的变量。通过逐步向前回归,模型中仅保留了4项对因变量具有显著影响的自变量指标,具体包括:犯罪地是否偏僻(x1,P=0.000)、尸体是否不在犯罪现场(x3,P=0.001)、是否有抢劫行为(x7,P=0.005)、是否有犯罪前科(x12,P=0.000)。根据回归模型结果(表5),可得系列杀人犯罪回归方程:y1=-5.454+4.608*x1+3.669* x3+5.583*x7+2.686* x12。经检验:模型的-2倍对数似然值为50.651,说明模型具有统计学意义;模型的Nagelkerke R2为0.884,说明模型的拟合效果极佳。

根据系列杀人犯罪二元逻辑回归方程(y2),可以计算出某一故意杀人犯罪为系列杀人的概率,概率公式为:P=ez/1+ez(z=-4.683+3.974*x1+3.014* x3+2.762*x4+5.650* x7)。以聂树斌案(王书金案)为例,根据案发现场,可作如下认定:犯罪地偏僻(x1);被害人尸体被发现在犯罪现场(x3);凶犯采用布条绞杀方法致被害人死亡(x4)。因为被害人所穿连衣裙不在案发现场(根据王书金的供述,在当时他想要把连衣裙拿回家给他的妻子穿,后担心被侦查机关发现,故又将连衣裙就地埋藏),故可认定凶犯有抢劫行为(x7);也可以认定为没有抢劫行为,因为当时的侦办干警可能并未想到这一细节。根据计算,如果认定凶犯除故意杀人外还有抢劫行为,则该案被判定为系列杀人犯罪的概率值约为0.999;如果认定凶犯没有抢劫行为,则被判定为系列杀人犯罪的概率约为0.886。根据任一计算结果,王书金案(聂树斌案)被判定为系列杀人案无疑。对甘肃白银高承勇第一起犯罪案件,根据案发现场,可作如下认定:犯罪地(在被害人家)偏僻;被害人尸体在犯罪现场;采用锐器刺戳;现场有侵财迹象。根据计算:该案为系列杀人的概率值约为0.997。根据计算结果,甘肃白银案被判定为系列杀人犯罪。

根据概率公式P=ez/1+ez(z=-4.683+3.974*x1+3.014* x3+2.762* x4+5.650* x7),分别计算出基于概念分类所得69件系列杀人案件的概率值。通过计算,69件系列杀人案件的概率值分布为:①有3件<0.5;②有23件<0.95,但>0.5;③有43件>0.95。一般认为,概率值大于0.5时,被认为某事很可能发生。基此,根据系列杀人犯罪回归模型计算结果,有3件预测错误,有66件预测准确,模型预测的准确率约为95.7%。当然,我们还可以采用交叉列表方法来检验模型的准确性。根据交叉列表分析,181件多重杀人案例中有69件为系列杀人、112件为特大杀人。69件系列杀人案件被模型准确预测为系列杀人犯罪的有66件,错误预测为特大杀人犯罪的有3件,模型预测准确率为95.7%;模型的总体预测准确率为95%。112件特大杀人案例被模型准确预测为特大杀人犯罪有106件,错误预测为系列杀人犯罪有6件,模型预测准确率为94.6%。