纽约市人力资源局借大数据 抗击福利欺诈行为

2015-10-09

几年前,纽约市人力资源局决定尝试一种新方法,希望借此彻底根除福利欺诈行为。数据分析人员开始使用一种计算机模式识别系统对领取福利的人群展开分析。他们发现有一小撮人的行为比较异常。虽然这些异常者未必就是欺诈者,但却给数据科学家们启发了一个非常有价值的探索方向。


例如,其中一名数据异常者叫做Parvawattie Raghunandan,居住在布朗克斯区。她的家庭在过去十年以来一共领取了超过5万美元的保健福利金。她的案件之所以显得不正常,是因为大多数有着类似人口数和收入的家庭通常会领取多种福利——例如健康保险、食品券和现金补助等——Raghunandan女士却只为她自己和三个孩子申请了医疗补助,人力资源局的官员如是说。


于是数据科学家们开始对她的家庭状况展开深入调查,调查她的企业所有权记录和车辆登记信息。他们还从全国的LexisNexis风险数据库中查找她所拥有的房产信息,这个数据库是由Reed Elsevier的信息分析部门提供的。调查人员随后发现,这个家庭瞒报了一系列所拥有的资产信息,包括:Raghunandan的丈夫拥有的一家电气承包公司,而她本人则声称只是在这家公司工作而且薪水很低;在纽约拥有的三处房产以及在其它州的一处房产;在共有银行账户中拥有超过10万美元的存款。


这起案件最终在本月由布朗克斯区的法律代理人对Raghunandan女士提出指控——涉嫌重大盗窃罪和向公职机关提供不实材料。她则申辩无罪。


人力资源局的官员说道,这种通过多个源头进行的数据分析,帮助他们很快就发现了更多滥用福利的行为。去年,人力资源局的工作人员一共完成了近3万个调查,发现的欺诈金额约为4650万美元。而在2009年,他们一共完成了近4.8万个调查,涉案金额却只有2900万美元,当时他们还没有系统化地采用数据分析技术。


Steven Banks是人力资源局的行政长官,他最近说:数据挖掘技术特别重要,帮助我们锁定可能的欺诈行为,集中资源进行调查,而不是漫无目的地大海捞针。


然而,Raghunandan女士的代理律师Todd A. Spodek(他来自圭亚那)则说道:仅仅基于数据分析就来判定是否有罪,我觉得这种做法存在根本缺陷。移民机构常常会诱骗新移民签署一些福利申请,而新移民常常并不清楚实情


包括SAS IBMLexisNexis在内的商业智能公司多年来帮助金融服务公司通过预测建模抵御欺诈。现在,州立和地方政府机构也将目光投向这项技术。部分机构运用软件整合和分析社会福利存档数据;而一些部门甚至将数据采集范围扩大到商业交易数据,例如豪车交易记录。政府机构开始用数据挖掘软件武装自身,以解决越发复杂的社会福利欺诈问题。


就在三月,北卡罗来纳州立政府宣布了一项新的失业保险计划。在SAS数据集成和分析软件的帮助下,州立人力资源部门侦测了100例向政府谎报就业单位、薪酬状况和纳税记录的虚假雇员,并存档了672例虚假失业申报。


“欺诈这个现象已存在多年,政府面对的威胁却千变万化。”SAS安全智能实践首席解决方案架构师Shaun Barry解释道,犯罪分子变得更加有组织且手段高明。他们也擅用高级分析技术,并能在政府部门间沟通不善中找到空子。

Barry先生说道,SAS公司的政府业务迎来了爆发式的增长——全美14个州的22家机构正在使用SAS软件减少欺诈、浪费与滥用现象。


一些政府机关开始采用商用的数据挖掘服务,因为他们缺乏将州政府和地方政府的数据记录整合起来的能力。


例如,州政府通常会保存居民的信息记录,包括出生日期、婚姻状况以及死亡日期等。但是,对于地方欺诈调查人员来说,要确定一个人是否冒用了其它州已经去世的人名来申请福利,可能却是比较困难的。


尽管一些政府机关开始采用商用数据挖掘服务,但是他们也会放弃使用一些不太相关的个人信息。人权拥护者声称错误的信息或歧视性的算法会带来风险,会让那些真正需要帮助的人受到不公平的待遇。


在纽约市人力资源局,数据科学家们声称他们采取了相应的措施来确保计算机发现的相关关系不会被误用从而导致错误的指控。


“我们会很仔细地核对和检查这些信息Morgan Neuwirth说道,他是政府机关的数据科学家。但是由于数据来自私人供应商,可能会存在错误或过期,调查人员还会根据首选数据来源进行核对,比如房产契税登记信息或者州汽车登记信息。