
活动专题
时间:2025-06-04 09:55:00 来源:江苏省监狱管理局 郑曦
[内容导读] 【摘 要】:为充分激发优秀矫治案例价值,发挥监狱工作数字化转型成效,提高监狱改造罪犯工作质效,本文提出构建基于罪犯画像的矫治案...
【摘 要】:为充分激发优秀矫治案例价值,发挥监狱工作数字化转型成效,提高监狱改造罪犯工作质效,本文提出构建基于罪犯画像的矫治案例智能推荐系统。首先,探讨基于罪犯画像的矫治案例智能推荐系统的功能与架构;其次,提出从罪犯自然特征、心理特征、人格特征、家庭特征、犯因特征、服刑表现、刑罚执行等方面动态绘制罪犯个体画像;第三,提出综合使用基于内容推荐算法、基于物品的协同过滤算法以及专家标注法的方法构建罪犯矫治案例智能推荐系统,并探讨如何有效解决案例推荐冷启动的问题。最后,提出下一步的研究方向。
【关键词】:罪犯教育改造;罪犯矫治案例;罪犯个体画像;推荐算法;智能推荐;监狱工作数字化转型
随着社会多元化发展以及刑事政策的变化,监狱押犯的构成、犯情、犯因、危险程度日益复杂。面对复杂的狱情与押犯构成,民警如若沿袭传统的经验管教模式,仍然采取大一统的教改策略,显然无法满足个性化矫治、精准化施策的要求。正所谓“一把钥匙开一把锁”,只有全面掌握罪犯个体特征,才能有针对性的开展罪犯矫治工作。此外,在改造罪犯实践工作中,民警或多或少面临过个别谈话效果不理想、罪犯改造表现差、对抗管教或诉缠诉访等情况。如何开展有针对性的矫治工作,制定行之有效的矫治方案,是民警工作中的痛点和难点。
构建基于罪犯画像的矫治案例智能推荐系统可以有效解决上述难题。首先,全面分析罪犯个体的自然特征、心理特征、人格特征、家庭特征、犯因特征、狱内表现、刑罚执行等情况,对罪犯进行动态、精准、全面的个体画像。其次,将优秀矫治案例进行结构化解析,建立起与罪犯个体画像相关联的因子维度。在此基础上,选取合适算法,构建基于罪犯画像的智能化的案例推荐系统,为不同罪犯量身定制个性化矫治案例,从而提高民警矫治罪犯的针对性、有效性与科学性。
一、系统主要功能与架构
(一)主要功能
教育改造罪犯是监狱工作的中心任务。基于罪犯画像的矫治案例智能推荐系统的主要功能是为监区一线民警提供动态、精准、直观的罪犯画像,智能推荐所需矫治案例,辅助教改决策,提升矫治罪犯的科学性、针对性与有效性。具体功能可分为三种:一是构建动态、精准、直观的罪犯画像;二是针对罪犯画像推荐与之相匹配的矫治案例。根据罪犯画像所呈现的特点,例如自然特点、心理特点、危险程度、改造行为特点等,通过推荐算法计算,从案例库中自动查找与之近似度最高的矫治案例,智能关联匹配案例。当民警输入罪犯的编号或姓名时,系统将智能推荐与目标罪犯相关的矫治案例,并按相关程度自动排序后推荐给民警。三是面向民警自动推荐他可能感兴趣的罪犯矫治案例。在民警没有明确输入罪犯信息时,系统将分析他的历史记录以及日志文件,自动推送民警关注的案例。
与搜索引擎相比,案例推荐并不需要提供明确的检索需求,而是通过分析罪犯特征或需求,构建罪犯画像,并主动推荐与罪犯画像相匹配的改造方案。案例推荐与搜索引擎是两个互补的工具。案例库搜索引擎满足有明确目标且检索条件相对简单的检索需求,而推荐系统能够根据罪犯特征及其需求自动推荐相关案例,有助于弥补因检索需求不清造成的案例漏检,有助于节约查询时间,为民警提供更全面、更科学的矫治案例,从而提高民警的工作效率。
(二)整体架构
基于罪犯画像的矫治方案智能推荐系统架构主要涉及两方面:详细的罪犯画像动态构建以及系统设计架构。
该系统综合使用机器学习算法、基于内容的推荐算法、基于物品的协同过滤算法以及专家标注法,实现基于罪犯动态个体画像的案例推荐以及面向使用民警的案例自动推荐。首先,民警登录账号,打开界面时,系统自动分析该民警的特征,智能推送该民警可能感兴趣的案例。如果民警打开推荐案例浏览,系统将自动记录、分析浏览日志,并将该浏览行为自动增添至民警信息库中,根据算法更新该民警的特征值,为后继匹配做准备,形成闭环管理。
接下来,当民警输入目标罪犯姓名或编号后,系统从数据仓库中查找相对应的罪犯信息,根据算法计算罪犯特征值与案例特征值,自动为目标罪犯匹配、推送矫治案例,民警浏览案例进行反馈评分。此时,系统将民警的浏览日志与评分情况反馈至数据仓库,完善罪犯、案例、民警三库中各自的特征分析,优化计算结果,为后继匹配推送做准备,再次形成闭环管理。
二、数据来源与算法选取
(一)数据来源
数据主要来源于三部分:一是与罪犯个体有关的数据,二是优秀的矫治案例,三是民警的浏览行为数据。
1.罪犯个体数据
罪犯个体数据主要来源于我省智能管理大平台、政法大数据平台、刑罚执行一体化平台中的罪犯档卡数据、刑罚执行数据、计分考核数据、专项奖惩数据、认罪悔罪数据、狱内通联数据、大账使用数据、教育改造谈话数据等。
2.优秀矫治案例
我省每年收集的优秀矫治案例以及司法行政(法律服务)12348 案例库中的教育改造案例。
3.民警浏览行为数据
警务系统中的民警数据以及民警使用浏览的行为日志。
(二)算法分析
智能推荐系统的核心是推荐算法。
1. 协同过滤算法(collaborative filtering,CF)
协同过滤算法通过挖掘罪犯个体历史数据,发现罪犯个体的特征,基于不同的特征对罪犯进行群组划分,并推荐相似的改造方案。该算法可细分为两类,分别是基于用户的协同过滤算法(User-CF)以及基于物品的协同过滤算法(Item-CF)。
基于用户的协同过滤算法(User-CF)的核心是找到相同偏好的用户,即相同特征系数的罪犯个体,筛选特征系数最相近的罪犯个体,并将最相近的罪犯的改造方案推荐给需要匹配的新罪犯。基于物品的协同过滤算法(Item-CF)的核心是解决物品相似度问题,根据物品的相似度和用户的历史行为给用户生成推荐列表,即计算案例的相似度,再根据案例和罪犯的匹配历史记录给该罪犯推荐与历史案例最相似的新案例。其中,相似度计算主要有3个经典算法:余弦定理相似性度量、欧式距离相似度度量和杰卡德相似性度量。
2.基于内容的推荐算法(Content-Based Recommendations)
基于内容的推荐算法可根据罪犯的自然信息、心理状况、改造情况以及需求信息,综合计算得出罪犯个体特征系数,然后基于罪犯的个体特性系数将最相似的改造方案推荐给他。该算法的优点是不需要协同考虑其他个体特征,缺点是可供分析的内容有限,导致推荐的内容高度相似,出现过度特征化的推荐内容。
3. 矩阵分解推荐算法(Matrix Factorization)
矩阵分解推荐算法是基于分类、聚类、关联规则等机器学习模型所做的推荐,先将罪犯-案例评分矩阵分解为罪犯-特征矩阵以及特性-案例矩阵,再将两个矩阵相乘得到罪犯-案例得分矩阵,得到罪犯的特征以及案例的属性,降低矩阵的维度。
三、模型实现与部署
(一)构建罪犯画像
罪犯画像的构建可分为3个流程,即数据采集、罪犯建模与画像勾勒。
在数据采集阶段,需要从大平台、政法大数据平台等多个系统中,多方采集与罪犯相关的自然特征、心理特征、人格特征、家庭特征、犯因特征、刑罚执行情况等结构化数据与半结构化数据。
在罪犯建模阶段,当获取大量罪犯数据信息后,可以利用聚类分析、关联规则分析等技术,对这些数据进行初步筛选、过滤处理,去除与罪犯特征无关的冗余信息,获得用于建模的可靠信息。对大规模罪犯的异构数据进行整合,对不同类型的数据资源进行分类处理。如罪犯个体自然信息、心理信息、计分考核信息等。在抓取罪犯动态服刑数据后,按照一定的数据筛选关联规则,对这些数据进行清洗、转换与序列化处理,然后借助数据挖掘技术进行深度分析。
对与罪犯个体相关的抽象数据进行分析,将其还原为可理解、有指导意义的信息,从而发现不同数据之间的关联关系,建立罪犯标签体系。通过标签建模分析,进一步挖掘与罪犯个体相关的特征向量,完成对不同类型罪犯的标识与分类建模。
在画像勾勒阶段,从罪犯自然特征、人格特点、兴趣偏好、刑罚执行特点、改造行为特征、家庭社会支持等方法,构建罪犯个体特征标签库。在具体实践中,以可视化统计的方式,对罪犯数据进行对比分析,实现对罪犯的全方位判断和评价。采用可视化的信息处理路径,发现目标罪犯的个性化特征。从抽象到具体逐步填充画像数据结构,并根据罪犯实时改造行为与不同服刑阶段的矫正需求的动态变化,不断修正完善既有画像。模型可以根据不同类型罪犯的特点,根据监管改造实际需求,选择建立个人或群体画像。同时,观察不同群体的动态变化,并根据不同群体呈现的特点,提供具有针对性的案例推荐,进而提高案例的动态匹配度。
(二)系统功能实现
1.基于内容的推荐算法实现面向民警的推荐功能
基于内容的推荐算法可根据物品的特征,发现物品之间的相关性,然后基于用户之前的偏好记录推荐给用户相似的物品。基于内容的推荐只考虑物品的本身性质,将物品按标签形成集合。如果用户浏览了集合中的一个对象,那么就向用户推荐该集合中的其它对象。
在构建矫治方案推荐系统时,要实现面向民警的自动推荐功能,首先要对案例进行标识,为每个案例抽取出特征值;然后针对民警浏览行为开展特征学习,利用该民警过去浏览案例的日志数据以及对案例的评分数据,来判断出该民警的偏好特征;第三,生成推荐列表,通过相似度比较上一步得到的民警特征与候选案例的特征,为此民警推荐一组相关性最大的案例。
2.基于协同过滤算法实现针对罪犯的案例推荐
使用协同过滤算法给一名罪犯推荐案例有两种方式:一种是基于物品(即案例)的算法,另一种是基于用户(即罪犯)的算法。基于物品的算法核心是要从该用户(罪犯)之前购买的商品中,给他推荐相似的商品,需要预先建立并保存物品间的相似度矩阵,即建立案例的相似度矩阵。基于用户的算法要找出于该用户相似的用户,然后推荐给他相似用户购买的商品,需要预先建立并保存用户间的相似度矩阵,即建立罪犯相似度矩阵。
罪犯矫治方案推荐系统的算法使用,应随着罪犯和案例数量的变化而改变。在系统使用初期,当罪犯数量远远大于矫治案例数量时,使用基于物品的协同过滤算法更合适。随着案例的不断积累和扩充,当案例数量超过罪犯数量时,使用基于用户的协同过滤算法将大大减少系统所占用的计算和存储资源。鉴于我省押犯的数量级,案例数量超过罪犯数量的情况通常不会发生。此外,与其它智能推荐系统不同的是罪犯的特征信息会随着时间发生变化,当部分罪犯特征发生改变后,将直接影响所有罪犯的相似度矩阵。综上所述,要实现面向罪犯的案例推荐,基于物品的协同过滤算法是最优算法。
3.优化算法解决系统冷启动问题
如何将新的案例推荐给可能与它相关的罪犯呢?这是案例推荐系统需要解决的案例冷启动问题。由于罪犯矫治方案推荐系统使用的是基于物品的协同过滤算法,所以,案例冷启动是很严重的问题。该算法的基础是通过罪犯对案例产生的匹配行为来计算案例之间的相似度。当新案例还未匹配给罪犯时,罪犯与案例的匹配行为就无法产生。为此,只能利用案例的内容信息计算物品的相关程度。将案例转换成关键词向量,通过计算向量之间的相似度,例如计算余弦相似度,得到案例的相关程度。
表1 专家标注案例维度
常用的办法是专家标注法。请专家对一个案例进行多维度标注(如表1所示),选定多个特征向量,然后通过常见的向量相似度算法计算出案例的相似度,再进行推荐。将基于协同过滤的智能推荐技术与专家标注法相结合,可以很好的解决协同过滤算法中案例冷启动的问题。
四、适用范围与成效
该系统既可以针对某一名罪犯进行全方位精准画像,又可以对某一类罪犯进行不同维度的刻画。通过融合罪犯的个人基本情况、违法犯罪史、个人成长史、社会交往状况、婚姻家庭状况、心理状况、生理状况等信息,将数据标签化,通过构建罪犯标签体系,整合标签形成个体画像。其中,罪犯标签包括罪犯基本信息标签、罪犯健康状况标签、罪犯犯罪相关标签、罪犯之前关系标签、罪犯改造难度标签、罪犯危险度标签、罪犯心理状况标签等,达到对罪犯进行全方位分析研判,形成罪犯360度的画像指标,体现罪犯特征,再根据罪犯实时改造行为与不同服刑阶段的矫正需求的动态变化,不断修正完善既有画像。基于画像对罪犯有清晰的认知,便于下一步的分析及改造,提升罪犯改造质效,有助于监狱、民警全方位精准掌控罪犯,为改造工作提供数据参考和决策支持。
该系统将罪犯画像与案例智能推荐有机结合,即可以根据不同类型罪犯的特点,又可以根据监管改造实际需求,提供具有针对性的案例推荐,为民警开展教育改造工作提供辅助参考,提高民警矫治工作的针对性、有效性与科学性。同时,该系统不仅适用于全省监狱关押的所有罪犯,也可结合社区矫正案例资源推广至社区矫正服刑人员。
五、未来研究方向
今后的研究方向:一是扩大案例收录范围,收录全国其他省份的优秀案例,提高非高危犯矫治案例的比例,完善案例库的分类体系。二是创新案例来源途径,扩充案例库内容,增加民警经验录入功能,将改造经验由按篇录入优化为按条录入,调动民警献计献策的积极性,增强案例经验的时效性和丰富性,进而构建监狱民警经验知识库。三是提高智能化应用水平,引入智能分析功能,自动提取案例中的相关信息,分析特定罪犯改造规律,并自动生成矫治案例模板,辅助民警工作。
责任编辑:广汉
声明:
凡文章来源标注为"智领安平行业网"的文章版权均为本站所有,如需转载请务必注明出处为"智领安平行业网",违反者本网将追究相关法律责任。非本网作品均来自互联网并标明了来源,如出现侵权行为,请立即与我们联系,待核实后,我们将立即删除,并向您致歉。