如何开展警务大数据的研发:
一.基本建设要求
1、PB级数据存储管理
2、多种数据类型与协议支持
3、高质量的数据整合
4、高效的数据分析能力
5、可管理和开放性
6、安全可靠
二、系统架构规划
三、常用数据挖掘方法的应用
1、分类分析
根据一定的分类准则将具有不同特征的数据划分到不同类别的过程
2、回归分析
通过对自变量和因变量做一定的相关性分析,由此建立回归方程,用以预测变量的依赖关系
3、聚类分析
不同于分类分析,聚类分析没有先验知识,一般是将一堆看似毫无规则的数据根据某种特征进行划分,不同属性的数据分到不同的组
4、关联分析
用于在大量杂乱无章的数据中寻找有价值数据间的相关关系
四、技术难点与突破方向
1、如何从非结构化的数据中提取结构化的数据
目前,公安的数据很多涉及到视频数据,而视频数据本身是不能够被结构化的数据,也就不能被计算机直接所处理。所以未来摆在技术人员面前的课题是如何把视频数据转换成计算机能够处理的结构化或者半结构化数据。
2、寻找这些数据之间的关联和价值
在技术需要攻克的难题就是能不能把这些数据通过相应的工具模块,通过大数据技术把原来被忽视的数据信息关联起来,找到或提取这些数据之间的相关性,为案件的侦破和方案决策提供科学的数据依据。