摘要
虽然并没有见到过买彩票中奖的算命先生,但几乎每个中奖的人都会吹嘘自己拥有了算命先生的能力。有些中奖者,就像赵本山的小品中的人物那样,会声称自己是从梦中获得的灵感来选择号码,还有一些中奖者则会声称自己拥有某种超级预测的能力。
但不管这些人如何声称自己拥有超能力,但我们可以相信,还是很少有正常的企业会高薪聘请这类人来帮助企业做市场预测分析。这是因为,随着互联网和计算机的普及,人们做决策时越来越注重“数据驱动”,也就是说更加依赖于客观的统计数据而不是某些人的所谓“判断”。在这个以事实为基础的领域中,常见的词汇都是“分析学”、“大数据”、“商业情报”以及“数据科学”等。 统计科学的任务就是在大量微观个体的相互作用中发现可以被辨识的宏观模式,这些模式可以是数学公式,可以是图标,也可以是若干个更为直观的指标或指数,如均值,方差,CPI和PPI等。
但是特殊敏感时期犯罪预测算法则更加困难,它不仅仅是要搞清楚特殊敏感时期,更要弄清特殊敏感时期犯罪规律,例如,大数据分析什么时间段是敏感时期,更关心犯罪规律。
本课题运用爬虫技术提前对敏感时期的犯罪做预测,帮助相关部分,更好的在敏感时间预防部分犯罪,保护人民群众安全,为国家贡献自己的一份微不足道的力量。
本论文主要分为六个模块:(1)叙述课题的研究背景和意义,如BBS和犯罪,系统开发的目的还有国内外的发展现状;(2)研究方法介绍,主要介绍的是系统研究的思路、相关技术,比如数据挖掘和数据提取技术;(3)对系统分析,包括系统的需求分析以及系统的功能分析,帮助读者了解系统的主要内容、方法以及系统的结构;(4)实现系统结构的设计和数据库的设计。(5)系统的实现,详细的介绍了各功能模块的开发和实现,方便读者了解系统的开发流程;(6)系统的测试。主要检测设计的模型是否具有可行性。
本系统具有强大的交互性,能够全面形象地实现网页中各类数据的采集以及判断文章的性质,这对于提高办事效率,树立现代化通讯的形象具有非常重要的意义。
关键字:犯罪,数据采集, BBS,监控系统