数据挖掘深度决定大数据应用价值

2016-09-28

9月24日,中国·北京梅地亚中心酒店,2016 CCF大数据与计算智能大赛在此拉开序幕。北京理工大学副校长,中国科学院院士梅宏在会上做了《大数据与数据驱动的智慧》的演讲,探索了大数据带来的挑战和可能的应用。梅宏院士认为,真正的大数据应用应该体现在数据挖掘的深度。

梅宏院士从对大数据的认识、大数据给我们带来的挑战、大数据应用、数据和智能的关系四个方面对大数据进行探索。所谓大数据,它是我们信息化到一定阶段之后,必然出现的一个现象,主要是由于信息技术不断的成本化,不断的廉价化,以及互联网及其延伸出来的,带来的信息技术无处不在的应用所带来的自然现象。梅宏院士认为,大数据带给我们最重要的东西就是思维模式的变化。

对于大数据的应用,大家普遍认为有三个层次,首先第一个层次只是关注到底当前发生了什么,把发展的态势曲线给你描述出来,呈现发展的历程;第二是预测,能够在当前分析的基础之上,预测它未来可能会发生什么,呈现事物发展的这么一个趋势。第三类就是所谓的指导性,指导性的就当前的态势,如果你做一个动作,会产生什么后果,这就便于当前的态势要做出决策,不仅是预测未来怎么样,而是做一个动作以后,做一个决策以后,会不会影响未来的结果。

当前的大数据应用的特点主要体现在预测性的应用较多,真正的指导性的应用则普遍偏少;另一方面从数据源的角度来看,基于单一数据源的数据偏多,基于多态数据源偏少。若想真正利用好大数据,则需深度挖掘数据,待真正实现数据智能,还需持续发展一段时间,请让我们拭目以待。