数据思维有什么用处(什么是数据思维)

何为数据思维?可以从认识世界(构建模型)和改造世界(解决问题)的角度来理解。从数据的角度理解世界,世界是由实体和联系构成的,这些实体和联系可以使用E-R模型(entity-relationship model)等来刻画。据此,我们可以在数字世界里用数据来表达物理世界的对象和联系。也就是说,在数字世界中,可以有一种数字孪生体存在,物理世界对象的变化可以以数字的形式在数字世界中反映出来。因此,人们可以在数字世界里用工具去探索和认识物理世界,发现其规律,或者构建机器学习模型,去预测物理世界的变化趋势等。这种认识世界(用数据构建认识世界的模型)和改造世界(通过数据探索寻求解决问题的办法)的方法就是数据思维。学术界将这一方法称为第四科学范式,这是相对其他实验观察、理论推导和计算机仿真这三种传统的科学研究范式而言的。

数据思维与逻辑思维、算法思维、网络思维和系统思维相比具有明显的不同点。首先,逻辑思维强调的是解决问题的逻辑性和正确性,算法思维强调的是计算过程,网络思维强调的是关联,系统思维强调的是整体性。而数据思维强调的是物理世界和数字世界的反映性,数据是对物理世界的反映。其次,数据思维强调“依数据说话”,基于数据本身解决问题,因此,在解决问题时会先收集数据,然后在数据上探索数据,发现解决问题的途径。这与逻辑思维强调推理明显不同。这就是数据思维的独特性。

世界进入了数字时代,利用大数据解决复杂的问题已成为一种共识。物理世界的问题非常复杂,特别是人参与的社会系统的问题更为复杂,目前还缺乏有效的数学工具将其模型化。让数据成为物理世界的一种模型,在缺乏因果关系的情况下,发现一些关联关系,能部分地解决物理世界的难题,改善人们的生活。大数据在各行各业中的应用已经看到成效,可以相信,数据思维的重要性将会越来越明显。

数据思维有什么用处(什么是数据思维)(1)

每一种思维方法都包括三个部分:一个实例、思维要点和创新故事。小编也从这三个方面和大家探讨一下数据思维。

1.从一个实例看数据思维

例如航空联程设计:任意给出旅行的起点和终点,如何给出一个行程建议,使得在某些指标上“最短”?如果用传统办法,这是一个典型的图的最短路径问题,图的顶点就是机场,两个顶点之间的边对应两个机场之间的距离。这个问题可以用Dijkstra算法或者动态规划算法来求解。这个算法的复杂性对于大图来说还是有点高,如果节点数量过高,普通的服务器可能就算不出来了。对于这个问题,我们还可以采用数据思维来求解。我们可以记录物理世界中人们旅行的选择,构建旅客、机场以及旅客航程关系的数据模型,这是旅行大数据。我们只要根据此旅行大数据先搜索出全部的从起点到终点的旅行历史记录,然后用简单的统计方法,对最受欢迎的路线进行一个排序。这个结果就可以看作是过去旅客的经验选择,完全有理由推荐给客户,供他们选择使用。这样做的算法很简单。当然,我们还可以在旅行大数据上利用更复杂的数据挖掘和机器学习方法,来发现和探索规律,改进服务。

2.数据思维的要点

利用数据思维来求解问题的过程,包括以下几个要点:第一,数据采集与汇聚。为了解决复杂问题,首先需要采集能记录复杂问题所涉及的物理世界中有关对象实体和联系的数据,然后对采集的数据进行整理。第二,为了方便数据的使用和探索,需要对数据进行建模、组织和管理,各种数据管理工具应运而生。第三,数据分析与数据挖掘。探索数据是数据思维的基本活动,包括开发数据分析和数据挖掘软件发现数据中隐藏的规律,或者利用数据训练模型。尽管开发软件需要逻辑思维和算法思维等,但是数据思维体现的是一种黑客似的探索思维。第四,数据可视化。向用户提供图形化的结果展示工具。这种直观的展示分析结果,有利于人们理解结果、发现规律。

3.数据思维的创新故事

利用大数据进行创新的故事很多,各行各业都有。例如,吉姆·格雷(Jim Gray)通过将天文望远镜所拍摄的图片组织起来放到互联网上供网民访问,改变了天文学的研究范式;利用Freebase等开放资源获得超过15万欧洲历史名人的数据,可以从这些人的出生地和死亡地分析发现欧洲历史上“条条道路通罗马”的事实国。还有很多其他例子,例如通过基因测试收集人类基因数据,拓展了生物科学研究新领域;通过监控用户上网行为,对用户进行画像,并预测用户的行为,开发了精准营销新模式等。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页