别让商务大数据的思路,误了工业大数据(2)

  工业大数据体现价值的场景有哪些?

价值是用户决定的。一杯水,放在沙漠里可以救命,剩在餐桌上就是垃圾。工业大数据也是一样,能否创造价值,首先是要看用在什么场景中。

笔者认为,用户对工业大数据提不出需求,是客观现实的真实反映。大数据有用,但合适的应用场景不一定是现在。下面分析几个有用的场景:

质量要求高的生产场景。制造业从什么时候开始重视数据?显然,当我们追求高质量、高稳定性的时候,数据会显得非常重要,数据的价值才得以体现。国外先进企业追求6Sigma(一种改善企业质量流程管理的技术,主要强调通过制定极高的目标、收集数据以及分析结果,来减少产品和服务的缺陷),故而强调数据的重要性;许多企业一味追求低成本,数据的重要性自然就会低。

高度自动化及智能化的生产场景。在高度自动化和智能化的生产单元,人的介入很少,对质量的要求一般也很高。这时,对设备健康状态和产品质量的自动监控就变得非常重要。

工业互联网的场景。工业互联网能使成千上万用户的数据实现共享。多个用户的共享会带来两个过去无法企及的效果。首先是分析结果的可靠性上升。这得益于来自不同用户的实例,可用于对分析结论的重复性认证。其次是分析结果可以在众多的用户中分享,以创造更大的价值。

在当今的中国企业中,符合上述要求的场景是不多见的。多数企业重视成本远甚于质量,智能制造和自动化的水平低,工业互联网尚未起步。由此可见,对中国多数企业来说,工业大数据的价值很可能只是“未来时”,虽然这个未来可能并不遥远。

  推进工业大数据现在该做啥?

马云策划淘宝的年代,笔者正在浙江大学攻读博士学位。记得那时学校的网速只有每秒100个字节———这件事启发我们:机会往往发生在条件不太成熟的时候。所以,创新者的起步一定要早。在工业大数据全面应用之前,是我们培养能力、积累技术的时候。

但是,仅起步早是不够的,关键还要走对路子。正如培根所说:“跛足而走对路的人,胜过健步如飞却误入歧途者。”怎样尽早抓住机会呢?笔者认为,可以从以下几个方面做起:

一是理解工业大数据的本质作用

对企业来说,大数据用得好坏的关键是看能否创造出高于成本的价值。所以,笔者赞同从功能的角度定义工业大数据:大数据是过程(生产制造、研发服务、采购销售)痕迹的数字化记录,目的是为“用数据说话”奠定基础,是对已有系统所产生的数据的二次利用。

这意味着,工业大数据平台的建设,应该高度重视数据的组织,避免遗漏重要的数据以及数据之间的联系。例如,实时的设备状态和工艺参数应该与所生产的产品准确对应,相关的时钟不能混乱。

二是以方便“人”的分析为出发点

在商务大数据中,很多人强调机器学习,强调从大量数据中获得规律性、重复性的知识。对于工业大数据,这种认识要做调整:工业知识主要来自人脑,数据的作用是对已有认识的确认、分辨与准确化。这就意味着,大数据平台的要点是方便人从事分析工作。而人的分析工作往往是针对特定事件驱动的。

使得这些过程做到透明化,提高管理水平,通过更有效的管理创造效益。这样,建立大数据平台的一个重要任务是:让相关过程显性化,避免人陷落在信息和数据的海洋中,丧失关注的焦点。按照这个观点,在工业领域,“知识自动化”的重点应该是知识的管理,而非知识的发现。

三是正确认识工业大数据的知识发现

如前所述,由于工业数据体现出来的规律性往往难以突破人已有的认识范围,发现规律性的知识(如工艺与质量之间的关系)是比较困难的。然而,工业大数据往往适合发现另外一类知识,即从数据中提炼信息的知识,将物理量的检测数据转化成产品质量、能耗、效率、设备状态等信息的“软测量”算法,其实就是这种类型的知识。这些知识往往是生产技术人员并不熟悉的盲点。故而,从数据研究者的角度看,它们属于容易出成绩的领域。

过去,学术界对这些问题很热衷,企业却不重视,因为这种知识很难创造价值。不能创造价值的原因,是未能将其纳入管理或者控制的流程中,故而创造价值的途径不畅通。为此,企业可能会需要一个平台,以便将这些知识转化成数字化的模型,并纳入生产制造等流程中,以便创造经济价值。

四是注重与智能制造的结合

在笔者看来,数字化、网络化引发的智能制造大体是这样一个逻辑:信息驱动知识,在决策过程中创造价值、体现智能。其中,信息来自供应链、客户、智能设备、物联网,知识表现为软件化的模型,决策则包括自动或人工的管理与控制。

如前所述,工业大数据在这个逻辑中有两个重要作用:获取“从数据提炼成信息的知识”;决策和专业知识主要来自人脑,但需要用大数据将其验证、矫正和精确化。

五是加强数据分析可靠性理论研究

在工业系统中,可靠分析的结果才有使用价值。可靠性分析原本是统计理论的重要组成部分。但用于大数据明显是不合适的。这些理论的基本假设条件往往都是不成立的。而且,许多理论和著名观点也造成了大量的误导,如盲目强调分析结果的准确性、认为大数据强调相互关系而轻视因果等。

大数据的因果分析是个十分需要重视的领域,但过去主要是科学、哲学研究的范畴,统计学家对其重视不足。笔者认为,其实,可以从杜绝假象、通过证伪等思路来逼近因果。也就是说,重点分析那些容易导致错误结果的情况。同时,逻辑链的完整性和证据的独立性也很重要。

笔者认为,数据的质量和完整性是导致分析错误的重要诱因。因此,建立大数据平台时,不仅要关注数据本身,更要关注数据之间的对应性;不仅要关注数据是什么,还要关注数据的采集过程。数据的采集过程不同,意味着内涵发生了变化。如果数据质量不高,大数据很可能是一堆垃圾。这样看来,盲从商务大数据“非结构化”的观点也是不对的。

(责任编辑:安博涛)

分享到:

更多
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
  • 微笑/wx
  • 撇嘴/pz
  • 抓狂/zk
  • 流汗/lh
  • 大兵/db
  • 奋斗/fd
  • 疑问/yw
  • 晕/y
  • 偷笑/wx
  • 可爱/ka
  • 傲慢/am
  • 惊恐/jk
用户名: 验证码:点击我更换图片
资料下载专区
图文资讯

2016年软件即服务发展的五大主题

2016年软件即服务发展的五大主题

对于2016年软件即服务(SaaS)我并没有什么伟大的预言,也没有深邃的远见或是史诗般的猜...[详细]

从生产安全体系视角看数据安全

从生产安全体系视角看数据安全

互联网的发展一日千里,安全技术随着互联网的发展,出现的新场景、新技术、新名称都越...[详细]

RSA 2019大会最值得关注的10个网络安全趋势

RSA 2019大会最值得关注的10个网络安全趋势

RSA2019大会本周开幕,来自八家知名网络安全厂商的高官们谈到了他们期待在今年大会上...[详细]

Gartner:政府部门2019年将重点投资「数据

Gartner:政府部门2019年将重点投资「数据分析与网络安全」的技术

数字化转型时一场长期竞赛,2018年数字化转移面临的主要挑战是缺少用于支持数字化转型...[详细]

区块链正在应用于正在兴起的网络安全运动

区块链正在应用于正在兴起的网络安全运动

尽管有关加密货币和交易所的黑客和欺骗的新闻铺天盖地,但事实仍然是,真正的区块链在...[详细]

返回首页 返回顶部