大数据已经成为网络时代人类社会的重要资产,中国工程院院士李德毅在发言中指出,聚类成为发现大数据价值的第一步,大数据聚类也将成为很多行业的核心竞争力。
李德毅指出,尽管大数据在认知上具有挑战性,但是聚类将会成为大数据认知的突破口。 “物以类聚,人以群分”,是人类几千年来认识世界和社会的基本能力,是从大数据中发现价值必须面对的一个普遍性、基础性问题,是认知科学作为 “学科的学科”要解决的首要问题。认知科学要有所突破,首先要在大数据聚类上突破。
各行各业的大数据或宏观或微观的任何价值发现,无不借助于大数据聚类分析的结果,因此,数据分析和挖掘的首要问题是聚类,这种聚类是跨学科、跨领域、跨媒体的。大数据聚类是数据密集型科学的基础性、普遍性问题。
李德毅以汽车保险为例称,物联网时代,当汽车成为轮式机器人,成为大数据发生器以后,就是一个大数据发生体。每一次驾驶,每一次维修,每一次行 驶,甚至每一次刹车,都会记录在案。利用大数据聚类,保险公司可对一个车况好、驾驶习惯好、常走线路事故率低,不勤开车的特定客户,给予更大的优惠。而对 风险太高的客户则报高价甚至拒绝,总之能够给出包括保险费支付方式在内的个性化解决方案,这就颠覆了保险公司的传统商业模式。这就是大数据聚类能成为保险 公司核心竞争力的缘由所在。
李德毅同时提醒,通过大数据聚类即时发现价值,要充分认识大数据中的不确定性和价值的隐蔽性,只有跨界创新,跨界构建基于统计的可变视角和可变尺度的全新发现状态空间,用大数据的规模来保证发现价值的精准性,而习惯性认知或传统聚类工具难有创新。
李德毅认为,机器人既使用大数据也产生大数据,既是大数据的产物,也是大数据的推动者,机器人是大数据认知的典型代表。而在目前,无论是搬运、 码垛、研磨、抛光、挖掘等灰头土脸的工业机器人,还是微电子产品生产线上精细灵巧的机器人,机器人在我们的生产生活中已经随处可见。在不远的将来,还将有 更多工业机器人、农业机器人、医疗与健康机器人、服务机器人、太空机器人、国防机器人出现,可以说机器人时代真的来了。
李德毅指出,机器人革命是世界性的、时代性的。机器人换人首先不是换掉理发师之类的劳动者,而可能是产业工人、文秘人员、医生、服务员、甚至士兵,他们将升级转型成为机器人的创造者和使用者,成为懂得集成、维修、管理机器人的专业人才。