2023数博会现场丨中国工程院副院长、院士吴曼青:数据空间引领数字技术体系创新

2023-05-26 13:06

5月26日上午,2023中国国际大数据产业博览会在贵阳开幕。本届数博会以“数实相融 算启未来”为年度主题,围绕一会、一展、一发布、一大赛,以及商贸投资洽谈开展相关活动。

在2023数博会开幕式上,中国工程院副院长、院士吴曼青以《数据空间引领数字技术体系创新》为主题发表主旨演讲。他将数据空间未来的特征归结为四句话“数据一切,计算赋能,引领变革,定义未来”。吴曼青表示,发展数据空间,形成创新共识,构建技术体系,引领产业发展,是数字中国建设的重大技术需要,也是实现科技自立自强的战略抓手。

今天,我汇报的题目是《数据空间引领数字技术体系创新》。大家都知道,我们经历了农业社会、工业社会,到了信息社会,迎来了信息革命的伟大时代。信息革命应该始于1958年第一块集成电路的发明,在这样一个发展过程中,有一些标志性的重大事件值得我们记忆。第一个是1958年发明集成电路,第二个是1965年4月19日摩尔提出了著名的摩尔定律。摩尔定律改变了我们的世界,也必将改变我们的未来。第三个是1991年《科学美国人》杂志发表的一篇或者一期专刊,题目就是《网络空间:人类未来将在其中生活、奋斗或成长》。大家可以看到,预言变成了今天的现实。2008年发生了三件伟大的事件,第一件事是城市人口首次超过农村人口,这是人类文明的重大变化;第二个是机器连接数量超过了人上网的数量;第三个是移动连接的数量超过了固定上网的数量,由于这样的连接,将给我们社会带来很大变化。

同时,在同一天也发生了三件大事,第一件就是1965年4月19日,摩尔提出了著名的摩尔定律,第二件大事就是2016年习近平总书记亲自主持召开网络安全和信息化工作座谈会,在这次会议上提出了著名的论断,网信事业代表着新的生产力、新的发展方向,应该也能够在践行新发展理念上先行一步。2018年4月20日召开了网络安全和信息化工作会议,习近平总书记在这次会议上提出了网络强国战略思想。

我想,同一年发生的三件大事、同一天发生的三件大事,必将载入信息革命的史册。因为这样的变化,我们社会将变成人、机、物互联的世界,这个世界将是一个端到端的数字连接复杂的网络空间,其背后更多彰显了节点和连接的力量。我经常讲,节点更多强调自主性、竞争力和独特价值,连接更多强调协同性,由于节点和连接存在,使得我们未来社会呈现出复杂的一体化的世界,我自己把这个世界定义有这样几个特征:网络一切、虚实交融、时空压缩、协同共享、深入智能。

这样一个机会给中华民族带来千载难逢的历史机遇。习近平总书记指出,“当今时代,数字技术作为世界科技革命和产业变革的先导力量,日益融入经济社会发展各领域全过程,深刻改变着生产方式、生活方式和社会治理方式。”我们学习习近平总书记的重要讲话,就在思考中国需要创造什么样的数字技术、实现自立自强、成为先导力量,引领深刻变革?今天主要是汇报这样一些学习的体会。

大家都知道,信息革命来临以后,信息技术蓬勃发展,数字技术像雨后春笋般出现,各种各样技术层出不穷,我个人把它叫做云里雾里,更重要的是不成体系,要抓的时候无从下手,一个东西没有抓好,Chat GPT就来了。可是我又在想,在变化大背景下是不是有一些不变的东西呢?我们要回归到事物本质,变或不变仍然归结这样几个大要素:网络、数据、计算、安全和服务,这是永远不会变的,而变的是网络技术的演变,比如从面向链接到面向业务,再面向多个多元应用,协议也在变,但是,网络的根本,连接各种要素和连接功能是不会变的。

第二个是数据组织变化,过去可能把数据变成知识,我们把它叫做符号化的知识,后来是结构化、半结构化的数据,到了这个时代,我们还很难对数据下一个定义,是叫非结构化吗?是不是可以叫做数据键等等?大家都有不同看法,但是数据组织在悄然发生变化,过去从规则、逻辑、方程到数据库,到了现在,我个人把它定义叫做数据场,我后面会汇报我们的学习体会。同时,我觉得数据抽象结果也是不一样的,从文件到网页,到数据要素,到广普关联,都在发生深刻变化。

第三个是计算处理的变化,刚才杰克·唐加拉先生发表了非常好的演讲,我们看到,过去我们的计算更多的是对知识的计算,这种知识更多地沉淀在某一个公式、某一个理论当中,我们就是计算这样一个东西,到了后来,我们计算产生的更多的信息,到了现在,我们可能更多的是对数据的计算,所以我觉得,计算经历了从计算知识——计算信息——计算数据的不断演化,当然,我觉得这里面很有意思,要让计算机懂得一个公式,第二步是让计算机懂得信息是什么,而现在在数据要素流通过程中我们要让计算机懂得信息数据有什么价值。

刚才我们特别看到杰克·唐加拉先生的演讲是在数值计算方面取得了很大的成就,他的另外一个贡献就是对世界的高性能计算机进行排名并发布了一个标准,这当然也会让我们感到既有欣慰的一面,我们中国有很多台计算机都在全球的十强之中,我们注意到,我们不同的超算应对计算的单元是不一样的,从太湖之光用的是自己的CPU,自己定义的互连结构,到国防科技大学是英特尔的CPU自己定义的互联,其实这些都是不断创新的过程。

再一个是安全范式的变化,从“物理安全+功能安全”,到“网络安全+信息安全”,现在我们要关注“网络安全+数据本身”的安全。我们需要人机互联,需要面向多元应用,需要让数据流通起来,需要让数据场把数据管理起来,同时要实现智能化服务计算,这些是不是构建了当代绿色数字技术的基因,需要我们自由创造,实现中国方案。那什么是不变的呢?人、机、物在互联过程当中,数据产生自人、机、物,也将最终作用于人、机、物,当然,这个过程当中是对数据的深度技术,作用于人、机、物的数据已经发生了根本变化。

我在想,在这样一个相互作用过程当中是不是有一个数据场的存在,如果实体空间有引力场的话,电磁空间有电磁场的话,那么数据空间是不是有一个数据场的存在?我们也在组织一批科学家在研究什么叫数据场,什么叫场,什么叫空间,等等,这些都是值得我们研究的重大议题。我个人试图把数字空间做一个空间,人机物品德国网络互联,产生了大量的数据,形成了复杂的网络空间,由于数据的产生、流通、聚合、使用,最终在数据场的作用下形成了数据间,数据空间具备新型的本体、结构、运算和要素价值体系,在数据空间内容的数据对象广谱广联、数据要素有序流通、数据价值聚变释放。

我对数据空间未来的特征归结为四句话,叫“数据一切,计算赋能,引领变革,定义未来”。我觉得一切都可以用数据表达,其实我们身处数据的海洋,所以我把它定义为数据一切。在这个过程当中,刚才杰克·唐加拉先生也说到,顶部有足够的空间,底部有更大的作用,我个人觉得,网络空间有更大的发展空间。在这个过程当中价值创造有一点不太一样,如果说网络空间价值涌现是裂变这种方式来描述的话,其实就是我们追求无限扩大信息可达空间,就是把信息送到更多用户当中,遵循的梅特卡夫定律,网络空间价值与用户数平方呈正比,我发现数据空间价值涌现有很大的不同,它可能叫做聚变,我大胆地预测,数据空间的价值与数据要素广谱关联数平方呈正比。

某种意义上,我们对数据的聚变、对数据计算是希望有更多发现,产生更多的智慧。同时,在数据空间当中可能会有这样一个效应,一方面是高性能计算的不断演进,从过去加速芯片到TPU到现在的GPU,另外一方面,我们可以看到,深蓝系统到现在的Chat GPT,其实都是在不断循环,在互相交织,中间流淌的是数据。由此我们可以看到,计算能力的创新和新型智能的涌现将变成一个双螺旋效应。

那何以能支撑数据空间的存在呢?我们注意到,国家刚刚发布了数据要素基础制度二十条,我认为这是一个伟大的变革,伟大时代的来临,从制度层面对数据要素流通提供很好的环境,我们作为工程科技者思考的一个问题,支撑基础数据要素制度改革或者执行、发展的工程技术体系是什么样的体系呢?这里我想讲一个有趣的创新,大家都知道现在比较火爆的ChatG PT大模型,有一位首席科学家叫艾力克斯,它用显卡推动计算,由此就推动了TPU、GPU的发展,这是一个非常有趣的现象。我们老是在说CPU计算东西,美国有CPU之后,我们复制一个,其实不同于CPU的PU是什么,这是值得我们关注的。

刚刚在比利时开了一个会议,是Imec公司召开的,他们的标题讲“那个时代一去不复返”,我改为了“一个新的开始”,现在保持计算速度呈指数级增长唯一方法是一种称为系统技术协同优化的方案,它能够将芯片分解成它们的功能组件,为每个功能使用最佳的晶体管和互联网技术并将它们重新拼接在一起,以创建一个功耗更低、功能更好的整体。其实这就是一个面向未来需求的系统观念整体解决方案,由此构建完整的技术体系。我想表达的是,变之不变,我们能不能在变之不变的过程中找到或者创新出中国自主的技术体系。

数据空间需要研究的问题包括基本内涵、数理基础、工程科技、体系构建、基础设施、赋能服务、数据之治等。我们工程院就这个重大问题在开展战略咨询研究,也主办的一次首届数据空间大会,最终想支撑数字中国基础设施、基础制度的全面建设。最后我想用这段话结束我的发言。发展数据空间,形成创新共识,构建技术体系,引领产业发展,是数字中国建设的重大技术需要,也是实现科技自立自强的战略抓手。我们一直在努力,谢谢各位。

戳这里,有更多关于数博会和前沿科技的消息↓