周一至周五 | 9:00—22:00

云计算和大数据时代的信息安全

作者: 孔凡玉

  我今天主要讲的是云计算和大数据时代的信息安全。实际上云计算和大数据方面的信息安全比较广泛,因为信息安全牵扯到很多方面,包括系统漏洞,计算机的安全、以及数据安全等等。在这里我主要讲信息安全当中和密码技术相关的数字安全问题。
  我主要讲的是以下几个方面:第一,云计算和大数据的安全需求。第二,高性能、高可靠性的密码解决方案。第三,关于非结构化的搜索加密的问题。第四,云计算当中虚拟化环境受到的攻击。
  大数据信息安全需求
  首先,看一下云计算和大数据在信息安全方面的需求。现在,云计算和大数据主要特点,一方面是,超大规模。包括计算能力、存储、用户等等。另一方面是,资源共享。包括计算资源,存储资源,网络资源。
  在资源共享的同时,用户之间的隐私如何保护、多个虚拟机之间如何兼容,以及它们彼此之间数据的隔离性和安全性等问题,都是我们要思考的。云计算和大数据带来了一种海量数据的处理,特别是半结构化或者非结构化数据的处理。这是云计算和大数据带来的信息安全的需求。
  密码解决方案
  在信息安全领域密码技术是解决信息安全的技术之一,而且应该说是作为数据保密的一个最核心的技术。密码技术可以实现一个数据的保密加密,也可以实现身份的辨别。密码技术在信息领域提供了一些安全服务。现在,在云计算和大数据方面,包括安全多方计算,不经意传输,全同态紧密,代理重加密等,都成了密码专家研究的方向。数据库加密的问题,真正在实际当中使用,还是一些密码的使用技术,包括如何高性能实现密码运算。原来大家以为密码是数学家的问题,密码算法的安全性是一个数学证明,但最近十几年以来,工具越来越多,实际上我们为了攻破一个密码算法,或者把数据解密,不一定要攻击密码算法,也可采用一些旁敲侧击的算法来进行。
  在密码算法的基础上,我们要知道云计算和大数据与以前的信息系统相比,就是计算能力的提升,在这种情况下,在云计算的平台上部署一个密码算法或密码系统,就需要非常高的处理能力。比如说,关于大数据的加密,我们可以实现10Gbps的数据加减速度。SM2可以达到几万次每秒,这种高性能的运算能力,可以实现云计算和大数据后端的海量数据的加密,以及多用户的并行密码运算处理能力。
  我们认为数据的安全,首先是存储的安全,另外还有一个数据安全传输的概念。我们可以实现大数据,海量数据TB级的大数据文件的传输。
  从2004年开始,我们在开发云安全密码平台,我们开发这个平台实际的需求,是来自于金融、银行领域后端的一个密码算法的梳理能力的需求。现在这样一个平台,我们已经在中国建设银行、中国邮政储蓄银行,进行了全面的推广。大家现在有建设银行的卡和账户,实际上后端的处理、后端对银行卡身份信息的验证、以及后端取款、交易,都是调用我们的密码设定来实现数据安全的。我们这个平台主要就是把大数据量的密码设备融合在一个平台当中,实现一个高速的密码识别能力,以及密钥的统一管理。在这里它可以有密码卡、密码机,还可以部署一个CBN的系统,单点登录等等。它的客户端可以实现桌面的安全、桌面的加密、文件的安全传输,包括智能钥匙等等,这个平台上不但在银行里可以使用,它还可以在保险、大型企业、医疗等行业和领域中使用,这个是我们比较成熟,也是推广度较大的云安全密码服务。
  非结构化的搜索加密
  我们公司在比较前沿的云计算和大数据方面做了一些研究工作。这些技术和工作,有的我们已经形成了产品,有的还是作为一个技术来引领。
  第一部分,关于在云存储中的非结构化数据的加密。这些年以来,随着社交网络,各个行业信息化的发展,很多数据由原来单纯的数据表格的形式,变成了非结构化的数据和非结构化大文件的数据,这个时候,加密就成了一个问题。
  另外,随着云计算的发展,我们现在很多用户,不管是个人用户还是企业用户,都在建立云的存储平台,包括各种网盘,如360网盘或者百度网盘,大家都把自己的照片,把自己的文件存在网盘当中。在这种情况下,怎么保证远端云存储的安全,这是我们公司一直研究的问题。一种情况是,你放上去以后安全性是不可控的,完全是云服务厂商给你提供。他可以加密,也可以不加密,这个你是控制不了的。
  你把一个加密文件存在远端之后,你怎么获取?你在云端存储数据的时候,你可能存储了海量的数据,有一天我想获得其中一部分数据,这是一个解锁的问题。一个办法是,从云端把所有的数据全部下载下来,然后把数据全部解密,解密之后我得到想要的那部分,但是这种效率非常低。另一个办法是,需要把所有的文件都要下载下来,还要完成一个加密,这个对存储,对计算能力都具有非常大的挑战,效率非常低。
  现在,云存储方面可搜索的加密,是我们在做的一些密码的体制。我把很多的文件存在远端的云端,当我想得到某一个文件的时候,我可以进行搜索。
  自主研发的重要性
  现在,云计算非常大的一个特点就是虚拟化。一台服务器上可以有多个虚拟机,多个用户共享一台服务器中相同的CPU资源,相同的硬件设备。在这种情况下,虽然是云的操作系统,也给每个用户界定了不同的时间,或者一个氛围,但实际上它仍然存在一些攻击的问题。
  从1949年密码学成为一个学科以来,对密码算法的攻击始终有一批数学家在做相关研究。不过,从1997年以后,有一些密码学家开始提出一些涉及到攻击的问题,密码算法不再是单纯的数学问题,而是一个信息系统的问题。信息系统比如说要想攻击一个密码算法,要想获取用户密钥,我不需要从数学方法分析,可以通过信息系统进行分析。在运算的过程中,可以通过电磁辐射,通过用户CPU消耗的电量,通过声音,甚至通过加密的解密时间,包括一些热量等等,都可以获取。
  比如说,有个用户建立一个虚拟机,攻击者也是一个虚拟机,攻击者和虚拟机通过编写一些程序,可以获取在相同的服务器上运行的其他虚拟机的密钥。所以现在云计算环境当中,受攻击的可能性是非常大的。现在,国内的云计算产品,大部分还是采用了国际上的开源代码。在这种情况下,它受攻击的可能性非常大。只有能够自主开发云计算虚拟化的产品,才能保证能够抵抗攻击。
  国内也好,国际也好,采用了很多SL协议的代码,这是开源代码,一旦暴露出问题,大家谁都不能幸免。所以只有具备自主开发能力,才能保证信息安全。
   (根据孔凡玉在第七届中国信息主管年会上的演讲内容整理而成)


常见问题解答