AWS新服务GuardDuty和Macie,释放了机器学习在保护数据安全上的巨大能量。但您的企业适合采用这两种服务吗?
启用基于机器学习的云安全工具,比如AWS新服务GuardDuty和Macie,是AWS客户无需花费脑筋的自然选择。开启这些功能将会提升攻击难度,拦下一大部分攻击者,但无法抵御高端对手。
AWS Macie 于今年8月发布,在用户的亚马逊S3存储桶内容上训练,重点检测PCI、HIPAA、GDPR合规问题,发现可疑活动时向客户发出警报。AWS GuardDuty 是11月底发布的一项补充服务,采用机器学习分析 AWS CloudTrail、VPC Flow Logs 及 AWS DNS 日志。与Macie类似,GuardDuty也专注于异常检测,向用户报告可疑活动。
从技术角度来说,这简直令人惊艳。横向平台提供这样的服务,是其他人无法比肩的。
——《机器学习与安全》作者克拉伦斯·池奥
机器学习模型由算法和训练数据构成,其有效性取决于训练数据的优劣。这也是为什么基于机器学习的云安全更为卓越的原因所在。像亚马逊这样的云提供商,拥有对其整个网络的可见性,在训练机器学习模型分辨正常事务与恶意活动上更为便捷。算法从来不会保密太久或是什么长期专利,但数据源却是任何此类产品最宝贵的资产。
虽然企业间威胁情报共享变得越来越普遍,但单个企业可获得的数据的质量,远远及不上亚马逊之类的云提供商。这种有用威胁情报的集中,可能加速企业从数据中心迁移到云端的步伐。
不过,优势明显的同时,陷阱也是存在的。
机器学习提升了攻击难度
机器学习模型的优劣取决于其训练数据,但这也意味着对从未见过的东西——所谓“黑天鹅事件”,该模型不太有效。实事上,媒体对机器学习的描述有很多谬误。如果拨开所有炒作迷雾,机器学习给你的是自动化——你给它数据,它告诉你该找什么,而不是交给人类员工去仔细审查所有数据。
AWS首席信息安全官史蒂芬·施密特表示:“通过采用机器学习理解每家企业的内容和用户行为,亚马逊Macie可以洞穿海量数据,提供更好的可见性和更准确的警报,让客户得以专心保护敏感信息,而无需浪费时间去查找。”
Macie和GuardDuty这样的服务,能很好地捕获S3存储桶配置不当之类的低级错误,有效消除企业云数据面临的威胁。2017年发生的很多数据泄露事件,比如美国陆军/NSA情报与安全司令部(INSCOM)机密文件、美国选民数百万数据分析记录的曝光,以及威瑞森数据泄露事件,都可以由亚马逊基于机器学习的新云安全服务加以有效预防。
但同时,专家警告,机器学习对自适应敌手的分类,仍是未解决的问题;基于机器学习的云安全措施,对高端对手不太有效。
比如说,机器学习概率性分类恶意软件的能力,比之要么匹配要么不匹配的传统杀软恶意软件签名,是个巨大的进步。但基于机器学习的恶意软件检测,只能在一定程度上对不确定性进行分类。例如,“该可执行文件有80%的可能性是恶意的”。然后将该文件转给人类分析师做进一步检查。
专家警告,机器学习用于检测恶意活动仍处在起步阶段,尽管基于机器学习的云安全提升了攻击难度,该方法对攻击手段灵活多变的高端对手依然无效。异常检测说起来容易做起来难,总要在真正警报和误报率上做出平衡取舍。发现“异常”很容易,问题是几乎所有事情在某种意义上都是异常的。从异常中梳理出恶意事件,才是真正的挑战。
自适应对手什么样?
12月初发表的尖端研究中,麻省理工学院的研究人员展现了骗过谷歌InceptionV3机器学习图像分类器的能力。研究人员3D打印了一只海龟,从任何可能角度骗过了该机器学习模型,让其将之分类为一把来复枪。
如果在学校的研究人员都能骗过谷歌的尖端机器学习模型,基本可以想见,民族国家情报机构可能早已掌握该能力,并以之愚弄用于检测恶意网络活动的机器学习模型了。
或许你的威胁模型中没包括民族国家黑客,或者说你觉得自己不需要担心这个。但正如安全专家布鲁斯·施奈尔常说的,今天的学院派攻击,就是昨天的民族国家攻击,也是明天的犯罪攻击。攻击只会随时间进程越来越容易,从不会变得更难以执行。因此,我们可以预测,中期而言,普通罪犯都将能够骗你过基于机器学习的安全工具。
这并不意味着亚马逊的Macie和GuardDuty就没有价值,正好相反,防御性安全就是要提升攻击成本和难度,而这些基于机器学习的安全工具恰恰提供这一点。
拒绝炒作
机器学习与安全的交汇涌起了太多泡沫,我们需要理性视之。不要成为不加批判的狂热者(“AI是我们的救世主!”),也不要成为虚无主义的悲观者(“机器学习就是垃圾!”)。良莠不分全盘否定不是明智的做法,应教育用户提出问题,教育营销人员回答这些问题。
攻击速度只会越来越快,威胁情报总量只会越来越大。实时威胁评估及响应需要自动化。无论喜不喜欢,机器学习都将存在。
(责任编辑:安博涛)