于人之思想中构建和平

广角

第四次革命

cou_03-18_big_data_01.jpg

《反思·二》(Reflection#2)巴西艺术家拉克尔·科根(Raquel Kogan)的装置艺术作品。计算机生成的数字投射在漆黑的房间,使

继互联网和移动互联网引发第三次工业革命之后,以大数据驱动的人工智能技术正在推动第四次工业革命,这可能会撼动全球平衡。

杨强;王超 担任采访

人工智能与大数据融合是如何兴起的?

人工智能与大数据崛起于21世纪初,当时新兴的搜索引擎Google和百度把人工智能驱动的推荐系统用在广告上,结果发现效果非常好,远远超过预期,而且数据越多,效果越好。但当时没有人意识到在其他领域也是如此。

真正的转折点是ImageNet的兴起。ImageNet是世界上最大的图像识别数据库,其设计初衷是用予视觉对象识别研究。该数据库由美国斯坦福大学和普林斯顿大学的计算机科学家建立,被公认为是深度学习革命的开始。ImageNet大量的图像数据把错识率降低了10%。由此表明,深度学习和大数据的融合可以帮助掌握极其复杂的计算。

 

您如何定义深度学习与大数据的关系?

如果人工智能系统设计得好,产品就会更加便于使用、更加精准,因此也更加有用,这样就会带来更多用户。随着用户量的增加,数据也会随之增加,这反过来又会改进人工智能系统。二者是一种互相强化的关系。

大数据和人工智能可以融合成为一种新的人工智能,称作“数据智能”。

 

您能定义一下什么是大数据思维吗?公司如何才能适应这种思维方式,需要做出哪些改变?

大数据思维,第一点就是有意识地去收集数据。也就是在开展业务之前,先要想好如何收集数据。

第二,数据收集和核心算法密切相关。要从算法当中了解自己缺少什么,然后有的放矢地去收集数据,包括收集不同来源的数据等。

第三,要形成一个闭环。软件系统提供的服务要能刺激来源产生更多的数据,而这些数据又能够回到系统当中,从而形成闭环。这就使系统能够实现持续的自我改进和自我完善。闭环需要采用特殊设计,它与以往商业所用的设计大不相同。

 

您能否进一步说明什么是人工智能与大数据的闭环设计?

首先要考虑的是数据提供方,比如用户。所有的用户行为都要以数据的形式记录下来。其次是服务提供方,比如像中国的移动钱包微信支付和中国电商网站淘宝。根据数据生成智能反馈,目的是了解用户的需求。用户将反馈数据提供给服务方,服务方又将服务数据提供给用户,这样就形成了闭环。

要想迅速发展,第一,闭环要足够短,最好不要有人的参与,因为有了人的参与,闭环就无法彻底实现自动化。第二,要经常更新环路,最好一天进行多次更新,因为这样才能确保系统不断得到更新。第三,必须持续进行更新,这样才能促使用户不断提供反馈。所以,这个过程总结下来就是三个字:短、频、快。

 

在您看来,这个闭环实际形成需要多长时间?

我认为,人工智能发展会分为两个阶段。第一个阶段是所有行业都会去尝试使用人工智能。例如,安保服务会用人脸识别技术,银行部门会用人工智能技术进行风控,等等。这些都是为现有产业服务的独特技术和解决方案。

第二阶段将会出现以人工智能为核心的全新产业。例如,将人工智能作为核心技术的银行,它在投资、服务、信贷等方面可以完全采用人工智能,只有在进行微调时才需要职员。此外,银行也有可能建立全新类型的客服系统。

我认为,第二阶段才是人工智能真正带给人类社会的未来形式。就像互联网刚刚兴起的时候,在第一阶段,传统书店做了一个网页,就认为自己是网上书店了,但事实并非如此。到了第二阶段,亚马逊之类的网站出现了,它们与传统书店完全不同。

 

大数据和人工智能的结合也可能给信息流通和社会公平带来威胁。如何保障大规模的数据正常流动,而又不侵害个人隐私呢?

利用大数据和人工智能技术创造出的产品,会带来极佳的新商业模式。但其大规模应用的前提是要确保用户隐私。这里有三点考虑:

首先,我们要有一套法律和社会规则来保护数据的所有权,明确数据在何处可用、在何处不可用。我认为,用户数据应当分门别类。比方说,红区数据不能动,黄区数据只让某些人接触,绿区数据则人人可用。当然,目前对数据的划分还莫衷一是。另外,也没有法律明确阐述责任人的定义,以及违反这些法律会受何处罚。

其次是从技术方面保护数据隐私。比如,第四范式公司(一家总部设在北京的人工智能技术服务提供商)目前正在研究用“迁移学习”来保护隐私,这是一个比较新的领域。它可以协助不同企业彼此交换数据,比如说,A做了一个模型,然后把这个模型迁移到B场景,数据不是在A和B之间直接交换,而是被载入了模型之中。这样就可以更好地保护用户隐私。

第三,我们需要深入研究用户隐私和数据定价。比如说,用户通过人工智能推荐系统在网上点击了一个广告,这个推荐系统是不是也应该从中得到一些好处呢?如果搜索引擎有收入,是不是应该分给用户一些?这些问题都值得探讨。

未来几年,人人都会认识到人工智能“落地”的重要性,我们需要更多地关注人工智能如何“落地”,以找到适合应用人工智能的领域。目前来看,金融、互联网和无人车都是比较适合人工智能“落地”的领域。

 

从全球角度来看,大数据和人工智能相结合会对发展中国家产生什么影响?

我认为大数据与人工智能技术可以使一些新兴国家赶上、甚至超过传统发达国家。因为在未来,经济竞争不仅仅是比拼金融和经济的规模,更重要的是比拼数据的规模,比拼拥抱数据经济的速度。比如说,中国互联网和移动互联网的迅速发展,使我们得以收集大量数据。这也将加速中国人工智能产业的发展,世界格局可能会因此而改变。

另一方面,一个国家如果已经拥有良好的基础设备和高质量的教育,就可以利用人工智能提高生产效率,就像当年的工业革命一样,蒸汽机的使用让一些国家得到了快速发展。

 

图片:Raquel Kogan

 

王超

王超(中国) 网易新闻智能工作室记者兼主管,负责报道人工智能领域的重大事件。