国际新闻

您所在位置:首页 > 国际新闻 > 正文

AI是婴儿、数据是奶粉,奶粉质量差怎么办?看这份治理报告

文章作者:www.hg-tex.com发布时间:2019-09-11浏览次数:1946

原标题:AI是婴儿,数据是奶粉,奶粉质量差吗?请参阅此治理报告

南都新闻记者冯群星语音助手“檐”用户,招聘算法歧视女性.人工智能带来方便,也因数据采集和使用不当而多次曝光丑闻。如何平衡数据安全和技术发展? 8月30日,网络研究院和上海冠安信息技术有限公司在2019年世界人工智能大会上发布了《人工智能数据安全风险与治理》报告(以下简称“报告”)并提出了建议。

数据是人工智能开发和应用的基础。人工智能算法模型的训练需要大量标记良好的数据作为支持。 “如果人工智能是婴儿,数据就是奶粉。宝宝不健康,最重要的不是奶粉的量,而是奶粉的质量。”在会议期间,有客人对图像进行了比喻。

然而,随着越来越多的数据被收集并用于人们的社交生活,数据安全问题对人工智能的发展构成了挑战。根据该报告,人工智能面临的数据安全挑战包括三个方面:数据隐私问题,数据质量问题和数据保护问题。

数据隐私问题是指在人工智能的开发,测试和操作过程中存在的隐私侵权。目前,通常会违反规则获取用户数据并过度收集用户的敏感信息。在面部识别的情况下,在2019年3月,小发猫未经用户同意,在照片共享网站Flickr上使用了近一百万张照片。

数据质量问题主要是指人工智能训练数据集的质量问题和收集的现场数据。该报告指出,这是人工智能所特有的一类问题。训练数据集的规模,多样性和平衡性不足,标签质量低,数据攻击都会影响人工智能系统的性能,降低系统的可靠性和安全性。

例如,在2016年的AI选美比赛中,该系统选出了44名获胜者,但黄色和黑色比赛分别只有6名和1名。该系统的负责人表示,这是因为该系统的训练数据集缺乏足够的种族多样性。

第三个数据安全挑战是数据保护,涵盖数据收集,传输,存储,使用和流程的整个生命周期,以及人工智能开发和应用的所有方面。例如,在智能扬声器的场景中,需要将用户的语音请求转换为数字信号并将其发送回云,并且在传输过程中可能存在数据泄漏的风险。

幸运的是,许多公司已经开始致力于技术推广上述问题。例如,Google开发了一种称为联合学习的技术,通过确保算法不断更新来保护用户的隐私,同时确保所有培训数据都保留在用户的设备上,而无需上传到云端。

报告指出,人工智能的数据安全管理是一个系统工程,有必要从法规,标准,技术等各个层面寻求对策。政策制定者需要加快现有法规的更新和改进,并形成相关的安全要求,指南,技术规范和标准。

报告还建议进一步开放政府数据,鼓励公共部门,私营部门和行业之间的数据共享,以提高整个人工智能行业的隐私保护水平。建立了人工智能的公共数据资源库,标准测试数据集和对抗数据集,供人工智能开发人员使用,以解决培训和测试的源合法性和质量问题。回到搜狐看看更多

负责编辑:

2019-08-30 21: 10

来源:南方都市报

原标题:AI是婴儿,数据是奶粉,奶粉质量差吗?请参阅此治理报告

南都新闻记者冯群星语音助手“檐”用户,招聘算法歧视女性.人工智能带来便利,也因数据采集和使用不当而多次曝光丑闻。如何平衡数据安全和技术发展? 8月30日,网络研究院和上海冠安信息技术有限公司在2019年世界人工智能大会上发布了《人工智能数据安全风险与治理》报告(以下简称“报告”)并提出了建议。

数据是人工智能开发和应用的基础。人工智能算法模型的训练需要大量标记良好的数据作为支持。 “如果人工智能是婴儿,数据就是奶粉。宝宝不健康,最重要的不是奶粉的量,而是奶粉的质量。”在会议期间,有客人对图像进行了比喻。

然而,随着越来越多的数据被收集并用于人们的社交生活,数据安全问题对人工智能的发展构成了挑战。根据该报告,人工智能面临的数据安全挑战包括三个方面:数据隐私问题,数据质量问题和数据保护问题。

数据隐私问题是指在人工智能的开发,测试和操作过程中存在的隐私侵权。目前,通常会违反规则获取用户数据并过度收集用户的敏感信息。在面部识别的情况下,在2019年3月,小发猫未经用户同意,在照片共享网站Flickr上使用了近一百万张照片。

数据质量问题主要是指人工智能训练数据集的质量问题和收集的现场数据。该报告指出,这是人工智能所特有的一类问题。训练数据集的规模,多样性和平衡性不足,标签质量低,数据攻击都会影响人工智能系统的性能,降低系统的可靠性和安全性。

例如,在2016年的一次人工智能选美比赛中,该系统选出了44名获奖者,但黄色和黑色分别只有6名和1名。该系统负责人说,这是因为该系统的培训数据集缺乏足够的种族多样性。

第三个数据安全挑战是数据保护,涵盖了数据采集、传输、存储、使用和流动的全生命周期,以及人工智能开发和应用的各个方面。例如,在智能扬声器的场景中,需要将用户的语音请求转换为数字信号并传输回云端,在传输过程中可能存在数据泄漏的风险。

幸运的是,许多公司已经开始致力于技术推广上述问题。例如,谷歌开发了一种称为联合学习的技术,通过确保算法不断更新,同时确保所有训练数据都保留在用户的设备上,而不被上传到云端,从而保护用户的隐私。

报告指出,人工智能数据安全管理是一项系统工程,必须从法规、标准、技术等多个层面寻求对策。政策制定者需要加快现有法规的更新和完善,形成相关的安全要求、指南、技术规范和标准。

报告还建议,进一步开放政府数据,鼓励公共部门、私营部门和工业部门共享数据,提高整个人工智能行业的隐私保护水平。建立了人工智能公共数据资源库、标准测试数据集和对抗数据集,供人工智能开发人员使用,解决训练测试的源合法性和质量问题。返回搜狐查看更多信息

责任编辑:

免责声明:本文仅代表作者本人,搜狐是信息发布平台,而搜狐只提供信息存储空间服务。

人工智能

数据

数据集

奶粉

隐私

阅读()

——