栏目导航
最近推荐
热点信息

面部识别技术成为整个AI行业最为常见的技术应用之一


发布日期:2019-08-06 06:21   来源:未知   阅读:

  行业最为常见的技术应用之一;不过,在识别效率越来越高的同时,人们也开始担心面部识别技术发展过程中的隐私安全问题。比如说最近 IBM 利用 Flickr 下载的图片来进行面部识别训练,就引起了人们的质疑;NBC News 针对此事进行了详细的报道,雷锋网对这篇报道进行了不改变原意的编译。

  近些年来,面部识别技术得到了长足发展,除了帮你解锁iPhone,还能让执法机关在人山人海中“一眼”就认出犯罪分子,商店甚至用它来识别自己的“死忠”客户。不过,法律专家却警告称,大量未经允许滥用网络照片最终会画地为牢,反过来成为监控你的“帮凶”。

  现在的面部识别技术还不完美,它工作时靠的是算法,目标则很简单——认出那张独一无二的脸。

  想把这个任务完成好,技术人员就必须提前“喂给”算法“养料”,即天量的面部照片。那么这些照片从哪来呢?当然是互联网。

  起初,算法学习的照片都会按照不同的标准进行分类,比如年龄、性别、肤色等,但经过一段时间的学习后,它的能力开始变得有些吓人了,于是法律和人权专家开始大声疾呼,他们担心技术人员对普通人照片的滥用会带来“反噬”效果。

  “这是 AI 训练数据集背后的肮脏小秘密。技术人员可不管三七二十一,只要能用的照片他们都不放过。”纽约大学法学院教授 Jason Schultz 说道。

  最近 IBM 公司也进了“暴风圈”,今年 1 月它们向研究人员分享了自己的数据集,包含了 Flickr 上近 100 万张照片,虽然 IBM 号称此举是为了减少面部识别的偏差。

  了解真相后的摄影师们不愿意了,因为 IBM 在他们的作品上加了各种细节注释,包括面部几何结构、肤色等信息,而这些照片最终可能会成为面部识别算法的“养料”。

  “我拍过的人可没想过,自己的照片居然会被用在面部识别算法训练上。”公关经理 Greg Peverill-Conti气愤地说道,他有 700 多张照片被收录在了 IBM 的“训练数据集”中。“IBM 太草率了吧,它们怎么能不经同意就使用这些照片”。

  IBM 公司 AI 研究主管 John Smith 则表示,公司“致力于保护个人隐私”,如果谁想从数据集中移除照片,尽管联系 IBM。

  虽然 IBM 信誓旦旦的保证 Flickr 用户可以随时移除数据集中的照片,但事情哪有那么简单,这本就是个有来无回的“不归路”。因为 IBM 需要拍摄者发送想要移除图片的链接(光靠 Flickr 账号不管用),而它们却从没分享过到底这个数据集用了谁的 Flickr 照片,所以你大概率会被蒙在鼓里。

  对于这个数据集,IBM 有自己冠冕堂皇的理由——它将用于学术工作,且担负着让面部识别变得更加公平的重任。当然,在网络照片滥用方面,IBM 并不是独一家,数十家其他研究机构或公司也在采集网络照片训练自己的面部识别系统。

  一些法律专家认为,这不仅仅是对数百万人肖像权和隐私权的侵犯,它还加重了人们对面部识别技术的担忧,也许有一天执法部门会让它“双手沾满鲜血”。

  面部识别工具刚刚诞生时,研究人员会付钱请人来试验室“帮忙“,这些人拿钱办事,将自己不同姿态和光照角度下的照片留了下来以供研究之用。不过,这样的方案成本高还浪费时间,因此早期的数据集往往只有数百个样本。

  进入新世纪后,互联网飞速发展,研究人员突然意识到,面部识别的好时光来了,因为网上有天量的照片可供使用。

  “直接打开搜索引擎,输入名人的姓名,然后下载各种 360 度无死角的照片既可。”美国国家标准技术局数据集采集人员 P. Jonathon Phillips 说道。

  随着社交网络的兴盛和自媒体的发展,普通人的照片也突然多了起来。研究人员默认这些照片是对所有人开放的,有时他们甚至会从 YouTube 的视频中抓取面部图片。

  由于工作的非经营性质,学术人员用起照片来绝对是近水楼台,因为他们能绕过版权问题了,而 Flickr 的性质更是让它们成了研究人员绝对的安全之选。

  为了保证数据集的多样性,IBM 其实从 Flickr 上 Down 了超过 1 亿张照片,随后又精选了 100 万张有注释的面部照片。为了力求精确,它们甚至为这些照片定了 200 多种分类标准。

  谷歌学术指出,这种研究方法在业内几乎已经是尽人皆知,因为有数百篇学术论文都在靠照片采集来佐证自己的论点,没人敢说自己是完全清白的,或者拿到了授权或同意。因此,面部识别准确性的提高和分析工具的进步主要就是靠这些“野路子”来的照片。

  “要想让面部识别系统超常发挥,训练数据必须足够多样化,而且覆盖范围足够广。”IBM 的 John Smith 说道。

  在 IBM 看来,自己的数据集并未将图片中的人脸和具体的名字联系起来,这就意味着系统不会侵犯人们的隐私。不过,依然有人质疑 IBM 的动机,因为它们可是向政府出售过监控工具。

  举例来说,911 袭击发生后,IBM 就将面部识别技术卖给了纽约警方,执法部门通过搜索监控录像就能识别出特殊的肤色或发色。IBM 还曾推出过“智能视频分析”产品,它们能通过监控摄像头给人们加标签(亚裔、黑人或白人)。

  如今,IBM 则有了 Waston 视觉识别系统,通过图片算法就能识别出人的年龄和性别。配合正确的训练算法,客户就能从图片或视频中识别出特定的人。在被问到 Waston 用了什么训练数据时,IBM 称数据有多个来源,不过却拒绝披露具体的数据来源,并美其名曰保护知识产权。

  一再逼问下,IBM 称从 Flickr 拿到的相片数据集仅用于研究,不会用来提升公司的商用面部识别工具。不过,有专家指出,类似 IBM 和 Facebook 这样的公司,其研发和商业运营部门之间的界限非常模糊,而且研发部门的知识产权均归 IBM 所有。因此,面部识别公司 Kairos 前 CEO Brian Brackeen 断言,即使学术部门研发的算法有其非商业化性质,这些算法最终还是会被拿来赚钱。

  他还打了个形象的比喻,“你可以把它看做拿面部识别技术洗钱,公司将网上的照片洗成了自己的知识产权。”

  澳大利亚摄影师 Georg Holzer 将自己的作品上传 Flickr 是为了记录自己声明中的精彩瞬间,他也签署了创意认证,只要是非营利性项目,就能免费使用他的照片。不过,他没想到自己的照片会成为面部识别技术的“养料”。

  “我了解技术能造成的伤害。”Holzer 说道。“当然,面部识别技术也有其积极的一面,但如果用得不对,它也能剥夺人的基本权利和隐私。我是无法接受这项技术广泛应用的。”

  “我觉得 IBM 可不是家慈善公司,最终它们还是会用这项技术牟利,所以面部识别技术还是会进入商业市场。”Holzer 说道。

  Dolan Halbrook 也有 452 张照片被 IBM 的数据集“侵吞”,他也认为 IBM 在使用这些照片时应该征得自己的同意。

  当然,也有摄影师觉得自己的照片能被 IBM 选中并用在推动面部识别发展上是一大幸事。

  瑞士的 Guillaume Boppe 就表示:“如果我的照片能帮助 AI 进化,降低探测错误率并最终提升全球安全指数,我举双手赞同。”

  如果你不同意 IBM 将自己的照片当成训练数据,也可以联系它们删除,但操作起来没那么容易。一位被抓取 1000 多张照片的摄影师忙活了半天,也只删除了 4 张照片,因为他无法找到所有照片的链接,而 Flickr 账号 IBM 可不认。

  此外,即使从 IBM 的数据集中删除了照片,IBM 研究伙伴拿到的数据集也无法一并删除(已经有 250 多家组织和机构接入了 IBM 的数据集)。

  好在,各国对隐私数据的保护正在加强。举例来说,欧洲就将照片看做“敏感个人数据”,如果 IBM 不按规定删图,可能就会被欧盟重罚。在美国,也有一些州有了相关规定,在不征得当事人同意的情况下采集、存储和分享生物信息属违法行为,而生物信息包含指纹、虹膜和面部几何结构等。

  近期,芝加哥的律师 Jay Edelson 就向 Facebook 发起了集体诉讼,称其面部识别工具触犯了相关法律。

  文章出处:【微信号:WW_CGQJS,微信公众号:传感器技术】欢迎添加关注!文章转载请注明出处。

  这一研究的目标是通过单张图像输入,对图像中的物体进行检测、获取不同物体的类别、掩膜和对应的三维网格,....

  研究人员首先充分考虑了水下成像过程中的波长相关衰减、光散射和水体的影响,合成了丰富的数据用于模型训练....

  数据增强广泛是机器学习中常用的数据处理手段,不同的数据集通常会利用针对性的数据处理手段来处理。例如M....

  获取图像的方式有两种,第一种是直接从源头获取,通过对接前端各类相机、NVR录像存储等设备。第二种是间....

  为了能够使得输入图像兼容更多的网络,预处理时对图像的高和宽进行了限制,使其能够被16整除。确保网络中....

  不同工作采用的数据集,验证方法,性能指标,数据预处理步骤都不同,这使得性能对比很困难,无法确定哪个工....

  面部识别技术的发展突飞猛进,对于普通大众来说,最常见的是解锁手机,但事实上它能做的远不止这些。

  7月21日凌晨,谷歌硬件官方推特“Made by Google”在官微突然发布了自家最新旗舰Pixe....

  在继电器模块的另一侧,将负极直流电源连接到电磁门锁的负极。将来自直流电源的正极连接到继电器模块的公共....

  随着机场智慧安防系统体系的建立,生物识别技术将会更好地为机场安全保驾护航。

  SEAT在IBM云上发起由Watson人工智能驱动的“移动顾问”概念验证

  IBM正不断强化AI和大数据存储解决方案,以便客户充分利用本地和云中日益增长的数据。近日,IBM宣布....

  碳原子呈六角形网状键合的材料“石墨烯”具有很多出色的电特性、热特性以及机械特性。具体来说,具有在室温下也高达20万cm2/Vs以...

  我们惊讶地发现BERT在参数推理理解任务中的峰值性能达到77%,仅比平均未经训练的人类基线个点。....

  研究人员表示,由于“高效计算”组件和技术的使用,再加上新的定制数据集,他们训练出的最佳性能模型:双视....

  训练语料库:Wikipedia + BooksCorpus,在处理Wikipedia时使用了与BER....

  第二步 配置 1、 vi /var/mqm/.bash_profile#编辑bash_profile文件 PATH=$PATH:/opt/mqm/samp/bin:/opt/...

  截至2019年6月30日的六个月期间营收总计373亿美元,同比下降4%。

  1969年7月20日,就在距离阿姆斯特朗迈出“人类一大步”约122米的月球上空,登月舱里突然响起了刺....

  本文讲了50年前的今天,一个叫尼尔·阿姆斯特朗(Neil Alden Armstrong)的宇航员走....

  什么叫好企业,好企业的标准是什么?这是一个争论不休的话题,在中国企业自己写的报告中,可能我们都是好企....

  7月18日,IBM在南京成功举办2019 IBM Systems 科技论坛,本次论坛聚焦“现代”、“....

  Barminco、印度斯坦锌业公司、佩特拉钻石公司和韦丹塔锌业国际借助山特维克与IBM的合作关系,提....

  泰克公司最近宣布首款经验证采用 IBM 8HP 硅锗 (SiGe) BiCMOS 特殊工艺技术设计的新型示波器平台ASIC各项技术指...

  本次大赛面向的是内地和港澳地区高等院校、专业研究机构、数据分析公司、开发者等举办的大型数据创新类竞赛....

  据国外媒体报道,由微软与IBM等大公司力推的网络服务目录UDDI计划迟迟不见起色,厂商不仅要克服技术障碍,还得面对市场转...

  这次的实战使用的数据是交通标志数据集,共有62类交通标志。其中训练集数据有4572张照片(每个类别大....

  图1:常用跟踪数据集统计示意图。包括OTB-2013、OTB-2015、TC-128、NUS-PRO....

  同理,由于谷歌官方发布的BERT-base(Chinese)中,中文是以字为粒度进行切分,没有考虑到....

  为了能够更准确地构建模型,现在机器学习应用通常要处理大量的数据并生成多种特征,这已成为必要的。而 P....

  为什么要权衡这些问题其实不难理解,我们需要保持一致的环境,避免大型数据集跨不同集群之间的传递。此外,....

  虽然目前声纹识别还没在智能手机这样的消费级产品中普及,但其实在银行交易和国防安全等领域已经广泛应用。

  随着 AI 技术的不断发展与落地,有越来越多的平台和工具可供大家使用,这些平台针对不同领域、不同层次....

  近日,IBM宣布了一系列创新举措。这些举措旨在帮助客户通过AI和数据分析,从更多不同来源与类型迥异的....

  进入2019年,IBM第一季度营收再次下滑,且积极推动迈向云转型的业务出现下滑,来自云和数据平台营收....

  “百年老店”IBM完成了其历史上最大的一笔并购——以340亿美元全现金交易完成对开源解决方案供应商红....

  IBM完成收购后将拥有自己的专有存储产品和红帽的开源存储产品集了,此时IBM将如何抉择这两种提供存储....

  这项研究来自Netflix的高级数据科学家Amir Ziai,他正在斯坦福大学攻读AI专业研究生。Z....

  要知道 Faster R-CNN已经是2015年提出的论文了,而YOLOv3发表出来也已经一年多了。....

  我们可以将这些取值分为不同的集合类,在每一类中,我们记录属于该类结果的次数。例如,我们可以投1000....

  cnn_learner 使用来自给定架构的预训练模型构建CNN学习器、来自预训练模型的学习参数用于初....

  首先我们来看 panda 包里面的 read_csv() 函数,它可以将时间序列数据集(关于澳大利亚....

  在FRVT评测中,测试集是完全不公开的,只有简略的几段话描述。这意味着FRVT用的不是传统那种通过在....

  Google AI最新研究用无监督数据增强推进半监督学习,取得令人瞩目的成果

  谷歌的结果促进了半监督学习的复兴,而且还发现3点有趣的现象:(1)SSL可以匹配甚至优于使用数量级更....

  预测价格对数和真实价格对数的RMSE(均方根误差)作为模型的评估指标。将RMSE转化为对数尺度,能够....

  IBM数据储存始终站在时代前沿,发现 2019 年最主要的存储趋势和预测,了解如何充分使用和优化数据....

  当今时代,数据已经成为企业最重要的资产,这使得存储不再只是大型企业的需求,成长型企业对存储的需求同样....

  近日,IBM与红帽宣布,IBM以每股现金190美元,完成对红帽所有已发行和流通在外普通股的收购交易,....

  日前,IBM柔性显示器设备专利曝光,屏幕尺寸有三种变化。据外媒报道,近日,IBM柔性显示器设备专利曝....

  IBM具有开创性的工作开始于1997年在整个行业中采用铜线取代铝线进行布线,这一创新使电流阻抗立即...

  Motorola/IBM PowerPC 6XX微处理器的仿真和分析解决方案

  The attached pdf is a Product Overview of the emulation and analysis solutions available for the Motorola/IBM Po...

  Motorola/IBM PowerPC 740/750微处理器的仿真和分析解决方案

  Motorola/IBM PowerPC 740/750微处理器的仿真和分析解决方案...

  Motorola/IBM PowerPC 603微处理器的仿真和分析解决方案

  Motorola/IBM PowerPC 603微处理器的仿真和分析解决方案...

  Motorola/IBM powerPC 740/750微处理器的仿真解决方案

  Motorola/IBM powerPC 740/750微处理器的仿真解决方案...

  Motorola/IBM PowerPC 740/750微处理器的仿真和分析解决方案

  The attached pdf file is a Product Overview of the emulation and analysis solutions available for the Motorola/IBM...

管l家婆今期玄机图  |   香港管家婆彩图大全集  |   188555管家婆一句活赢钱  |   www.587118.com  |   www.559339.com  |  


Power by DedeCms