学霸丰收今年,腾讯有这些论文收录进了全
美国即将举办IEEECVPR(ComputerVisionandPatternRecognition,即IEEE国际计算机视觉与模式识别会议)——全球计算机视觉顶级会议,相当于视觉人工智能的奥赛。参会的人就是你天天在用的美颜滤镜、人脸识别、车牌识别等等技术背后的学霸工程师。
为了让论文被大会收录,全球计算机视觉专家都会拿出大招去pk,平均录取率只有25%!
今年,腾讯有59篇论文被CVPR大会接收,其中腾讯优图实验室25篇、腾讯AILab33篇,腾讯手机管家1篇。而、年腾讯被收录的论文总数才分别有18篇和31篇,可谓进步神速。
这些论文涉及哪些“黑科技”
说起计算机视觉,不要整天想着美颜特效,这58篇论文的研究成果,涵盖深度学习优化原理、视觉对抗学习、人脸建模与识别、视频深度理解、行人重识别、人脸检测等热门及前沿领域。
它们极有可能在不远的将来激发更多的前沿研究,甚至悄悄进入我们的日常生活。
现在我们从优图实验室被收录的论文中拿几篇出来,大家体会一下。
姿势任你摆,认不出算我输其中一篇论文研究的议题是“软多标签学习的无监督行人重识别”(没看懂X1)。翻译成大白话就是:姿势任你摆,认不出算我输,安防找人很精准。
日常生活中的安防,摄像头往往有多个,怎么断定不同镜头里的人是同一个人?这对人类来说相对容易,但对AI来说有点超纲了。
(监控里的同一个人?)人脸识别?不行。因为每个摄像头拍到的人可能角度、光线、远近、清晰度和遮挡都不尽相同,甚至脸都看不清楚,人脸识别只能一脸懵逼。而单靠衣着打扮去推断也很容易出错,并不可取。
(方案示意图)优图实验室的学霸们想出的办法是,利用一个已知的参考人物,通过比较目标人物和参考人物的相似度,得到标准统一的软标签。然后不管TA是侧身,背对,还是歪着脸,一经对比就能推测是不是同一个人。
这就好比不管你美元、英镑、欧元、日元汇率怎么变,统统换算成人民币,“身价”完全一样的更可能是同一个人。
让你美颜变脸更easy现在打开相机,不开个美颜特效都不好意思说自己在拍摄了。然而,每一次美颜,要跟踪你的五官变化且保持特效不违和,其实手机也很累哒。
有没有办法让手机更轻松地进行跟踪,一边做出更完美的特效,一边多省点儿电让你多拍几张?
优图的工程师们觉得,必须有!
于是他们给CVPR大会交出了一份“基于自适应空间加权相关滤波的视觉跟踪研究”。
不懂的就脑补一下上面的腮红怎么跟踪的总之,经实验结果证明,优图提出的算法不但可以减少计算量,跟踪效果还可媲美现有的先进算法,并且达到了实时跟踪速度。
照亮你的美,暗光也清晰想必很多人都有这样的经验,一不小心把照片拍得特别暗,暗到会被打那种。比如这样↓↓↓
(模拟暗光照片)手动调整不太会,也不知道调到什么程度是合适的,调错了指不定又被打一顿。
没关系,人工智能照亮你的美。优图实验室的工程师们提出了一种“基于深度学习优化光照的暗光下的图像增强”方案。
方案设计了一个引入中间照明的网络模型,制定了一个损失函数,并准备一个张曝光不足的图像对数据集。
然后网络就开始玩儿命地学习各种照明下的暗光增强效果。在不算长的时间内,这个网络就能从幼儿园读到博士毕业,成为当今最优秀的“暗光增强博士”之一。
(暗光增强后效果示意图)平面X光机拍出三维CT的效果再介绍一个厉害的,它也许有机会成为医生的好帮手,并且帮助病人减轻经济负担和辐射伤害。
目前CT成像可以提供三维全景视角帮助医生了解病人体内的组织器官,协助疾病的诊断。
但是CT成像与X光成像相比,辐射剂量相对较大,并且费用成本较高。而造价便宜的X光机也无法像CT机一样围绕病人进行旋转采集影像。
(示意图)有没有办法让辐射更低、价格实惠的X光机也实现CT机的三维成像功能呢?优图实验室的工程师们给出了令人惊喜的方案:基于生成对抗网络的双平面X光至CT生成系统。
这个方案创新性地提出了一种基于对抗生成网络的方法,只使用两张正交的二维X光图片即可重建逼真的三维CT影像!
也就是说病人只要平躺拍一张X光,再侧躺拍一张,优图的算法就能把两张平面X光片融合成一张和CT相似的三维影像。
如果得以应用,在缺乏CT机的地区(毕竟两三百万一台,而X光机价格只有它的1/10不到),这项技术对医患双方都会是好消息
转载请注明:http://www.abuoumao.com/hykh/3711.html