- 专业代理经销各大品牌进品原装电子元器件 -

联系电话: 150-9999-8916

您的位置:首页  ->  公司动态

英特尔收购Movidius背后:为什么我们需要一款专门的CV处理芯片?


背景:科技界又迎来了一桩大额收购案,芯片巨头英特尔收购了硅谷计算机视觉领域的初创公司 Movidius,该公司主要产品为低功耗视觉处理器:Myriad 系列 VPU。今年八月,Intel还以 3.5 亿美元收购了主攻深度学习的公司 Nervana,这一笔收购能够让英特尔获得深度学习的 IP 和具体产品,从而满足 AI 开发及数据中心对芯片的强大需求。

(CVPR 全称为 International Conference on Computer Vision and Pattern Recognition,计算机视觉及模式识别大会。涵盖的问题包括但不限于:物体识别与检测、图像高级语义理解、人脸、优化方法、Correspondences求解、相机定位及三维地图构建(SLAM)。CVPR 是计算机视觉的最大的年度聚会,2016 年收到投稿 2,145 份,接受论文 643 篇,接收率 29.9%,与会人数达 3,600 人。)

在这场全球顶级的计算机视觉领域大会上,据不完全统计,大概有 70%以上的文章均与深度学习有关,在图像分类、物体检测、语义分割等领域,深度学习取得的效果已经大幅领先传 统算法。据微软亚洲研究院所述,即使是在 3D 视觉、底层图像处理等传统方法相对主流的领域也有不少学者给出了自己的基于深度学习的解决方案。

以手势识别为例,传统的识别方案大都基于颜色空间,如 RGB,HSV 及 YCrBr。但这些算法都无法排除类肤色物体及黑色皮肤对识别精度的干扰。也有些算法通过对手型轮廓特征进行提取从而完成识别,如 HoG+SVM 的分类识别方法,但仍然无法提高在暗光、逆光等条件下的识别精度。但借助深度学习,如通过 R-CNN 训练大量标注后的手势图像数据,得到的模型在处理带有复杂背景及暗光环境下的手势识别问题时,比传统方案的效果优秀很多。

一方面深度学习可以给计算机视觉领域带来空前的进步,但另一方面,该方法对硬件及数据的要求也是空前的。通过 R-CNN 网络训练一组手势,大概需要 10 万张预先标注好的图片资源,同时,在学习图像的过程中,它对 GPU 也有非常高的运算要求,训练时间也不容小觑。 即使已经在高性能平台得到了一个 R-CNN 或者 Faster R-CNN 的网络模型,在某些低运算能力平台(手机,平板)上运行识别算法时,也无法同时顾及到实时性和高识别率。比如,YOLO物体识别算法可以在高性能平台达到 45 FPS,但其 mAP 只有 63.4 左右。而 mAP 更优的 Faster R-CNN,却只有 7 FPS。

目前,如果想在手机等 GPU 性能很低的设备上运行深度学习算法,挑战还比较大,只有通过对算法的优化,才能使其在目前主流的Android、iOS 平台上运行。比如,在单目手势识别领域,全球范围内可给出商用解决方案的有来自以色列的 eyesight,superbreality 公司及Hand CV,其中,Superbreality 公司的解决方案更多依赖于对手势轮廓的识别,Hand CV 的解决方案则融合了颜色空间、轮廓及 YOLO 深度学习的方案。所以,通过机器学习来解决计算机视觉问题的思路已经逐渐转到了手机等移动平台上来。
[返回]   

联系我们

深圳市创达佳科技有限公司手机:15099998916
电话:0755-83007904QQ:2850419885地址:深圳市龙华区民治街道民康路蓝坤大厦602-610

联系我们,我们会第一时间为您排忧解难