查看引用/信息源请点击:映维网
计算机视觉的用例几乎无穷无尽
(映维网2019年10月29日)计算机视觉应用程序通常需要处理多帧图像,入通过视频捕获的图像。这个处理过程最重要的其中一个方面是,能够在对象移动以及视口更改时识别和追踪对象。从机器人视觉处理和自动驾驶起到,到安全录像和增强现实,这种功能的用例几乎无穷无尽。
尽管这对于功能强大的移动处理器而言似乎微不足道,而且我们人类可以轻松实现,但要在数字世界中重现这一功能确实不易。高通的FelixBaum日前撰文向我们介绍这一领域所面临的挑战,以及潜在的解决方案。下面是映维网的具体整理:
1.运动帧的挑战
分析视频帧提出了大量的挑战,其中很大一部分是由于给定场景涉及的变量数十分巨大。以下是开发对象检测与追踪应用程序时应考虑的挑战:
对象转换:对象可以随时间平移,旋转和缩放。
对象遮挡:对象可能会被其他对象部分或完全遮挡。
运动模糊:根据诸如运动对象的速度,记录帧速率等因素,图像可能会变得模糊。
快速运动:对象在帧之间的转换速度可能非常快,并且会根据对象本身的速度,以及对象相对于帧捕获速率而变化。
场景混乱:场景可能包含复杂的特征和大量对象。
对象之间的相似性:诸如人脸之类的对象可能包含大量相似的特征,所以很难进行区分。
环境影响:照明,雨水和雾度变化等影响都会影响图像质量。
追踪失败:对象可能消失,然后全部或部分重新出现。解决这个问题需要重新检测对象。
摄像头转换:摄像头的位置,方向和视口设置会随时间变化。
幸运的是,社区已经开发了一系列的方法,而且由于边缘处理能力的提高,现在大量的方法已经变得可用。