通俗的理解,Region Proposal与Ground Truth之间总会存在误差,因此需要对Region Proposal进行微调,而BoundingBox回归就是用来微调这个窗口的。
Bounding Box
对于一个窗口,一般使用四维向量(x,y,w,h)来表示,分别表示窗口的中心点坐标以及宽高。如下图所示,P代表原始的Proposal,G代表Ground Truth,我们的目标是寻找一种关系使得P经过映射得到一个与G更接近的回归窗口。

BoundingBox回归的目的:给定,寻找一种映射
,使得
,并且
具体实现
线性回归就是给定输入的特征向量X,学习一组参数W,使得经过线性回归后的值跟真实值Y非常接近。
我们的目标是要学习得到,因为有了这四个变换值,我们就可以直接得到输出值
。为了能够学习这四个值,我们应该有四个标签数据,即G与P之间的变换系数,记G与P之间的平移量为
,尺度缩放为
。即:
那么,目标函数可以表示为,
是输入Proposal的特征向量,
是要学习的参数(*表示x,y,w,h,即每一个变换对应一个目标函数)。