BoundingBox回归

2019-11-11

通俗的理解，Region Proposal与Ground Truth之间总会存在误差，因此需要对Region Proposal进行微调，而BoundingBox回归就是用来微调这个窗口的。

Bounding Box

对于一个窗口，一般使用四维向量(x,y,w,h)来表示，分别表示窗口的中心点坐标以及宽高。如下图所示，P代表原始的Proposal，G代表Ground Truth，我们的目标是寻找一种关系使得P经过映射得到一个与G更接近的回归窗口 $\hat{G}$ 。

BoundingBox回归的目的：给定 $(P_x,P_y,P_w,P_h)$ ，寻找一种映射 $f$ ，使得 $f(P_x,P_y,P_w,P_h)=(\hat{G_x},\hat{G_y},\hat{G_w},\hat{G_h})$ ，并且 $(\hat{G_x},\hat{G_y},\hat{G_w},\hat{G_h})\approx(G_x,G_y,G_w,G_h)$

具体实现

由P变为 $\hat{G}$ ，基本思路是：平移+尺度缩放。

1.先做平移 $(\Delta x,\Delta y)$ ， $\Delta x=P_w d_x(P)$ ， $\Delta y=P_h d_y(P)$ ，则：

$\hat{G}_x=P_w d_x(P)+P_x$ ， $\hat{G}_y=P_h d_y(P)+P_y$

2.再做尺度缩放 $(S_w,S_h)$ ， $S_w=exp(d_w(P))$ ， $S_h=exp(d_h(P))$ ，则：

$\hat{G}_w=P_w exp(d_w(P))$ ， $\hat{G}_h=P_h exp(d_h(P))$

线性回归就是给定输入的特征向量X，学习一组参数W，使得经过线性回归后的值跟真实值Y非常接近 $Y\approx WX$ 。

我们的目标是要学习得到 $d_x(P),d_y(P),d_w(P),d_h(P)$ ，因为有了这四个变换值，我们就可以直接得到输出值 $\hat{G}$ 。为了能够学习这四个值，我们应该有四个标签数据，即G与P之间的变换系数，记G与P之间的平移量为 $(t_x,t_y)$ ,尺度缩放为 $(t_w,t_h)$ 。即：

$t_x=(G_x-P_x)/P_w$

$t_y=(G_y-P_y)/P_h$

$t_w=\log(G_w/P_w)$

$t_h=\log(G_h/P_h)$

那么，目标函数可以表示为 $d_*(P)=w_*^T\Phi_5(P)$ ， $\Phi_5(P)$ 是输入Proposal的特征向量， $w_*$ 是要学习的参数(*表示x,y,w,h，即每一个变换对应一个目标函数)。

$d_*(P)$ 是得到的预测值，我们想让预测值与真实值 $(t_x,t_y,t_w,t_h)$ 的差距尽量小，则可以用均方差作为Loss函数。

缺失模块。
1、请确保node版本大于6.2
2、在博客根目录（注意不是yilia根目录）执行以下命令：
npm i hexo-generator-json-content --save

3、在根目录_config.yml里添加配置：

  jsonContent:
    meta: false
    pages: false
    posts:
      title: true
      date: true
      path: true
      text: false
      raw: false
      content: false
      slug: false
      updated: false
      comments: false
      link: false
      permalink: false
      excerpt: false
      categories: false
      tags: true

<br><br><br>愿你我都被世界温柔以待<br><br>QQ:969406418<br>欢迎交流