概述
这个算法想法怎么来的呢?
看了
box formulation
既然approximate binary map只是 probability map和threshould map经过$\hat B$运算后的结果,他得到的只是一个“缩小版本”的文字区域。(会比真实区域缩进一圈)
那么,还需要一个box formulation骚操作,把他还原成真正的文本区域,这个骚操作到底是怎么做的呢?
参考
【文章】
- 论文地址
- DB/DBNet:Real-time Scene Text Detection with Differentiable Binarization一些问题
- 知乎-OCR相关之DBNET
- PSENet PANNet DBNet 三个文本检测算法异同
【代码】