如果包含表格线,OCR 美国服务器的识别就降低,请教下大侠,如何剔除图片中的表格线
ps 橡皮擦?
画图,选择
首先,把图像旋转,旋转正以后分别计算整个图像每一行每一列的像素值之和 sum
由于黑色是全 0,把那些 sum 值过低的行或者列挑出来,改成全 1
这样表格线就消除了,难点是如何判断已经旋转正了
有专门的表格 OCR
卷积 L
转正,取阈值,然后横向一个比文本宽的 kernal open 一下得到横线,纵向 kernel open 一下得到纵线,两个并集得到表格的 mask,再减一下
感觉算法滤波可以去除
厉害,感谢了朋友