使用Python以及工具包进行简单的验证码识别

2014-11-24 08:47:20 来源: 作者: 浏览: 0

使用Python以及工具包进行简单的验证码识别,直接开始。


原始图像


Step 1 打开图像吧。


im = Image.open('temp1.jpg')


Step 2 把彩色图像转化为灰度图像。彩色图像转化为灰度图像的方法很多,这里采用RBG转化到HSI彩色空间,采用I分量。


imgry = im.convert('L')


灰度看起来是这样的



Step 3 需要把图像中的噪声去除掉。这里的图像比较简单,直接阈值化就行了。我们把大于阈值threshold的像素置为1,其他的置为0。对此,先生成一张查找表,映射过程让库函数帮我们做。


threshold = 140
table = []
for i in range(256):
if i < threshold:
table.append(0)
else:
table.append(1)


阈值为什么是140呢?试出来的,或者参考直方图。



映射过程为


out = imgry.point(table,'1')


此时图像看起来是这样的




Step 4 把图片中的字符转化为文本。采用pytesser 中的image_to_string函数


text = image_to_string(out)


-->

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容: