本文目录一览:
- 1、Python 图像识别 如何找出图像的中心点
- 2、怎么用python识别图像中的污点
- 3、如何通过python寻找背景图片的最小重复单元
- 4、python 区域找图是什么思路
- 5、Python如何图像识别?
- 6、python 根据绝对路径找图片,并把找到的保存在一个文件夹中
Python 图像识别 如何找出图像的中心点
用的 opencv 先灰度模糊,再二值化,找到图形轮廓最后确定中心点·~
怎么用python识别图像中的污点
第一步:查找图片在原始图片上的坐标点
第二步:将图片匹配的坐标点,转换为手机屏幕上实际的坐标点
第三步:优化,截取手机上部分区域图片,进行相似度匹配,提高匹配精度
如何通过python寻找背景图片的最小重复单元
这个问题跟image registration很相似 ,其实就是假设图像A和图像B之间存在一个平移(以及旋转)关系 ,使得平移后A和B重合的部分差别最小。
具体到这个问题, 只需要将源图像A和目标图像B都设成输入图像, 然后计算图像差的时候 。算平移后A和B重合的部分就可以了, 这样可以算出来一个平移向量, 有了平移向量之后, 在输入图像上面任意一点开始 ,这个点和他自身加上平移向量得到的点所围成的矩形一定是重复单元。
至于要最小重复单元, 只需要找到最短的平移向量就可以了, 不过需要去掉平凡解(零向量)。
以前看过image registration的东西有个快速的方法可以做到这一点。
先将源图片和目标图片降采样几次, 得到图像金字塔 先对金字塔顶端图片上寻找最佳匹配。 然后将最佳匹配对应的平移旋转参数作为初始估计, 再在下一层级的图像上再次估计 直到最后在原图像上估计。
python 区域找图是什么思路
可以参考如下代码:
import os
from time import sleep
from myopencv import Image
import X
import gdkutils
class XAuto:
_screensize = None
def __init__(self, tmp_img='/tmp/tmp%d.png' % os.getpid(),
default_threshold=0.7, default_rect=None):
self.d = X.Display()
self.tmp_img = tmp_img
self.default_threshold = default_threshold
self.default_rect = default_rect
def find_and_click(self, *args, back=False, **kwargs):
pos = self.find(*args, **kwargs)
if pos:
if back:
self.click_and_back(pos)
else:
self.click(pos)
return pos
def find_and_moveto(self, *args, **kwargs):
pos = self.find(*args, **kwargs)
if pos:
self.moveto(pos)
return pos
def click(self, pos=None, button=X.LEFT_BUTTON):
d = self.d
if pos is not None:
d.motion(pos)
d.button(button)
d.flush()
def wait(self, seconds):
sleep(seconds)
def click_and_back(self, pos, button=X.LEFT_BUTTON):
d = self.d
old_pos = d.getpos()
d.motion(pos)
d.button(button)
d.motion(old_pos)
d.flush()
def moveto(self, pos):
d = self.d
d.motion(pos)
d.flush()
def key(self, keyname):
d = self.d
d.key(keyname)
d.flush()
def find(self, img, threshold=None, rect=None, repeat=1, interval=0.2):
if isinstance(img, str):
img = Image(img)
if rect is None:
rect = self.default_rect or (0, 0) + self.screensize
if threshold is None:
threshold = self.default_threshold
tmp_img = self.tmp_img
for _ in range(repeat):
gdkutils.screenshot(tmp_img, rect)
sc = Image(tmp_img)
(x, y), similarity = sc.match(img)
if similarity threshold:
x += rect[0]
y += rect[1]
x += img.width // 2
y += img.height // 2
return x, y
sleep(interval)
return False
@property
def screensize(self):
return self._screensize or gdkutils.get_screen_size()
def __del__(self):
try:
os.unlink(self.tmp_img)
except OSError:
pass
def monitor_size(self, *args, **kwargs):
return gdkutils.get_monitor_size(*args, **kwargs)
Python如何图像识别?
1. 简介。
图像处理是一门应用非常广的技术,而拥有非常丰富第三方扩展库的 Python 当然不会错过这一门盛宴。PIL (Python Imaging Library)是 Python 中最常用的图像处理库,目前版本为 1.1.7,我们可以 在这里 下载学习和查找资料。
Image 类是 PIL 库中一个非常重要的类,通过这个类来创建实例可以有直接载入图像文件,读取处理过的图像和通过抓取的方法得到的图像这三种方法。
2. 使用。
导入 Image 模块。然后通过 Image 类中的 open 方法即可载入一个图像文件。如果载入文件失败,则会引起一个 IOError ;若无返回错误,则 open 函数返回一个 Image 对象。现在,我们可以通过一些对象属性来检查文件内容,即:
1 import Image
2 im = Image.open("j.jpg")
3 print im.format, im.size, im.mode
4 JPEG (440, 330) RGB
这里有三个属性,我们逐一了解。
format : 识别图像的源格式,如果该文件不是从文件中读取的,则被置为 None 值。
size : 返回的一个元组,有两个元素,其值为象素意义上的宽和高。
mode : RGB(true color image),此外还有,L(luminance),CMTK(pre-press image)。
现在,我们可以使用一些在 Image 类中定义的方法来操作已读取的图像实例。比如,显示最新载入的图像:
1 im.show()
2
输出原图:
3. 函数概貌。
3.1 Reading and Writing Images : open( infilename ) , save( outfilename )
3.2 Cutting and Pasting and Merging Images :
crop() : 从图像中提取出某个矩形大小的图像。它接收一个四元素的元组作为参数,各元素为(left, upper, right, lower),坐标系统的原点(0, 0)是左上角。
paste() :
merge() :
1 box = (100, 100, 200, 200)
2 region = im.crop(box)
3 region.show()
4 region = region.transpose(Image.ROTATE_180)
5 region.show()
6 im.paste(region, box)
7 im.show()
其效果图为:
旋转一幅图片:
1 def roll(image, delta):
2 "Roll an image sideways"
3
4 xsize, ysize = image.size
5
6 delta = delta % xsize
7 if delta == 0: return image
8
9 part1 = image.crop((0, 0, delta, ysize))
10 part2 = image.crop((delta, 0, xsize, ysize))
11 image.paste(part2, (0, 0, xsize-delta, ysize))
12 image.paste(part1, (xsize-delta, 0, xsize, ysize))
13
14 return image
3.3 几何变换。
3.3.1 简单的几何变换。
1 out = im.resize((128, 128)) #
2 out = im.rotate(45) #逆时针旋转 45 度角。
3 out = im.transpose(Image.FLIP_LEFT_RIGHT) #左右对换。
4 out = im.transpose(Image.FLIP_TOP_BOTTOM) #上下对换。
5 out = im.transpose(Image.ROTATE_90) #旋转 90 度角。
6 out = im.transpose(Image.ROTATE_180) #旋转 180 度角。
7 out = im.transpose(Image.ROTATE_270) #旋转 270 度角。
各个调整之后的图像为:
图片1:
图片2:
图片3:
图片4:
3.3.2 色彩空间变换。
convert() : 该函数可以用来将图像转换为不同色彩模式。
3.3.3 图像增强。
Filters : 在 ImageFilter 模块中可以使用 filter 函数来使用模块中一系列预定义的增强滤镜。
1 import ImageFilter
2 imfilter = im.filter(ImageFilter.DETAIL)
3 imfilter.show()
3.4 序列图像。
即我们常见到的动态图,最常见的后缀为 .gif ,另外还有 FLI / FLC 。PIL 库对这种动画格式图也提供了一些基本的支持。当我们打开这类图像文件时,PIL 自动载入图像的第一帧。我们可以使用 seek 和 tell 方法在各帧之间移动。
1 import Image
2 im.seek(1) # skip to the second frame
3
4 try:
5 while 1:
6 im.seek( im.tell() + 1)
7 # do something to im
8 except EOFError:
9 pass
3.5 更多关于图像文件的读取。
最基本的方式:im = Image.open("filename")
类文件读取:fp = open("filename", "rb"); im = Image.open(fp)
字符串数据读取:import StringIO; im = Image.open(StringIO.StringIO(buffer))
从归档文件读取:import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)
基本的 PIL 目前就练习到这里。其他函数的功能可点击 这里 进一步阅读。
python 根据绝对路径找图片,并把找到的保存在一个文件夹中
from PIL import Imageimport os.pathimport globdef convertjpg(jpgfile,outdir,width=1280,height=720): img=Image.open(jpgfile) new_img=img.resize((width,height),Image.BILINEAR) new_img.save(os.path.join(outdir,os.path.basename(jpgfile)))for jpgfile in glob.glob("D:/python/*.jpg"): convertjpg(jpgfile,"D:/newfile")
convertjpg调用时可以有四个参数,如convertjpg(jpgfile,"D:/newfile",800,600)
Image open了jpg用完后要不要close?