您的位置:

python图像识别猫狗的简单介绍

本文目录一览:

【代码阅读】vit做猫狗分类

exists:是否在目录存在时触发异常。

如果exist_ok为False(默认值),则在目标目录已存在的情况下触发FileExistsError异常;

如果exist_ok为True,则在目标目录已存在的情况下不会触发FileExistsError异常。

这里设置为true,表示目录存在的时候不触发异常,这样就不用检查目录是否存在

表示把train.zip解压到data目录下。

搜索文件的方式

利用了sklearn

函数sklearn.model_selection.train_test_split 用法

在使用python做机械学习时候,为了制作训练数据(training samples)和测试数据(testing samples),常使用sklearn里面的sklearn.model_selection.train_test_split模块。

train_test_split的使用方法:sklearn.model_selection.train_test_split(*arrays, **options)

train_test_split里面常用的因数(arguments)介绍:

arrays:分割对象同样长度的列表或者numpy arrays,矩阵。

test_size:两种指定方法。1:指定小数。小数范围在0.0~0.1之间,它代表test集占据的比例。2:指定整数。整数的大小必须在这个数据集个数范围内,总不能指定一个数超出了数据集的个数范围吧。要是test_size在没有指定的场合,可以通过train_size来指定。(两个是对应关系)。如果train_size也没有指定,那么默认值是0.25.

train_size:和test_size相似。

random_state:这是将分割的training和testing集合打乱的个数设定。如果不指定的话,也可以通过numpy.random来设定随机数。

shuffle和straify不常用。straify就是将数据分层。

包括

类需要包含

目的是的,对可以索引的数据,处理成多种方便读取方式

按照batch_size来读取(包装后,一次返回的不是一个数据,而是一个batch的数据)

按照是否打乱来读取,(如果打乱之后,返回的数据就是打乱之后的一个batch的数据,而不是之前没有打乱的连续数据,这样有助于送入训练的数据集分布更加均匀)

这里的Linformer,ViT都是从pip安装的库里面得到的,也可以自己写模型。

初始化efficient_transformer的参数

efficient作为参数和其他的参数一起初始化ViT模型

模型转到cuda上运行

其他优化算法包括:

opt_SGD = torch.optim.SGD(net_SGD.parameters(),lr=Learning_rate)

opt_Momentum = torch.optim.SGD(net_Momentum.parameters(),lr=Learning_rate,momentum=0.8,nesterov=True)

opt_RMSprop = torch.optim.RMSprop(net_RMSprop.parameters(),lr=Learning_rate,alpha=0.9)

opt_Adam = torch.optim.Adam(net_Adam.parameters(),lr=Learning_rate,betas=(0.9,0.99))

opt_Adagrad = torch.optim.Adagrad(net_Adagrad.parameters(),lr=Learning_rate)

补充知识:

PyTorch学习率调整策略通过torch.optim.lr_scheduler接口实现。PyTorch提供的学习率调整策略分为三大类,分别是

有序调整:等间隔调整(Step),按需调整学习率(MultiStep),指数衰减调整(Exponential)和 余弦退火CosineAnnealing。

自适应调整:自适应调整学习率 ReduceLROnPlateau。

自定义调整:自定义调整学习率 LambdaLR。

等间隔调整学习率 StepLR,等间隔调整学习率,调整倍数为 gamma 倍,调整间隔为 step_size。间隔单位是step。需要注意的是, step 通常是指 epoch,不要弄成 iteration 了。

按需调整学习率 MultiStepLR, 按设定的间隔调整学习率。这个方法适合后期调试使用,观察 loss 曲线,为每个实验定制学习率调整时机。

指数衰减调整学习率 ExponentialLR

余弦退火调整学习率 CosineAnnealingLR

自适应调整学习率 ReduceLROnPlateau

自定义调整学习率 LambdaLR

求一份计算机本科的毕业设计,题目只要计算机类的就可以

计算机毕业设计

基于Python的SIFT和KCF的运动目标匹配与跟踪 毕业论文+项目源码

基于Python决策树算法的学生学习行为数据分析 设计报告+代码及数据

基于Sring+bootstrap+MySQL的住房公积金管理系统 课程报告+项目源码及数据库文件

基于C++的即时通信软件设计 毕业论文+项目源码

基于JavaWeb+MySQL的图书管理系统 课程报告+项目源码及数据库文件

基于Android Studio+Android SDK的手机通讯录管理软件设计 课程报告+项目源码

基于JSP+MySQL的校园网上订餐系统 毕业论文+项目源码及数据库文件

基于AndroidStudio的花艺分享平台APP设计 报告+源码及APK文件

基于Python的酒店评论情感分析 课程报告+答辩PPT+项目源码

基于QT的教务选课管理系统设计与实现 毕业论文+项目源码

基于Android+Springboot+Mybatis+Mysql的个人生活APP设计 说明书+项目源码

基于Vue.js+Go的Web3D宇宙空间数据可视化系统 设计报告+前后端源码及数据

基于java+android+SQLite的保健型果饮在线销售APP设计 毕业论文+源码数据库及APK文件

基于Vue.js+SpringBoot+MyBatis+MySQL的高校综合资源发布分享社交二手平台 毕业论文+项目源码及数据库文件+演示视频

基于Delphi+MySQL的大学生竞赛发布及组队系统 设计报告+源码数据库及可执行文件+使用说明书

基于Android的名片信息管理系统设计与实现 毕业论文+任务书+外文翻译及原文+演示视频+项目源码

基于Python的电影数据可视化分析系统 设计报告+答辩PPT+项目源码

基于JavaWeb的企业公司管理系统设计与实现 毕业论文+答辩PPT+演示视频+项目源码

高校成绩管理数据库系统的设计与实现 毕业论文+项目源码

基于JavaWeb的家庭食谱管理系统设计与实现 毕业论文+项目源码及数据库文件

基于Python+SQLSERVER的快递业务管理系统的设计与实现 毕业论文+项目源码及数据库文件

基于Python的语音词频提取云平台 设计报告+设计源码

在推荐系统中引入 Serendipity 的算法研究 毕业论文+参考文献+项目源码

基于Html+Python+Django+Sqlite的机票预订系统 毕业论文+项目源码及数据库文件

基于Python的卷积神经网络的猫狗图像识别系统 课程报告+项目源码

基于C++的云安全主动防御系统客户端服务端设计 毕业论文+项目源码

基于JavaSSM的学生成绩管理APP系统设计与实现 毕业论文+答辩PPT+前后台源码及APK文件

基于JavaSwing+MySQL的清朝古代名人数据管理系统设计 毕业论文+任务书+项目源码及数据库文件

基于Python_Django的社会实践活动管理系统设计与实现 毕业论文

基于Servlet WebSocket MySQL实现的网络在线考试系统 毕业论文+项目源码

基于JavaWEB+MySQL的学生成绩综合管理系统 毕业论文+项目源码及数据库文件

基于SpringBoot+Vue和MySQL+Redis的网络课程平台设计与实现 毕业论文+任务书+开题报告+中期报告+初稿+前后台项目源码

基于Java的毕业设计题目收集系统 课程报告+项目源码

基于Java+Python+html的生产者与消费者算法模拟 毕业论文+任务书+项目源码

基于JavaWeb+MySQL的学院党费缴费系统 毕业论文+项目源码及数据库文件

基于Java+MySQL的学生成绩管理系统 毕业论文+任务书+答辩PPT+项目源码及数据库文件

基于Java+MySQL的学生和客户信息管理系统 课程报告+项目源码及数据库文件

基于Java的长整数加减法算法设计 毕业论文+项目源码

基于vue+MySQL的毕业设计网上选题系统 毕业论文+项目源码

基于背景建模和FasterR-CNN的视频前景和目标检测 毕业论文+答辩PPT+项目源码

基于Python的智能视频分析之人数统计的多种实现 毕业论文+答辩PPT+项目源码

基于C#+SQL server的校园卡消费信息管理系统 毕业论文+项目源码及数据库文件

Python如何图像识别?

1. 简介。

图像处理是一门应用非常广的技术,而拥有非常丰富第三方扩展库的 Python 当然不会错过这一门盛宴。PIL (Python Imaging Library)是 Python 中最常用的图像处理库,目前版本为 1.1.7,我们可以 在这里 下载学习和查找资料。

Image 类是 PIL 库中一个非常重要的类,通过这个类来创建实例可以有直接载入图像文件,读取处理过的图像和通过抓取的方法得到的图像这三种方法。

2. 使用。

导入 Image 模块。然后通过 Image 类中的 open 方法即可载入一个图像文件。如果载入文件失败,则会引起一个 IOError ;若无返回错误,则 open 函数返回一个 Image 对象。现在,我们可以通过一些对象属性来检查文件内容,即:

1 import Image

2   im = Image.open("j.jpg")

3   print im.format, im.size, im.mode

4 JPEG (440, 330) RGB

这里有三个属性,我们逐一了解。

format : 识别图像的源格式,如果该文件不是从文件中读取的,则被置为 None 值。

size : 返回的一个元组,有两个元素,其值为象素意义上的宽和高。

mode : RGB(true color image),此外还有,L(luminance),CMTK(pre-press image)。

现在,我们可以使用一些在 Image 类中定义的方法来操作已读取的图像实例。比如,显示最新载入的图像:

1 im.show()

2  

输出原图:

3. 函数概貌。

3.1    Reading and Writing Images : open( infilename ) , save( outfilename )

3.2    Cutting and Pasting and Merging Images :

crop() : 从图像中提取出某个矩形大小的图像。它接收一个四元素的元组作为参数,各元素为(left, upper, right, lower),坐标系统的原点(0, 0)是左上角。

paste() :

merge() :

1 box = (100, 100, 200, 200)

2   region = im.crop(box)

3   region.show()

4   region = region.transpose(Image.ROTATE_180)

5   region.show()

6   im.paste(region, box)

7   im.show()

其效果图为:

旋转一幅图片:

1 def roll(image, delta):

2     "Roll an image sideways"

3

4     xsize, ysize = image.size

5

6     delta = delta % xsize

7     if delta == 0: return image

8

9     part1 = image.crop((0, 0, delta, ysize))

10     part2 = image.crop((delta, 0, xsize, ysize))

11     image.paste(part2, (0, 0, xsize-delta, ysize))

12     image.paste(part1, (xsize-delta, 0, xsize, ysize))

13

14     return image

3.3    几何变换。

3.3.1    简单的几何变换。

1 out = im.resize((128, 128))                     #

2  out = im.rotate(45)                             #逆时针旋转 45 度角。

3  out = im.transpose(Image.FLIP_LEFT_RIGHT)       #左右对换。

4  out = im.transpose(Image.FLIP_TOP_BOTTOM)       #上下对换。

5  out = im.transpose(Image.ROTATE_90)             #旋转 90 度角。

6  out = im.transpose(Image.ROTATE_180)            #旋转 180 度角。

7 out = im.transpose(Image.ROTATE_270)            #旋转 270 度角。

各个调整之后的图像为:

图片1:

图片2:

图片3:

图片4:

3.3.2    色彩空间变换。

convert() : 该函数可以用来将图像转换为不同色彩模式。

3.3.3    图像增强。

Filters : 在 ImageFilter 模块中可以使用 filter 函数来使用模块中一系列预定义的增强滤镜。

1 import ImageFilter

2 imfilter = im.filter(ImageFilter.DETAIL)

3 imfilter.show()

3.4    序列图像。

即我们常见到的动态图,最常见的后缀为 .gif ,另外还有 FLI / FLC 。PIL 库对这种动画格式图也提供了一些基本的支持。当我们打开这类图像文件时,PIL 自动载入图像的第一帧。我们可以使用 seek 和 tell 方法在各帧之间移动。

1 import Image

2 im.seek(1)        # skip to the second frame

3

4 try:

5     while 1:

6         im.seek( im.tell() + 1)

7         # do something to im

8 except EOFError:

9     pass

3.5    更多关于图像文件的读取。

最基本的方式:im = Image.open("filename")

类文件读取:fp = open("filename", "rb"); im = Image.open(fp)

字符串数据读取:import StringIO; im = Image.open(StringIO.StringIO(buffer))

从归档文件读取:import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)

基本的 PIL 目前就练习到这里。其他函数的功能可点击 这里 进一步阅读。

python处理图片数据?

生成一张纯色的图片

先设置图片的颜色,接着利用Image模块的new方法新生成一张图片,png格式的图片需要设置成rgba,类似的还有rgb,L(灰度图等),尺寸设定为640,480,这个可以根据自己的情况设定,颜色同样如此。

批量生成图片

上面生成了一张图片,那要生成十张图片呢,这种步骤一样,只是颜色改变的,利用循环就可以解决。首先创建一个颜色列表,把要生成的图片颜色放进去。接着循环获取不同的颜色,保存的时候利用字符串拼接的方法改变图片的名字。

本地生成的图片

封装成函数

前面的方法已经可以批量生成图片了,为了通用性强一点,我们可以封装成函数,把哪些可以改变的参数单独抽离出来。尺寸也同样,使用的时候,可以根据自己的需要定义颜色列表和尺寸。当然还有加一些提示用语和报错兼容性,这里就不讲了。

本地生成的图片

猫狗识别问题属于

猫狗分类属于计算机视觉中图像分类的一个粗粒度的问题。

图像分类是指根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

图像分类核心是从给定的分类集合中给图像分配一个标签的任务。实际上,这意味着我们的任务是分析一个输入图像并返回一个将图像分类的标签。