Python深度学习之图像识别

2024-05-11

1. Python深度学习之图像识别

作者 | 周伟能 
来源 | 小叮当讲SAS和Python 
Python在机器学习(人工智能,AI)方面有着很大的优势。谈到人工智能,一般也会谈到其实现的语言Python。前面有几讲也是关于机器学习在图像识别中的应用。今天再来讲一个关于运用google的深度学习框架tensorflow和keras进行训练深度神经网络,并对未知图像进行预测。 
导入python模块 
 导入图像数据 
  合并列表数据 
 将图片数据转化为数组 
 显示一张图片 
    训练神经网络 
  我们可以看到测试集的准确率达到99.67% 
预测一个图像 
     预测为汽车的概率为100%。(括号内为真实标签) 
  预测为美女的概率为100%。(括号内为真实标签) 
  测试集中前15个图像预测完全正确。Nice! 
最后我们来识别单张图片。 
   结果预测为汽车。Nice! 
最后来预测一下外部随便下载的汽车或美女图片 
    预测为汽车,不错! 
小编这里有10张图片,前5张为汽车图片,后五张为美女图片。 
下面进行批量预测: 
  结果也是完全正确。 
看到这里,感觉神经网络是不是很神奇,要想让神经网络预测得准确,我们就必须给予大量的数据进行训练模型,优化模型,以至于达到准确识别图像的目的,图像识别作为人工智能的一部分,现在已经慢慢走向成熟,虽然机器也有出错的时候,但是进过不断优化,错误率将会越来越小,相信机器智能或者人工智能时代能够创造出更多智能而美好的东西。为社会,为人类的自由做出更大的贡献。 

Python深度学习之图像识别

2. 怎样使用Python图像处理

  Python图像处理是一种简单易学,功能强大的解释型编程语言,它有简洁明了的语法,高效率的高层数据结构,能够简单而有效地实现面向对象编程,下文进行对Python图像处理进行说明。
  当然,首先要感谢“恋花蝶”,是他的文章“用Python图像处理 ” 帮我坚定了用Python和PIL解决问题的想法,对于PIL的一些介绍和基本操作,可以看看这篇文章。我这里主要是介绍点我在使用过程中的经验。
  PIL可以对图像的颜色进行转换,并支持诸如24位彩色、8位灰度图和二值图等模式,简单的转换可以通过Image.convert(mode)函数完 成,其中mode表示输出的颜色模式。例如''L''表示灰度,''1''表示二值图模式等。
  但是利用convert函数将灰度图转换为二值图时,是采用固定的阈 值127来实现的,即灰度高于127的像素值为1,而灰度低于127的像素值为0。为了能够通过自定义的阈值实现灰度图到二值图的转换,就要用到 Image.point函数。
  深度剖析Python语法功能
  深度说明Python应用程序特点
  对Python数据库进行学习研究
  Python开发人员对Python经验之谈
  对Python动态类型语言解析

  Image.point函数有多种形式,这里只讨论Image.point(table, mode),利用该函数可以通过查表的方式实现像素颜色的模式转换。其中table为颜色转换过程中的映射表,每个颜色通道应当有256个元素,而 mode表示所输出的颜色模式,同样的,''L''表示灰度,''1''表示二值图模式。
  可见,转换过程的关键在于设计映射表,如果只是需要一个简单的箝位值,可以将table中高于或低于箝位值的元素分别设为1与0。当然,由于这里的table并没有什么特殊要求,所以可以通过对元素的特殊设定实现(0, 255)范围内,任意需要的一对一映射关系。
  示例代码如下:
  import Image   # load a color image  im = Image.open(''fun.jpg'')   # convert to grey level image  Lim = im.convert(''L'')  Lim.save(''fun_Level.jpg'')   # setup a converting table with constant threshold  threshold = 80 table = []  for i in range(256):      if i < threshold:         table.append(0)      else:          table.append(1)   # convert to binary image by the table  bim = Lim.point(table, ''1'')   bim.save(''fun_binary.jpg'')

  IT部分通常要完成的任务相当繁重但支撑这些工作的资源却很少,这已经成为公开的秘密。任何承诺提高编码效率、降低软件总成本的IT解决方案都应该进行 周到的考虑。Python图像处理所具有的一个显著优势就是可以在企业的软件创建和维护阶段节约大量资金,而这两个阶段的软件成本占到了软件整个生命周期中总成本 的50%到95%。
Python清晰可读的语法使得软件代码具有异乎寻常的易读性,甚至对那些不是最初接触和开发原始项目的程序员都 能具有这样的强烈感觉。虽然某些程序员反对在Python代码中大量使用空格。
  不过,几乎人人都承认Python图像处理的可读性远胜于C或者Java,后两 者都采用了专门的字符标记代码块结构、循环、函数以及其他编程结构的开始和结束。提倡Python的人还宣称,采用这些字符可能会产生显著的编程风格差 异,使得那些负责维护代码的人遭遇代码可读性方面的困难。转载

3. 如何python pil开发图像识别

1. 简介。
图像处理是一门应用非常广的技术,而拥有非常丰富第三方扩展库的 Python 当然不会错过这一门盛宴。PIL (Python Imaging Library)是 Python 中最常用的图像处理库,目前版本为 1.1.7,我们可以 在这里 下载学习和查找资料。
Image 类是 PIL 库中一个非常重要的类,通过这个类来创建实例可以有直接载入图像文件,读取处理过的图像和通过抓取的方法得到的图像这三种方法。
2. 使用。
导入 Image 模块。然后通过 Image 类中的 open 方法即可载入一个图像文件。如果载入文件失败,则会引起一个 IOError ;若无返回错误,则 open 函数返回一个 Image 对象。现在,我们可以通过一些对象属性来检查文件内容,即:
1 >>> import Image2  >>> im = Image.open("j.jpg")3  >>> print im.format, im.size, im.mode4 JPEG (440, 330) RGB
这里有三个属性,我们逐一了解。
format : 识别图像的源格式,如果该文件不是从文件中读取的,则被置为 None 值。
size : 返回的一个元组,有两个元素,其值为象素意义上的宽和高。
mode : RGB(true color image),此外还有,L(luminance),CMTK(pre-press image)。
现在,我们可以使用一些在 Image 类中定义的方法来操作已读取的图像实例。比如,显示最新载入的图像:
1 >>>im.show()2  >>>
输出原图:

3. 函数概貌。
3.1    Reading and Writing Images : open( infilename ) , save( outfilename )
3.2    Cutting and Pasting and Merging Images :
crop() : 从图像中提取出某个矩形大小的图像。它接收一个四元素的元组作为参数,各元素为(left, upper, right, lower),坐标系统的原点(0, 0)是左上角。
paste() : 
merge() :

1 >>> box = (100, 100, 200, 200)2  >>> region = im.crop(box)3  >>> region.show()4  >>> region = region.transpose(Image.ROTATE_180)5  >>> region.show()6  >>> im.paste(region, box)7  >>> im.show()

其效果图为:

旋转一幅图片:

1 def roll(image, delta):2     "Roll an image sideways"34     xsize, ysize = image.size56     delta = delta % xsize7     if delta == 0: return image89     part1 = image.crop((0, 0, delta, ysize))10     part2 = image.crop((delta, 0, xsize, ysize))11     image.paste(part2, (0, 0, xsize-delta, ysize))12     image.paste(part1, (xsize-delta, 0, xsize, ysize))13 14     return image

3.3    几何变换。
3.3.1    简单的几何变换。

1 >>>out = im.resize((128, 128))                     #2  >>>out = im.rotate(45)                             #逆时针旋转 45 度角。3  >>>out = im.transpose(Image.FLIP_LEFT_RIGHT)       #左右对换。4  >>>out = im.transpose(Image.FLIP_TOP_BOTTOM)       #上下对换。5  >>>out = im.transpose(Image.ROTATE_90)             #旋转 90 度角。6  >>>out = im.transpose(Image.ROTATE_180)            #旋转 180 度角。7 >>>out = im.transpose(Image.ROTATE_270)            #旋转 270 度角。

各个调整之后的图像为:
图片1:
图片2:
图片3:
图片4:
3.3.2    色彩空间变换。
convert() : 该函数可以用来将图像转换为不同色彩模式。
3.3.3    图像增强。
Filters : 在 ImageFilter 模块中可以使用 filter 函数来使用模块中一系列预定义的增强滤镜。
1 >>> import ImageFilter2 >>> imfilter = im.filter(ImageFilter.DETAIL)3 >>> imfilter.show()
3.4    序列图像。
即我们常见到的动态图,最常见的后缀为 .gif ,另外还有 FLI / FLC 。PIL 库对这种动画格式图也提供了一些基本的支持。当我们打开这类图像文件时,PIL 自动载入图像的第一帧。我们可以使用 seek 和 tell 方法在各帧之间移动。

1 import Image2 im.seek(1)        # skip to the second frame3 4 try:5     while 1:6         im.seek( im.tell() + 1)7         # do something to im8 except EOFError:9     pass

3.5    更多关于图像文件的读取。
最基本的方式:im = Image.open("filename")
类文件读取:fp = open("filename", "rb"); im = Image.open(fp)
字符串数据读取:import StringIO; im = Image.open(StringIO.StringIO(buffer))
从归档文件读取:import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)
基本的 PIL 目前就练习到这里。其他函数的功能可点击 这里 进一步阅读。

如何python pil开发图像识别

4. Python图像处理

创建一个简单的图像与图像混合
1.1 在Image模块中,提供了创建图像的方法。主要是通过**Image.new(mode, size, color)**实现,该方法传入三个参数:
mode:图像的创建模式
size:图像的大小
color:图像的颜色
用该方法可以创建一个简单的图像,之后我们可以通过save方法将图像保存:
1.2生成图片如下
1.3 图像混合
 透明度混合
透明度混合主要是使用**Image中的blend(im1, im2, alpha)**方法,对该方法的解释如下:
im1:Image对象,在混合的过程中,透明度设置为(1-apha)
im2:Image对象,在混合的过程中,透明度设置为(apha)
alpha:透明度,取值是0-1。当透明度为0是,显示im1对象;当透明度为1时,显示im2对象
代码实现如下
1.4原图和混合图的对比
1.5 遮罩混合
 通过Image.composite(im1, im2, mask)方法实现遮罩混合。三个参数都是Image对象,该方法的作用就是使用mask来混合im1和im2。
1.6im1、im2和遮罩混合效果对比如下

5. Python如何图像识别?

1. 简介。
图像处理是一门应用非常广的技术,而拥有非常丰富第三方扩展库的 Python 当然不会错过这一门盛宴。PIL (Python Imaging Library)是 Python 中最常用的图像处理库,目前版本为 1.1.7,我们可以 在这里 下载学习和查找资料。
Image 类是 PIL 库中一个非常重要的类,通过这个类来创建实例可以有直接载入图像文件,读取处理过的图像和通过抓取的方法得到的图像这三种方法。
2. 使用。
导入 Image 模块。然后通过 Image 类中的 open 方法即可载入一个图像文件。如果载入文件失败,则会引起一个 IOError ;若无返回错误,则 open 函数返回一个 Image 对象。现在,我们可以通过一些对象属性来检查文件内容,即:
1 >>> import Image2  >>> im = Image.open("j.jpg")3  >>> print im.format, im.size, im.mode4 JPEG (440, 330) RGB
这里有三个属性,我们逐一了解。
format : 识别图像的源格式,如果该文件不是从文件中读取的,则被置为 None 值。
size : 返回的一个元组,有两个元素,其值为象素意义上的宽和高。
mode : RGB(true color image),此外还有,L(luminance),CMTK(pre-press image)。
现在,我们可以使用一些在 Image 类中定义的方法来操作已读取的图像实例。比如,显示最新载入的图像:
1 >>>im.show()2  >>>
输出原图:

3. 函数概貌。
3.1    Reading and Writing Images : open( infilename ) , save( outfilename )
3.2    Cutting and Pasting and Merging Images :
crop() : 从图像中提取出某个矩形大小的图像。它接收一个四元素的元组作为参数,各元素为(left, upper, right, lower),坐标系统的原点(0, 0)是左上角。
paste() : 
merge() :

1 >>> box = (100, 100, 200, 200)2  >>> region = im.crop(box)3  >>> region.show()4  >>> region = region.transpose(Image.ROTATE_180)5  >>> region.show()6  >>> im.paste(region, box)7  >>> im.show()

其效果图为:

旋转一幅图片:

1 def roll(image, delta):2     "Roll an image sideways"34     xsize, ysize = image.size56     delta = delta % xsize7     if delta == 0: return image89     part1 = image.crop((0, 0, delta, ysize))10     part2 = image.crop((delta, 0, xsize, ysize))11     image.paste(part2, (0, 0, xsize-delta, ysize))12     image.paste(part1, (xsize-delta, 0, xsize, ysize))1314     return image

3.3    几何变换。
3.3.1    简单的几何变换。

1 >>>out = im.resize((128, 128))                     #2  >>>out = im.rotate(45)                             #逆时针旋转 45 度角。3  >>>out = im.transpose(Image.FLIP_LEFT_RIGHT)       #左右对换。4  >>>out = im.transpose(Image.FLIP_TOP_BOTTOM)       #上下对换。5  >>>out = im.transpose(Image.ROTATE_90)             #旋转 90 度角。6  >>>out = im.transpose(Image.ROTATE_180)            #旋转 180 度角。7 >>>out = im.transpose(Image.ROTATE_270)            #旋转 270 度角。

各个调整之后的图像为:
图片1:
图片2:
图片3:
图片4:
3.3.2    色彩空间变换。
convert() : 该函数可以用来将图像转换为不同色彩模式。
3.3.3    图像增强。
Filters : 在 ImageFilter 模块中可以使用 filter 函数来使用模块中一系列预定义的增强滤镜。
1 >>> import ImageFilter2 >>> imfilter = im.filter(ImageFilter.DETAIL)3 >>> imfilter.show()
3.4    序列图像。
即我们常见到的动态图,最常见的后缀为 .gif ,另外还有 FLI / FLC 。PIL 库对这种动画格式图也提供了一些基本的支持。当我们打开这类图像文件时,PIL 自动载入图像的第一帧。我们可以使用 seek 和 tell 方法在各帧之间移动。

1 import Image2 im.seek(1)        # skip to the second frame34 try:5     while 1:6         im.seek( im.tell() + 1)7         # do something to im8 except EOFError:9     pass

3.5    更多关于图像文件的读取。
最基本的方式:im = Image.open("filename")
类文件读取:fp = open("filename", "rb"); im = Image.open(fp)
字符串数据读取:import StringIO; im = Image.open(StringIO.StringIO(buffer))
从归档文件读取:import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)
基本的 PIL 目前就练习到这里。其他函数的功能可点击 这里 进一步阅读。

Python如何图像识别?

6. python可以用来处理图像吗

图像是理解世界的重要载之一,我们可以靠眼睛去发现!那没有眼睛的计算机是怎样看到并处理图像的?这次我们用Python编程语言进行实操,带你了解图像的基本知识、一起用Python进行编程。持续关注我,知识不断档。