• 0

    用户访问量

  • 0

    注册用户数

  • 0

    在线视频观看人次

  • 0

    在线实验人次

Matplotlib绘图 折线图的函数定义及属性说明
Matplotlib绘图折线图的函数定义及属性说明:定义:折线图,就是将多个(x,y)点,连接起来,生成一个折线图。下面给出该函数的常见调用形式:plot([x],y,[fmt],data=None,**kwargs)函数用于绘制一条折线图,x若省略,则plot函数自动创建从0开始的x坐标;fmt是字符串类型,用于描述颜色标志线型属性的值,格式为:'[color][marker][line]';kwargs用于设定线型、线宽、坐标点的标志等等图形的其他属性。plot([x],y,[fmt],[x2],y2,[fmt2],...,**kwargs)#用于绘制多条折线图折线图的常见调用形式:plot(x,y,label='FirstLine',color='r',linewidth=2,linestyle='-',marker='*',markersize=12)或者写成:matplotlib.pyplot.plot(x,y,'r*-',label='FirstLine',linewidth=2,markersize=12)
作者:云创智学 来源:云创智学 发布时间:2022-01-14 10:02:17
Matplotlib常用函数介绍
Matplotlib常用函数介绍:Matplotlib库中提供的Matplotlib.pyplot模块,能够以各种硬拷贝格式和跨平台的交互式环境快速地创建出版质量级别的多种类型的图形,如折线图,散点图,条形图,饼图,堆叠图,3D图和地图图形等等。在一个图形窗口上,可以绘制多个图例,多个子图,也可以放大局部区域等。程序员利用Matplotlib进行图形开发,仅需要几行代码,便可达到目的,但程序员应该根据数据的特点,进行图表类型的选择,便于用户很容易通过图形理解分析数据。matplotlib.pyplot.figure():创建新的图形窗口,如果不显式建立图形窗口,系统会自动建立图形窗口matplotlib.pyplot.close():关闭图形窗口matplotlib.pyplot.show():显示图形matplotlib.pyplot.axis(rect):用来指定坐标轴的视窗,例如:matplotlib.pyplot.axis([0,6,0,20]),表示x轴的长度为0到6,y轴的长度为0到20。如果画图时,不指定x轴的长度和y轴的长度,系统会按要处理的数据特性,自动定义轴的长度。matplotlib.pyplot.subplot(numrows[,]numcols[,]fignum):该函数相当于把原图形窗口分割成numrows*numcols个子窗口,目前的子窗口是第fignum个子窗口。子窗口的编号:从左向右、从上向下,顺序编号。例如:subplot(211)等同于subplot(2,1,1),matplotlib.pyplot.xlabel(string):设置x轴标签matplotlib.pyplot.ylabel(string):设置y轴标签matplotlib.pyplot.title(string):设置图形的标题matplotlib.pyplot.legend():按缺省样式生成默认图例matplotlib.pyplot.plot(*args,**kwargs):绘制折线图matplotlib.pyplot.pie(*args,**kwargs):绘制饼图matplotlib.pyplot.hist(*args,**kwargs):绘制直方图matplotlib.pyplot.bar(*args,**kwargs):绘制条形图
作者:云创智学 来源:云创智学 发布时间:2022-01-14 10:00:09
用Pillow操作图像处理中常用的模块和函数
用Pillow操作图像处理中常用的模块和函数:图像的组成:都是由像素组成的。像素点的描述:颜色值及其在图像中的位置。1.图像的属性size属性:表示图像的分辨率,即图像的宽和高(单位为像素),是一个二元的tuple,如(300,200),表示图像的宽为300,宽为200。mode属性:表示图像的模式,常用的模式为:L(luminance)表示灰度图,RGB表示真彩色图,CMYK表示出版图像。format属性:表示图像格式或来源,如果图像不是从文件读取,值为None。palette属性:表示调色板,返回一个ImagePalette类型2.图像空间坐标系统:图像中的默认坐标系为:左上角是坐标原点(0,0),水平向右X轴,垂直向下Y轴。3.图像的颜色表示:计算机通常将图像中像素点的值用RGB值表示,或者再加上alpha值(通透度,透明度),称为RGBA值。在Pillow中,RGBA的值表示为由4个整数组成的元组,分别是R、G、B、A,整数的取值范围0~255,如(255,0,0,255)代表红色,A为0表示透明,255表示不透明,当alpha值为0时,无论是什么颜色,该颜色都不可见。Image模块中最重要的类就是Image,它代表一张图片,可以通过以下几种方式实例化:从文件中读取图片,处理其他图片得到,或者直接创建一个图片。(1)从文件中读取图片,创建Image对象Image.open(filename)(2)处理其他图片得到Image对象Image.crop(rect)(3)直接新建空白图像Image.new(mode,size,color)除了open函数外,其他方法需要通过Image类的实例进行调用。(1)图像的读取和保存方法:读取图像:open(filename):filename为文件完整的路径表示,Pillow库支持相当多的图像格式。例如:Image.open("d:\图片1.jpg")保存图像:save(filename)函数:Image模块中的save()函数可以保存图像,该函数还可以提供第二个参数,用于指定文件的保存格式,如果没有第二个参数,那么文件名中的扩展名用来指定文件格式。例如:save("d:\图图.jpg")(2)显示图像方法:show():不需要参数,直接显示图像对象(3)从像中截取子图crop(rect):提供一个rect参数,表示截取子图在原始图像中的矩形区域。例如:rect=(50,50,200,150),crop(rect)表示新图为源图(50,50)到(199,149)这部分区域的子图(4)粘贴图像paste(Image,rect):第一个参数为Image对象,第二个参数为矩形对象,表示把第一个参数的图像贴到源图像的矩形区域出,注意第一个参数Image对象的size必须和矩形对象保证尺寸一致,此外,矩形区域不能在图像外。(5)几何变换方法:resize(size):缩放图像,提供一个tuple参数,表示新图像的大小。例如:resize((640,640)),表示新生成一个图像,新图像是源图像经过变换后,尺寸为640*640。rotate(angle):提供一个int参数,表示逆时针旋转的角度,0-360之间。例如:rotate(45)表示新图像是源图像逆时针旋转45度得来的。transpose(sign):提供一个符号常量,Pillow通过此函数对于一些常见的旋转作了专门的定义。例如:transpose(Image.ROTATE_90),表示逆时针旋转90度transpose(Image.FLIP_LEFT_RIGHT)左右对换。(6)色彩空间变换convert(string):提供一个字符串参数,表示图像的mode属性。该函数可以用来将图像转换为不同色彩模式,如将彩色图像转换为灰度图像等。例如:convert("L")。(7)图像滤波图像滤波,即在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制,是图像预处理中不可缺少的操作。在ImageFilter模块中,提供了图像滤波filter()函数,用于图像的滤波增强。filter(ImageFilter.function):提供一个参数,表示滤波增强的方式。在ImageFilter模块中,预先定义了很多增强滤波器。表10-1ImageFilter类的预定义过滤方法(8)图像增强图像滤波增强处理实质上就是运用滤波技术来增强图像的某些空间频率特征,以改善地物目标与领域或背景之间的灰度反差,如调节图像的颜色、对比度、饱和度和锐化等等。ImageEnhance.Contrast(Image):提供一个图像对象,调整图像的对比度ImageEnhance.Color(Image):提供一个图像对象,调整图像的颜色平衡ImageEnhance.enhance(factor):对选择属性的数值增强factor倍ImageEnhance.Brightness(Image):提供一个图像对象,调整图像的亮度ImageEnhance.Sharpness(Image):提供一个图像对象,调整图像的锐度ImageDraw模块中包含了ImageDraw类,它支持各种几何图形的绘制和文本的绘制,如直线、椭圆、弧、弦、多边形以及文字等。下面介绍ImageDraw类中的几个函数:Draw(image):创建一个可以在给定图像上绘图的绘图对象。例如:im=Image.open('d:\图片1.jpg')draw=ImageDraw.Draw(im)draw.arc(xy,start,end,options):在给定的区域内,在开始和结束角度之间绘制一条弧(圆的一部分)。例如:draw.arc((0,0,100,100),0,180,fill=(0,255,0)),表示在源图的(0,0)到(100,100)这个矩形内画一个圆,顺时针取0度到180度之间的半圆弧,半圆弧颜色为绿色draw.text(position,string,options):在给定的位置绘制一个字符。参数position给出了文本的左上角的位置,参数options的font用于指定所用字体。例如:draw.text((0,0),"Hello",fill=(0,255,0)),表示在源图的(0,0)位置绘制绿色的Hello。
作者:云创智学 来源:云创智学 发布时间:2022-01-14 09:58:58
用Pillow操作图像的基本知识
用Pillow操作图像的基本知识:图像处理是一门应用非常广的技术,PIL(PythonImagingLibrary)是Python常用的图像处理库,支持大量图像格式,并提供操作图像的强大功能,包括新建图像、裁剪图像、复制图像、粘贴图像、调整图像的大小、旋转和翻转图像、图像滤波、调色板、添加文字等功能,这些功能只需要简单的代码即可完成。PIL仅支持到Python2.7,Python3.x使用兼容PIL的版本Pillow,它在PIL的基础上加入了许多新特性。详细了解PIL的强大功能,请请参考Pillow官方文档:https://pillow.readthedocs.org/图像的组成:都是由像素组成的像素点的描述:颜色值及其在图像中的位置。1.图像的属性size属性:表示图像的分辨率,即图像的宽和高(单位为像素),是一个二元的tuple,如(300,200),表示图像的宽为300,宽为200。mode属性:表示图像的模式,常用的模式为:L(luminance)表示灰度图,RGB表示真彩色图,CMYK表示出版图像。format属性:表示图像格式或来源,如果图像不是从文件读取,值为None。palette属性:表示调色板,返回一个ImagePalette类型2.图像空间坐标系统:图像中的默认坐标系为:左上角是坐标原点(0,0),水平向右X轴,垂直向下Y轴。3.图像的颜色表示:计算机通常将图像中像素点的值用RGB值表示,或者再加上alpha值(通透度,透明度),称为RGBA值。在Pillow中,RGBA的值表示为由4个整数组成的元组,分别是R、G、B、A,整数的取值范围0~255,如(255,0,0,255)代表红色,A为0表示透明,255表示不透明,当alpha值为0时,无论是什么颜色,该颜色都不可见。
作者:云创智学 来源:云创智学 发布时间:2022-01-14 09:56:22
Python语法解析器PLY
Python语法解析器PLY:PLY是Lex和Yacc的Python实现,包含了它们的大部分特性。PLY采用惯例优于配置(ConventionOverConfiguration,COC)的方式实现各种配置的组织,例如,强制词法单元的类型列表的名字为tokens,强制描述词法单元的规则的变量名为t_TOKENNAME等。PLY使用简单,经过短时间学习就可以实现一个简单的语法规则和翻译规则程序。PLY对研究编译器原理很有价值。PLY网站:http://www.dabeaz.com/ply/。Windows环境下安装PLY的命令:pipinstallply。
作者:云创智学 来源:云创智学 发布时间:2022-01-13 10:26:16
Python中文处理工具jieba
Python中文处理工具jieba:jieba是一个用Python实现的分词库,对中文有很强大的分词能力。jieba网站:https://github.com/fxsjy/jieba。Windows环境下安装jieba的命令:pipinstalljieba。jieba的优点如下:(1)支持3种分词模式:精确模式。试图将句子最精确地切开,适合文本分析。全模式。把句子中所有可以成词的词语都扫描出来,速度非常快,但是不能解决歧义。搜索引擎模式。在精确模式的基础上,对长词再次切分,提高召回率,适用于搜索引擎分词。(2)支持自定义词典。
作者:云创智学 来源:云创智学 发布时间:2022-01-13 10:25:34
Python自然语言处理工具包NLTK
Python自然语言处理工具包NLTK:自然语言处理工具包NLTK是NLP领域最常使用的一个Python库。NLTK是由美国宾夕法尼亚大学的StevenBird和EdwardLoper开发的。NLTK包括图形演示和示例数据,其提供了WordNet这种方便处理词汇资源的接口,以及分类、分词、词干提取、标注、语法分析、语义推理等类库。NLTK网站:http://www.nltk.org/。安装NLTK的命令:sudopipinstall-Unltk。安装NumPy的命令(可选):sudopipinstall-Unumpy。安装测试的命令:pythonthentypeimportnltk。
作者:云创智学 来源:云创智学 发布时间:2022-01-13 10:24:15
聚类分析评价标准
聚类分析评价标准:常用的评价聚类分析能力的几个标准如下:(1)可伸缩性(Scalability):处理大量数据的能力。许多聚类分析方法在小于1000个数据对象的小数据集上工作得很好,但是随着数据对象的增加,这些聚类分析方法的处理能力就会下降。因此,一个好的聚类分析方法需要能处理大量的数据集。(2)处理不同类型属性的能力:许多聚类分析方法只能聚类数值型的数据。但是,在数据挖掘领域,数据类型是多样的。聚类分析作为一种分析工具,应该能够对不同类型数据进行分析,从而提供一个普适的模型。(3)用于决定输入参数的领域知识最少:许多聚类分析方法在聚类分析中要求用户输入一定的参数,如希望产生类的数目,而且聚类分析结果对输入参数十分敏感。参数通常很难确定,特别是对于包含高维对象的数据集来说,更是如此。要求用户输入参数不仅加重了用户的负担,也使得聚类分析的质量难以控制。(4)能够发现任意形状聚类的能力:许多聚类分析方法采用欧氏距离来决定相似度,这种度量方式趋向于发现球(超球)簇,而现实中有大量各类形状的簇,因此需要聚类分析能够发现任意形状的簇。(5)处理噪声数据的能力:现实的数据中不可避免地存在各类噪声,如孤立点、空缺、未知数据或错误数据等。这些噪声的出现不应该对聚类分析产生较强的影响。有些聚类分析方法对噪声是敏感的,可能导致低质量的聚类分析结果。(6)对于输入数据的顺序不敏感:有些聚类分析方法对于输入数据的顺序是敏感的。例如,同一个数据集,当以不同的顺序提交给同一个方法时,可能生成差别很大的聚类分析结果。(7)处理高维数据的能力:一个数据库或数据仓库可能包含若干维或若干属性。许多聚类分析方法擅长处理低维的数据,可能只涉及两维到三维。但是在高维情况下,数据分布可能很稀疏,所以对这样的数据对象进行聚类分析是一个具有挑战性的课题。(8)满足用户的约束条件:在现实世界中,可能需要在各种约束条件下进行聚类分析。要找到既满足特定的约束,又具有良好聚类特性的数据分组是一项具有挑战性的任务。(9)聚类分析结果的可解释性:聚类分析是为分析数据服务的,人们期望通过聚类分析从数据中抽取某种特定语义的解释,也就是说,聚类分析的结果应该是可解释的、可理解的和可用的。
作者:云创智学 来源:云创智学 发布时间:2022-01-13 10:22:15
聚类分析定义
聚类分析定义:聚类分析作为统计学习的一个分支和一种无指导的机器学习方法,已有几十年的研究历史。近年来,随着数据挖掘的兴起,聚类分析成为数据分析领域的一个研究热点。聚类分析不仅是数据挖掘的重要有效方法,同时也是其他挖掘任务的前奏。聚类分析已经成为数据挖掘研究领域一个非常活跃的研究课题。聚类分析是指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。聚类分析符合人类认知过程,是一种重要的数据挖掘手段,属于无监督学习的范畴。聚类和分类的最大区别在于:聚类不需要标签而分类需要标签,即聚类和分类分别属于无监督和有监督的学习范畴。
作者:云创智学 来源:云创智学 发布时间:2022-01-13 10:20:52
分类与预测 特征选择
分类与预测特征选择:分类(Classification)和预测(Prediction)是预测问题的两种主要类型。分类主要是预测分类标号(离散属性),而预测主要是建立连续值函数模型。预测可给定自变量对应的因变量的值。特征选择的一般过程如图所示:首先从原始特征集中根据一定的策略产生特征子集,对特征子集进行评估,得到相应的评估值,然后将评估值和设定的阈值比较,如果评估值低于阈值,则重新产生新的特征子集,进行下一轮迭代;如果评估值高于阈值,则停止迭代,并对最优特征子集进行验证。特征选择模型主要有两种:Filter模型和Wrapper模型。
作者:云创智学 来源:云创智学 发布时间:2022-01-12 13:48:02
联系方式
企业微信