本文目录一览：

Python元组常用操作小技巧
万字干货，Python语法大合集，一篇文章带你入门
可以让你快速用Python进行数据分析的10个小技巧
Python编程常用技巧

Python元组常用操作小技巧

所以这篇文章，我们先来回顾和总结Python数据结构里常用操作。Python中常见的数据结构可以统称为容器（container）。序列（如列表和元组）、映射（如字典）以及集合（set）是三类主要的容器。而扁平序列如str、bytes、bytearray、memoryview 和 array.array等不在这篇文章的讨论范围内。在此，我们先从元组开始说起。元组区别于列表的显著特征之一就是它不能被修改，但其另外一个作用就是用于没有字段名的记录 [1] 。因为后者经常被忽略，我们先来看看元组作为记录的作用。使用括号就可以定义一个元组。元组中的每个元素都存放了记录中一个字段的数据，外加这个字段的位置。正是这个位置信息给数据赋予了意义。下面的例子中，元组就被当作记录加以利用：输出为：上述for循环中的操作提取了元组中的元素，也叫作拆包（unpacking）。平行赋值是对元组拆包很好的应用，示例如下：还有一个经典而优雅的应用是交换变量的值：用 * 运算符把一个可迭代对象拆开作为函数的参数，例如Python的内置函数pmod接收两个数字类型的参数，返回商和余数。以下范例将使用 * 将元组传入函数。输出为：有些函数有多个返回值，将其赋给一个变量时，变量类型即是元组：输出为： zip是Python的内置函数，能够接收两个或多个序列，并组成一个元组列表，在Python3中会返回一个迭代器，如下所示：输出为：元组当然也支持一些常规操作，如对于元组 a = (1, 'y', 5, 5, 'x') ：上述内容不仅涵盖了元组的基本操作，同时也结合了实际工作中常搭配使用的其他函数、运算符等。在回顾这些知识时主要参考了两本经典的Python编程书籍：《流畅的Python》和《像计算机科学家一样思考Python》，有兴趣的朋友可以深入阅读！希望这篇文章对你有帮助，下回将总结Python列表的使用技巧。 [1]《流畅的Python》:

万字干货，Python语法大合集，一篇文章带你入门

这份资料非常纯粹，只有Python的基础语法，专门针对想要学习Python的小白。 Python中用#表示单行注释，#之后的同行的内容都会被注释掉。使用三个连续的双引号表示多行注释，两个多行注释标识之间内容会被视作是注释。 Python当中的数字定义和其他语言一样：我们分别使用+, -, , /表示加减乘除四则运算符。这里要注意的是，在Python2当中，10/3这个操作会得到3，而不是3.33333。因为除数和被除数都是整数，所以Python会自动执行整数的计算，帮我们把得到的商取整。如果是10.0 / 3，就会得到3.33333。目前Python2已经不再维护了，可以不用关心其中的细节。但问题是Python是一个弱类型的语言，如果我们在一个函数当中得到两个变量，是无法直接判断它们的类型的。这就导致了同样的计算符可能会得到不同的结果，这非常蛋疼。以至于程序员在运算除法的时候，往往都需要手工加上类型转化符，将被除数转成浮点数。在Python3当中拨乱反正，修正了这个问题，即使是两个整数相除，并且可以整除的情况下，得到的结果也一定是浮点数。如果我们想要得到整数，我们可以这么操作：两个除号表示取整除，Python会为我们保留去除余数的结果。除了取整除操作之外还有取余数操作，数学上称为取模，Python中用%表示。 Python中支持乘方运算，我们可以不用调用额外的函数，而使用符号来完成：当运算比较复杂的时候，我们可以用括号来强制改变运算顺序。 Python中用首字母大写的True和False表示真和假。用and表示与操作，or表示或操作，not表示非操作。而不是C或者是Java当中的, || 和！。在Python底层， True和False其实是1和0 ，所以如果我们执行以下操作，是不会报错的，但是在逻辑上毫无意义。我们用==判断相等的操作，可以看出来True==1， False == 0. 我们要小心Python当中的bool()这个函数，它并不是转成bool类型的意思。如果我们执行这个函数，那么只有0会被视作是False，其他所有数值都是True ： Python中用==判断相等，表示大于，=表示大于等于，表示小于，=表示小于等于，!=表示不等。我们可以用and和or拼装各个逻辑运算：注意not，and，or之间的优先级，其中not and or。如果分不清楚的话，可以用括号强行改变运行顺序。关于list的判断，我们常用的判断有两种，一种是刚才介绍的==，还有一种是is。我们有时候也会简单实用is来判断，那么这两者有什么区别呢？我们来看下面的例子： Python是全引用的语言，其中的对象都使用引用来表示。is判断的就是两个引用是否指向同一个对象，而==则是判断两个引用指向的具体内容是否相等。举个例子，如果我们把引用比喻成地址的话，is就是判断两个变量的是否指向同一个地址，比如说都是沿河东路XX号。而==则是判断这两个地址的收件人是否都叫张三。显然，住在同一个地址的人一定都叫张三，但是住在不同地址的两个人也可以都叫张三，也可以叫不同的名字。所以如果a is b，那么a == b一定成立，反之则不然。 Python当中对字符串的限制比较松，双引号和单引号都可以表示字符串，看个人喜好使用单引号或者是双引号。我个人比较喜欢单引号，因为写起来方便。字符串也支持+操作，表示两个字符串相连。除此之外，我们把两个字符串写在一起，即使没有+，Python也会为我们拼接：我们可以使用[]来查找字符串当中某个位置的字符，用 len 来计算字符串的长度。我们可以在字符串前面加上f表示格式操作，并且在格式操作当中也支持运算，比如可以嵌套上len函数等。不过要注意，只有Python3.6以上的版本支持f操作。最后是None的判断，在Python当中None也是一个对象，所有为None的变量都会指向这个对象。根据我们前面所说的，既然所有的None都指向同一个地址，我们需要判断一个变量是否是None的时候，可以使用is来进行判断，当然用==也是可以的，不过我们通常使用is。理解了None之后，我们再回到之前介绍过的bool()函数，它的用途其实就是判断值是否是空。所有类型的默认空值会被返回False ，否则都是True。比如0，""，[], {}, ()等。除了上面这些值以外的所有值传入都会得到True。 Python当中的标准输入输出是 input和print 。 print会输出一个字符串，如果传入的不是字符串会自动调用__str__方法转成字符串进行输出。默认输出会自动换行，如果想要以不同的字符结尾代替换行，可以传入end参数：使用input时，Python会在命令行接收一行字符串作为输入。可以在input当中传入字符串，会被当成提示输出： Python支持三元表达式，但是语法和C不同，使用if else结构，写成：上段代码等价于： Python中用[]表示空的list，我们也可以直接在其中填充元素进行初始化：使用append和pop可以在list的末尾插入或者删除元素： list可以通过[]加上下标访问指定位置的元素，如果是负数，则表示倒序访问。-1表示最后一个元素，-2表示倒数第二个，以此推类。如果访问的元素超过数组长度，则会出发 IndexError 的错误。 list支持切片操作，所谓的切片则是从原list当中拷贝出指定的一段。我们用start: end的格式来获取切片，注意，这是一个左闭右开区间。如果留空表示全部获取，我们也可以额外再加入一个参数表示步长，比如[1:5:2]表示从1号位置开始，步长为2获取元素。得到的结果为[1, 3]。如果步长设置成-1则代表反向遍历。如果我们要指定一段区间倒序，则前面的start和end也需要反过来，例如我想要获取[3: 6]区间的倒序，应该写成[6:3:-1]。只写一个:，表示全部拷贝，如果用is判断拷贝前后的list会得到False。可以使用del删除指定位置的元素，或者可以使用remove方法。 insert方法可以指定位置插入元素，index方法可以查询某个元素第一次出现的下标。 list可以进行加法运算，两个list相加表示list当中的元素合并。等价于使用extend 方法：我们想要判断元素是否在list中出现，可以使用 in关键字，通过使用len计算list的长度： tuple和list非常接近，tuple通过()初始化。和list不同， tuple是不可变对象。也就是说tuple一旦生成不可以改变。如果我们修改tuple，会引发TypeError异常。由于小括号是有改变优先级的含义，所以我们定义单个元素的tuple，末尾必须加上逗号，否则会被当成是单个元素： tuple支持list当中绝大部分操作：我们可以用多个变量来解压一个tuple：解释一下这行代码：我们在b的前面加上了星号，表示这是一个list 。所以Python会在将其他变量对应上值的情况下，将剩下的元素都赋值给b。补充一点，tuple本身虽然是不可变的，但是 tuple当中的可变元素是可以改变的。比如我们有这样一个tuple：我们虽然不能往a当中添加或者删除元素，但是a当中含有一个list，我们可以改变这个list类型的元素，这并不会触发tuple的异常： dict也是Python当中经常使用的容器，它等价于C++当中的map，即存储key和value的键值对。我们用{}表示一个dict，用:分隔key和value。对。我们用{}表示一个dict，用:分隔key和value。 dict的key必须为不可变对象，所以 list、set和dict不可以作为另一个dict的key ，否则会抛出异常：我们同样用[]查找dict当中的元素，我们传入key，获得value，等价于get方法。我们可以call dict当中的keys和values方法，获取dict当中的所有key和value的集合，会得到一个list。在Python3.7以下版本当中，返回的结果的顺序可能和插入顺序不同，在Python3.7及以上版本中，Python会保证返回的顺序和插入顺序一致：我们也可以用in判断一个key是否在dict当中，注意只能判断key。如果使用[]查找不存在的key，会引发KeyError的异常。如果使用 get方法则不会引起异常，只会得到一个None ： setdefault方法可以为不存在的key 插入一个value，如果key已经存在，则不会覆盖它：我们可以使用update方法用另外一个dict来更新当前dict，比如a.update(b)。对于a和b交集的key会被b覆盖，a当中不存在的key会被插入进来：我们一样可以使用del删除dict当中的元素，同样只能传入key。 Python3.5以上的版本支持使用来解压一个dict： set是用来存储不重复元素的容器，当中的元素都是不同的，相同的元素会被删除。我们可以通过set()，或者通过{}来进行初始化。注意当我们使用{}的时候，必须要传入数据，否则Python会将它和dict弄混。 set当中的元素也必须是不可变对象，因此list不能传入set。可以调用add方法为set插入元素： set还可以被认为是集合，所以它还支持一些集合交叉并补的操作。 set还支持超集和子集的判断，我们可以用大于等于和小于等于号判断一个set是不是另一个的超集或子集：和dict一样，我们可以使用in判断元素在不在set当中。用copy可以拷贝一个set。 Python当中的判断语句非常简单，并且Python不支持switch，所以即使是多个条件，我们也只能罗列if-else 。我们可以用in来循环迭代一个list当中的内容，这也是Python当中基本的循环方式。如果我们要循环一个范围，可以使用range。range加上一个参数表示从0开始的序列，比如range(10)，表示[0, 10)区间内的所有整数：如果我们传入两个参数，则代表迭代区间的首尾。如果我们传入第三个元素，表示每次循环变量自增的步长。如果使用enumerate函数，可以同时迭代一个list的下标和元素： while循环和C++类似，当条件为True时执行，为false时退出。并且判断条件不需要加上括号： Python当中使用 try和except捕获异常，我们可以在except后面限制异常的类型。如果有多个类型可以写多个except，还可以使用else语句表示其他所有的类型。finally语句内的语法无论是否会触发异常都必定执行：在Python当中我们经常会使用资源，最常见的就是open打开一个文件。我们打开了文件句柄就一定要关闭，但是如果我们手动来编码，经常会忘记执行close操作。并且如果文件异常，还会触发异常。这个时候我们可以使用with语句来代替这部分处理，使用with会自动在with块执行结束或者是触发异常时关闭打开的资源。以下是with的几种用法和功能：凡是可以使用in语句来迭代的对象都叫做可迭代对象，它和迭代器不是一个含义。这里只有可迭代对象的介绍，想要了解迭代器的具体内容，请移步传送门： Python——五分钟带你弄懂迭代器与生成器，夯实代码能力当我们调用dict当中的keys方法的时候，返回的结果就是一个可迭代对象。我们不能使用下标来访问可迭代对象，但我们可以用iter将它转化成迭代器，使用next关键字来获取下一个元素。也可以将它转化成list类型，变成一个list。使用def关键字来定义函数，我们在传参的时候如果指定函数内的参数名，可以不按照函数定义的顺序传参：可以在参数名之前加上表示任意长度的参数，参数会被转化成list：也可以指定任意长度的关键字参数，在参数前加上表示接受一个dict：当然我们也可以两个都用上，这样可以接受任何参数：传入参数的时候我们也可以使用*和来解压list或者是dict： Python中的参数可以返回多个值：函数内部定义的变量即使和全局变量重名，也不会覆盖全局变量的值。想要在函数内部使用全局变量，需要加上 global 关键字，表示这是一个全局变量： Python支持函数式编程，我们可以在一个函数内部返回一个函数： Python中可以使用lambda表示匿名函数，使用:作为分隔，:前面表示匿名函数的参数，:后面的是函数的返回值：我们还可以将函数作为参数使用map和filter，实现元素的批量处理和过滤。关于Python中map、reduce和filter的使用，具体可以查看之前的文章：五分钟带你了解map、reduce和filter 我们还可以结合循环和判断语来给list或者是dict进行初始化：使用 import语句引入一个Python模块，我们可以用.来访问模块中的函数或者是类。我们也可以使用from import的语句，单独引入模块内的函数或者是类，而不再需要写出完整路径。使用from import *可以引入模块内所有内容（不推荐这么干）可以使用as给模块内的方法或者类起别名：我们可以使用dir查看我们用的模块的路径：这么做的原因是如果我们当前的路径下也有一个叫做math的Python文件，那么会覆盖系统自带的math的模块。这是尤其需要注意的，不小心会导致很多奇怪的bug。我们来看一个完整的类，相关的介绍都在注释当中以上内容的详细介绍之前也有过相关文章，可以查看： Python—— slots ，property和对象命名规范下面我们来看看Python当中类的使用：这里解释一下，实例和对象可以理解成一个概念，实例的英文是instance，对象的英文是object。都是指类经过实例化之后得到的对象。继承可以让子类继承父类的变量以及方法，并且我们还可以在子类当中指定一些属于自己的特性，并且还可以重写父类的一些方法。一般我们会将不同的类放在不同的文件当中，使用import引入，一样可以实现继承。我们创建一个蝙蝠类：我们再创建一个蝙蝠侠的类，同时继承Superhero和Bat：执行这个类：我们可以通过yield关键字创建一个生成器，每次我们调用的时候执行到yield关键字处则停止。下次再次调用则还是从yield处开始往下执行：除了yield之外，我们还可以使用()小括号来生成一个生成器：关于生成器和迭代器更多的内容，可以查看下面这篇文章：五分钟带你弄懂迭代器与生成器，夯实代码能力我们引入functools当中的wraps之后，可以创建一个装饰器。装饰器可以在不修改函数内部代码的前提下，在外面包装一层其他的逻辑: 装饰器之前也有专门的文章详细介绍，可以移步下面的传送门：一文搞定Python装饰器，看完面试不再慌不知道有多少小伙伴可以看到结束，原作者的确非常厉害，把Python的基本操作基本上都囊括在里面了。如果都能读懂并且理解的话，那么Python这门语言就算是入门了。如果你之前就有其他语言的语言基础，我想本文读完应该不用30分钟。当然在30分钟内学会一门语言是不可能的，也不是我所提倡的。但至少通过本文我们可以做到熟悉Python的语法，知道大概有哪些操作，剩下的就要我们亲自去写代码的时候去体会和运用了。根据我的经验，在学习一门新语言的前期，不停地查阅资料是免不了的。希望本文可以作为你在使用Python时候的查阅文档。最后，我这里有各种免费的编程类资料，有需要的及时私聊我，回复"学习"，分享给大家，正在发放中............

可以让你快速用Python进行数据分析的10个小技巧

一些小提示和小技巧可能是非常有用的，特别是在编程领域。有时候使用一点点黑客技术，既可以节省时间，还可能挽救“生命”。一个小小的快捷方式或附加组件有时真是天赐之物，并且可以成为真正的生产力助推器。所以，这里有一些小提示和小技巧，有些可能是新的，但我相信在下一个数据分析项目中会让你非常方便。

Pandas中数据框数据的Profiling过程

Profiling（分析器）是一个帮助我们理解数据的过程，而Pandas Profiling是一个Python包，它可以简单快速地对Pandas 的数据框数据进行探索性数据分析。 Pandas中df.describe()和df.info()函数可以实现EDA过程第一步。但是，它们只提供了对数据非常基本的概述，对于大型数据集没有太大帮助。而Pandas中的Profiling功能简单通过一行代码就能显示大量信息，且在交互式HTML报告中也是如此。对于给定的数据集，Pandas中的profiling包计算了以下统计信息：由Pandas Profiling包计算出的统计信息包括直方图、众数、相关系数、分位数、描述统计量、其他信息——类型、单一变量值、缺失值等。

安装

用pip安装或者用conda安装

pip install pandas-profiling
conda install -c anaconda pandas-profiling

用法

下面代码是用很久以前的泰坦尼克数据集来演示多功能Python分析器的结果。

#importing the necessary packages
import pandas as pd
import pandas_profiling
df = pd.read_csv('titanic/train.csv')
pandas_profiling.ProfileReport(df)

一行代码就能实现在Jupyter Notebook中显示完整的数据分析报告，该报告非常详细，且包含了必要的图表信息。还可以使用以下代码将报告导出到交互式HTML文件中。

profile = pandas_profiling.ProfileReport(df)
profile.to_file(outputfile="Titanic data profiling.html")

Pandas实现交互式作图

Pandas有一个内置的.plot（）函数作为DataFrame类的一部分。但是，使用此功能呈现的可视化不是交互式的，这使得它没那么吸引人。同样，使用pandas.DataFrame.plot（）函数绘制图表也不能实现交互。如果我们需要在不对代码进行重大修改的情况下用Pandas绘制交互式图表怎么办呢？这个时候就可以用Cufflinks库来实现。 Cufflinks库可以将有强大功能的plotly和拥有灵活性的pandas结合在一起，非常便于绘图。下面就来看在pandas中如何安装和使用Cufflinks库。

安装

pip install plotly
# Plotly is a pre-requisite before installing cufflinks
pip install cufflinks

用法

#importing Pandas
import pandas as pd
#importing plotly and cufflinks in offline mode
import cufflinks as cf
import plotly.offline
cf.go_offline()
cf.set_config_file(offline=False, world_readable=True)

是时候展示泰坦尼克号数据集的魔力了。

df.iplot()

df.iplot() vs df.plot() 右侧的可视化显示了静态图表，而左侧图表是交互式的，更详细，并且所有这些在语法上都没有任何重大更改。

Magic命令

Magic命令是Jupyter notebook中的一组便捷功能，旨在解决标准数据分析中的一些常见问题。使用命令％lsmagic可以看到所有的可用命令。所有可用的Magic命令列表 Magic命令有两种：行magic命令（line magics），以单个％字符为前缀，在单行输入操作；单元magic命令（cell magics），以双%%字符为前缀，可以在多行输入操作。如果设置为1，则不用键入%即可调用Magic函数。接下来看一些在常见数据分析任务中可能用到的命令：

% pastebin

％pastebin将代码上传到Pastebin并返回url。Pastebin是一个在线内容托管服务，可以存储纯文本，如源代码片段，然后通过url可以与其他人共享。事实上，Github gist也类似于pastebin，只是有版本控制。在file.py文件中写一个包含以下内容的python脚本，并试着运行看看结果。

#file.py
def foo(x):
    return x

在Jupyter Notebook中使用％pastebin生成一个pastebin url。

%matplotlib notebook

函数用于在Jupyter notebook中呈现静态matplotlib图。用notebook替换inline，可以轻松获得可缩放和可调整大小的绘图。但记得这个函数要在导入matplotlib库之前调用。

%run

用％run函数在notebook中运行一个python脚本试试。

%run file.py

%%writefile

%% writefile是将单元格内容写入文件中。以下代码将脚本写入名为foo.py的文件并保存在当前目录中。

%%latex

%%latex函数将单元格内容以LaTeX形式呈现。此函数对于在单元格中编写数学公式和方程很有用。

查找并解决错误

交互式调试器也是一个神奇的功能，我把它单独定义了一类。如果在运行代码单元时出现异常，请在新行中键入％debug并运行它。这将打开一个交互式调试环境，它能直接定位到发生异常的位置。还可以检查程序中分配的变量值，并在此处执行操作。退出调试器单击q即可。

Printing也有小技巧

如果您想生成美观的数据结构，pprint是首选。它在打印字典数据或JSON数据时特别有用。接下来看一个使用print和pprint来显示输出的示例。

让你的笔记脱颖而出

我们可以在您的Jupyter notebook中使用警示框/注释框来突出显示重要内容或其他需要突出的内容。注释的颜色取决于指定的警报类型。只需在需要突出显示的单元格中添加以下任一代码或所有代码即可。

蓝色警示框：信息提示

<p class="alert alert-block alert-info">
<b>Tip:</b> Use blue boxes (alert-info) for tips and notes.
If it’s a note, you don’t have to include the word “Note”.
</p>

黄色警示框：警告

<p class="alert alert-block alert-warning">
<b>Example:</b> Yellow Boxes are generally used to include additional examples or mathematical formulas.
</p>

绿色警示框：成功

<p class="alert alert-block alert-success">
Use green box only when necessary like to display links to related content.
</p>

红色警示框：高危

<p class="alert alert-block alert-danger">
It is good to avoid red boxes but can be used to alert users to not delete some important part of code etc.
</p>

打印单元格所有代码的输出结果

假如有一个Jupyter Notebook的单元格，其中包含以下代码行：

In [1]: 10+5
11+6
Out [1]: 17

单元格的正常属性是只打印最后一个输出，而对于其他输出，我们需要添加print()函数。然而通过在notebook顶部添加以下代码段可以一次打印所有输出。添加代码后所有的输出结果就会一个接一个地打印出来。

In [1]: 10+5
11+6
12+7
Out [1]: 15
Out [1]: 17
Out [1]: 19

恢复原始设置：

InteractiveShell.ast_node_interactivity = "last_expr"

使用'i'选项运行python脚本

从命令行运行python脚本的典型方法是：python hello.py。但是，如果在运行相同的脚本时添加-i，例如python -i hello.py，就能提供更多优势。接下来看看结果如何。首先，即使程序结束，python也不会退出解释器。因此，我们可以检查变量的值和程序中定义的函数的正确性。其次，我们可以轻松地调用python调试器，因为我们仍然在解释器中：

import pdb
pdb.pm()

这能定位异常发生的位置，然后我们可以处理异常代码。

自动评论代码

Ctrl / Cmd + /自动注释单元格中的选定行，再次命中组合将取消注释相同的代码行。

删除容易恢复难

你有没有意外删除过Jupyter notebook中的单元格？如果答案是肯定的，那么可以掌握这个撤消删除操作的快捷方式。如果您删除了单元格的内容，可以通过按CTRL / CMD + Z轻松恢复它。如果需要恢复整个已删除的单元格，请按ESC + Z或EDIT撤消删除单元格。

结论

在本文中，我列出了使用Python和Jupyter notebook时收集的一些小提示。我相信它们会对你有用，能让你有所收获，从而实现轻松编码！

Python编程常用技巧

链接：提取码：dfsm Python 编程高手之路。本课程分五个阶段，详细的为您打造高手之路，本课程适合有一定python基础的同学。用Python可以做什么？可以做日常任务，比如自动备份你的MP3；可以做网站，很多著名的网站就是Python写的。总之就是能干很多很多事。

课程目录：

第一阶段

第一章：用户交互
第二章：流程控制
第三章：数据类型
第四章：字符编码
第五章：文件处理

第二阶段

第六章：函数概述
第七章：闭包函数
...
...

关于超实用python使用技巧详解的信息