python执行速度太慢,python运行很慢

本文目录一览：

1、python语言的缺点
2、用python处理一个1G左右的数据集，运行速度非常慢，怎样优化
3、Python 执行速度慢只是因为它是解释型语言吗
4、python语言运行速度如此差？
5、python 处理大数据程序运行的越来越慢的问题

python语言的缺点

Python并不是没有缺点的，最主要的缺点有以下几个：

Python的执行速度不够快。当然，这也不是一个很严重的问题，一般情况下，我们不会拿Python语言与C/C++这样的语言进行直接比较。在Python语言的执行速度上，一方面，网络或磁盘的延迟，会抵消掉部分Python本身消耗的时间；另一方面，因为Python特别容易和C结合起来，因此，我们可以通过分离一部分需要优化速度的应用，将其转换为编译好的扩展，并在整个系统中使用Python脚本将这部分应用连接起来，以提高程序的整体效率。

Python的GIL锁限制并发：Python的另一个大问题是，对多处理器支持不好。如果读者接触Python时间比较长，那么，一定听说过GIL这个词。GIL是指Python全局解释器锁（GlobalInterpreterLock），当Python的默认解释器要执行字节码时，都需要先申请这个锁。这意味着，如果试图通过多线程扩展应用程序，将总是被这个全局解释器锁限制。当然，我们可以使用多进程的架构来提高程序的并发，也可以选择不同的Python实现来运行我们的程序。

Python2与Python3不兼容：如果一个普通的软件或者库，不能够做到后向兼容，那么，它会被用户无情的抛弃了。在Python中，一个槽点是Python2与Python3不兼容。因为Python没有向后兼容，给所有的Python工程师带来了无数的烦恼。

用python处理一个1G左右的数据集，运行速度非常慢，怎样优化

第一个办法，降低数据集的大小。python处理数据，如果数据结构中的数据超过2GB，通常都会很慢。如何降低数据集大小，需要修改算法。

第二个办法，将数据结构采用数组array或者是numarray存贮。这样内存数量与查找效率都会提高。尽量不要使用大的dict。使用一个省内存的blist代替list

第三个办法，将数据通过共享内存，让C++扩展模块来处理。

常用的是第二种办法。就是换个数据结构就可以提高效率。

Python 执行速度慢只是因为它是解释型语言吗

Python 不是解释型语言，事实上也没有「解释型」语言这个分类。

Python 性能略有不佳的原因可能有几个：

首先是 Python 希望自己是一个简单和优雅的语言，需要性能的组件通常用 C 实现，没有太多改进性能的动力。

然后 Python 具有垃圾回收和自动的内存管理功能，并且采用动态类型系统，会在运行时进行类型检查，这会不可避免地略微影响性能，使其不如静态类型(Java)或没有垃圾回收(C/C++)的语言。

摘自维基百科：

「Python开发人员尽量避开不成熟或者不重要的优化。一些针对非重要部位的加快运行速度的补丁通常不会被合并到Python内。」

「因为Python属于动态类型语言，动态类型语言是在运行期间检查数据的类型，不得不保持描述变量值的实际类型标记，程序在每次操作变量时，需要执行数据依赖分支」

python语言运行速度如此差？

这就要说到 Python 类语言和 C 类语言的主要区别了，Python 属于解释型语言，通俗来说就是你可以一句一句地输入，而 Python 解释器（Interpreter）可以一句一句地执行，而 C 语言属于编译型语言，无法做到这一点，只能一次性输入完成，编译成一个完整的程序再执行，而这个编译的过程由于现代编译器做了非常多的优化，并且你的程序没有输入只有输出，每次运行都出固定的结果，所以极有可能被编译器优化成为了只有一条输出语句（实际情况可能要复杂一些），总的来说就是由于二者之间原理的差异导致了性能的差异，你可以搜一搜相关的资料，关掉 C 语言编译时的优化，再看一下性能，或者将固定的那些值改为运行时需要输入再看一下效果。

Python 相较于 C 的优势有很多，性能这一方面你不需要关心，做出一个足够复杂的程序，它们之间运行效率差不了多少的。

python执行速度太慢,python运行很慢

python 处理大数据程序运行的越来越慢的问题

最近编写并运行了一个处理1500万个数据的程序，本来最初每秒可以处理150个左右的数据，预计大概15个小时的时间就可以处理完，晚上的时候就开始运行，本以为等到第二天中午就可以得到结果呢，，，

可是，等我第二天的时候一看，什么？？？还没处理完，当前的数据处理速度变成了一秒5个左右，然后还需要等待300个小时。

然后就查了一下这个问题，原来同样也有很多人在处理大数据的时候遇到了这个问题，大多数的文章分析的原因都是说由于GC（垃圾回收）造成的性能下降。

Python的垃圾回收机制的工作原理为每个对象维护一个引用计数，每次内存对象的创建与销毁都必须修改引用计数，从而在大量的对象创建时，需要大量的执行修改引用计数操作，对于程序执行过程中，额外的性能开销是令人可怕的。回收的触发时机有两种可能，一是用户主动调用gc.collect(),二是对象数量超过阈值。

所以正是GC拖慢了程序的性能，所以我们可以考虑在处理的时候禁止垃圾回收。

通过这样的改进之后速度确度会有很大的提升。但是又有也会另外的一个问题，内存溢出，由于运行的过程中生成大量的对象，一次使用后就没有了引用，由于关闭了垃圾回收机制，一直存在内存中得不到清理，然后程序的内存使用量越来越大。解决的方法就是定期打开gc.enable()再关闭或者主动调用gc.collect(),这样就可以了。

通过上述的改进后程序确实了很多，可是我的程序还是运行的越来越慢，我都怀疑人生了，然后分别测试了各个步骤所花费的时间才知道了原因，我使用了pandas创建一个DataFrame,然后每次迭代得到的结果都添加新的数据到DataFrame中，随着里边的数据越来越多，添加的速度也就越来越慢了，严重的拖累的运行速度。这里的解决方法有两个：

1 分段保存结果，间隔一段时间就保存一次结果，最后再将多次的结果合并。

2 换一个数据存储方法，我是直接使用了python的字典进行保存结果，它随着数据的增多添加的速度也会变慢，但是差别不是很大，在可接受的范围内，可以使用；或者再加上方法1，分段进行保存再合并也是可以的。