本文目录一览：

为什么用Python做数据分析
为什么在Python里推荐使用多进程而不是多线程
数据分析为什么用python
为什么在python里推荐使用多进程而不是多线程
为什么在Python里推荐使用多进程而不是多

为什么用Python做数据分析

为什么用Python做数据分析原因如下：

python大量的库为数据分析提供了完整的工具集 python拥有numpy、matplotlib、scikit-learn、pandas、ipython等工具在科学计算方面十分有优势，尤其是pandas，在处理中型数据方面可以说有着无与伦比的优势，已经成为数据分析中流砥柱的分析工具。
比起MATLAB、R语言等其他主要用于数据分析语言，python语言功能更加健全 Python具有强大的编程能力，这种编程语言不同于R或者matlab，python有些非常强大的数据分析能力，并且还可以利用Python进行爬虫，写游戏，以及自动化运维，在这些领域中有着很广泛的应用，这些优点就使得一种技术去解决所有的业务服务问题，这就充分的体现的Python有利于各个业务之间的融合。如果使用Python，能够大大的提高数据分析的效率。
python库一直在增加，算法的实现采取的方法更加创新
python能很方便的对接其他语言，比如c、java等。 Python最大的优点那就是简单易学。Python代码十分容易被读写，最适合刚刚入门的朋友去学习。我们在处理数据的时候，一般都希望数据能够转化成可运算的数字形式，这样，不管是没学过编程的人还是学过编程的人都能够看懂这个数据。其实现如今，Python是一个面向世界的编程语言，Python对于如今火热的人工智能也有一定的帮助，这是因为人工智能需要的是即时性，而Python是一种非常简洁的语言，同时有着丰富的数据库以及活跃的社区，这样就能够轻松的提取数据，从而为人工智能做出优质的服务。通过上面的描述，相信大家已经知道了使用Python做数据分析的优点了。Python语言得益于它的简单方便，使得其在大数据、数据分析以及人工智能方面都有十分明显的存在感，对于数据分析从业者以及想要进入数据分析行业的人来说，简单易学容易上手的优势也是一个优势，所以不管大家是否进入数据分析行业，学习Python是没有坏处的。 Python中文网，大量Python视频教程，欢迎学习！

为什么在Python里推荐使用多进程而不是多线程

因为python的底层实现GIL对于多线程的支持并不好。还是只使用CPU的一个核，效率不高如果是多进程的话，可以充分利用CPU，就是资源可能会用的多一点

数据分析为什么用python

究其原因，主要有以下几点： ①Python的语法简单，代码可读性高，易于上手，有利于初学者学习;当我们处理数据时，我们希望使数据数字化并将其转换为计算机可以操作的数字形式。我们可以直接使用一个行列表推导来完成，这非常简单。 ②Python在数据分析和交互，探索性计算和数据可视化方面拥有非常成熟的库和活跃的社区，这使Python成为数据任务处理的重要解决方案。在数据处理和分析方面，Python具有numpy，pandas，Matplotlib，scikit-learn，IPython和其他出色的库和工具，尤其是pandas在数据处理方面具有绝对优势。 ③Python具有很强的通用编程能力，这与别的编程语言不同。Python不仅在数据分析方面功能强大，而且在爬虫，web，运维甚至游戏等领域也发挥着非常重要的作用。公司只需一项技术即可完成所有服务，这有利于业务整合并可以提高工作效率。 ④Python是人工智能的首选编程语言。在人工智能时代，Python已成为最受欢迎的编程语言。得益于Python语法简洁，丰富的库和社区，大多数深度学习框架都优先支持Python语言。

为什么在python里推荐使用多进程而不是多线程

监控一个信号就起一个线程与进程处理。这样的逻辑是不太合适的。所有的资源都是有限的，如果这样浪费很快会资源管理失控。常规的做法是起一个线程池，或者是进程池。使用线程还是进程取决于你处理的信号的类型。如果计算量大，则需要进程池，如果只是设备等待，比如网络数据收发，则线程也勉强够用。信号过来后处理方法有两种，一种是实时处理，这个没有好办法，可以用“微线程”的办法做，尽量减少处理周期。另外一种是允许少量的延迟。那么通常的做法是用队列。将信号放到线程或者是进程池的消息队列里。然后再由后者分配。还有一种高效的处理方法，根据信号的值做hash，然后自动分发到不同的CPU或者是服务器。这个就算是大规模并发处理机制。通常情况下，比如一个WEB服务器，它需要获取一个请求，然后处理响应，可以使用线程模型，或者是进程模型。也是使用典型的池的方法。一个Pool的大于，取决于你的计算机的计算能力，内存大小，以及你的并发访问数量。所要要启用多少个呢？假设你的一个信号的处理周期是1秒，你同时有100个信号进来，那么就需要100个线程或者是进程。

为什么在Python里推荐使用多进程而不是多

最近在看Python的多线程，经常我们会听到老手说：“Python下多线程是鸡肋，推荐使用多进程！”，但是为什么这么说呢？
要知其然，更要知其所以然。所以有了下面的深入研究：
首先强调背景：

GIL是什么？ GIL的全称是Global Interpreter Lock(全局解释器锁)，来源是python设计之初的考虑，为了数据安全所做的决定。
每个CPU在同一时间只能执行一个线程（在单核CPU下的多线程其实都只是并发，不是并行，并发和并行从宏观上来讲都是同时处理多路请求的概念。但并发和并行又有区别，并行是指两个或者多个事件在同一时刻发生；而并发是指两个或多个事件在同一时间间隔内发生。）在Python多线程下，每个线程的执行方式：
获取GIL
1. 释放GIL
  可见，某个线程想要执行，必须先拿到GIL，我们可以把GIL看作是“通行证”，并且在一个python进程中，GIL只有一个。拿不到通行证的线程，就不允许进入CPU执行。
  在Python2.x里，GIL的释放逻辑是当前线程遇见IO操作或者ticks计数达到100（ticks可以看作是Python自身的一个计数器，专门做用于GIL，每次释放后归零，这个计数可以通过 sys.setcheckinterval 来调整），进行释放。
  而每次释放GIL锁，线程进行锁竞争、切换线程，会消耗资源。并且由于GIL锁存在，python里一个进程永远只能同时执行一个线程(拿到GIL的线程才能执行)，这就是为什么在多核CPU上，python的多线程效率并不高。
  那么是不是python的多线程就完全没用了呢？
  在这里我们进行分类讨论：
CPU密集型代码(各种循环处理、计数等等)，在这种情况下，由于计算工作多，ticks计数很快就会达到阈值，然后触发GIL的释放与再竞争（多个线程来回切换当然是需要消耗资源的），所以python下的多

为什么在python里（会Python吗）