本文目录一览：

手撸golang 基本数据结构与算法图的搜索深度优先/广度优先
【golang详解】go语言GMP(GPM)原理和调度
Golang的垃圾回收
golang变量(二)——map和slice详解
golang面试题2之判断字符串中字符是否全都不同
（十一）golang 内存分析

手撸golang 基本数据结构与算法图的搜索深度优先/广度优先

最近阅读我的第一本算法书(【日】石田保辉；宫崎修一) 本系列笔记拟采用golang练习之

graph_visit_test.go
顶点接口
图的遍历器接口
顶点的实现
候选节点队列接口。候选节点的选择方式不同, 决定了是深度优先还是广度优先。
LIFO堆栈, 实现INodeQueue接口
FIFO队列, 实现INodeQueue接口
遍历器, 实现IGraphVisitor接口 (end)

【golang详解】go语言GMP(GPM)原理和调度

Goroutine调度是一个很复杂的机制，下面尝试用简单的语言描述一下Goroutine调度机制，想要对其有更深入的了解可以去研读一下源码。

GMP含义：

G：goroutine，每个go关键字都会创建一个协程。
M：thread内核级线程，所有的G都要放在M上才能运行。
P：processor处理器，调度G到M上，其维护了一个队列，存储了所有需要它来调度的G。 Goroutine 调度器P和 OS 调度器是通过 M 结合起来的，每个 M 都代表了 1 个内核线程，OS 调度器负责把内核线程分配到 CPU 的核上执行。

调度机制：

1. Work stealing机制

当本线程无可运行的G时，尝试从其他线程绑定的P偷取G，而不是销毁线程。

2. Hand off机制

当本线程M0因为G0进行系统调用阻塞时，线程释放绑定的P，把P转移给其他空闲的线程执行。进而某个空闲的M1获取P，继续执行P队列中剩下的G。而M0由于陷入系统调用而进被阻塞，M1接替M0的工作，只要P不空闲，就可以保证充分利用CPU。M1的来源有可能是M的缓存池，也可能是新建的。当G0系统调用结束后，根据M0是否能获取到P，将会将G0做不同的处理：

如果有空闲的P，则获取一个P，继续执行G0。
如果没有空闲的P，则将G0放入全局队列，等待被其他的P调度。然后M0将进入缓存池睡眠。

GOMAXPROCS

设置P的数量，最多有GOMAXPROCS个线程分布在多个CPU上同时运行。在Go中一个goroutine最多占用CPU 10ms，防止其他goroutine被饿死。具体可以去看另一篇文章：

【Golang详解】go语言调度机制抢占式调度

协程创建流程

我们创建一个协程 go func() 经历过程如下图：说明：

这里有两个存储G的队列，一个是局部调度器P的本地队列、一个是全局G队列。新创建的G会先保存在P的本地队列中，如果P的本地队列已经满了就会保存在全局的队列中；处理器本地队列是一个使用数组构成的环形链表，它最多可以存储 256 个待执行任务。
G只能运行在M中，一个M必须持有一个P，M与P是1:1的关系。M会从P的本地队列弹出一个可执行状态的G来执行，如果P的本地队列为空，就会想其他的MP组合偷取一个可执行的G来执行；
一个M调度G执行的过程是一个循环机制；会一直从本地队列或全局队列中获取G
上面说到P的个数默认等于CPU核数，每个M必须持有一个P才可以执行G，一般情况下M的个数会略大于P的个数，这多出来的M将会在G产生系统调用时发挥作用。类似线程池，Go也提供一个M的池子，需要时从池子中获取，用完放回池子，不够用时就再创建一个。

work-stealing调度算法

当M执行完了当前P的本地队列里的所有G后，P也不会就这么在那躺尸啥都不干，它会先尝试从全局队列寻找G来执行，如果全局队列为空，它会随机挑选另外一个P，从它的队列里中拿走一半的G到自己的队列中执行。

异常情况下的行为

Go runtime会在下面的goroutine被阻塞的情况下运行另外一个goroutine：

用户态阻塞/唤醒

当goroutine因为channel操作或者network I/O而阻塞时（实际上golang已经用netpoller实现了goroutine网络I/O阻塞不会导致M被阻塞，仅阻塞G），对应的G会被放置到某个wait队列(如channel的waitq)，该G的状态由_Gruning变为_Gwaitting，而M会跳过该G尝试获取并执行下一个G，如果此时没有可运行的G供M运行，那么M将解绑P，并进入sleep状态；当阻塞的G被另一端的G2唤醒时（比如channel的可读/写通知），G被标记为，尝试加入G2所在P的runnext（runnext是线程下一个需要执行的 Goroutine。），然后再是P的本地队列和全局队列。

系统调用阻塞

当M执行某一个G时候如果发生了阻塞操作，M会阻塞，如果当前有一些G在执行，调度器会把这个线程M从P中摘除，然后再创建一个新的操作系统的线程(如果有空闲的线程可用就复用空闲线程)来服务于这个P。当M系统调用结束时候，这个G会尝试获取一个空闲的P执行，并放入到这个P的本地队列。如果获取不到P，那么这个线程M变成休眠状态，加入到空闲线程中，然后这个G会被放入全局队列中。

队列轮转

可见每个P维护着一个包含G的队列，不考虑G进入系统调用或IO操作的情况下，P周期性的将G调度到M中执行，执行一小段时间，将上下文保存下来，然后将G放到队列尾部，然后从队列中重新取出一个G进行调度。除了每个P维护的G队列以外，还有一个全局的队列，每个P会周期性地查看全局队列中是否有G待运行并将其调度到M中执行，全局队列中G的来源，主要有从系统调用中恢复的G。之所以P会周期性地查看全局队列，也是为了防止全局队列中的G被饿死。

M0 和 G0

M0：启动程序后的编号为0的主线程，这个M对应的实例会在全局变量runtime.m0中，不需要在heap上分配，M0负责执行初始化操作和启动第一个G，在之后M0就和其他的M一样了。
G0：是每次启动一个M都会第一个创建的goroutine，G0仅用于负责调度G，G0不指向任何可执行的函数，每个M都会有一个自己的G0，在调度或系统调用时会使用G0的栈空间，全局变量的G0是M0的G0。

一个G由于调度被中断，此后如何恢复？

中断的时候将寄存器里的栈信息，保存到自己的G对象里面。当再次轮到自己执行时，将自己保存的栈信息复制到寄存器里面，这样就接着上次之后运行了。我这里只是根据自己的理解进行了简单的介绍，想要详细了解有关GMP的底层原理可以去看Go调度器 G-P-M 模型的设计者的文档或直接看源码。参考： ()
()

Golang的垃圾回收

最近垃圾分类的话题热度一下子就上去了，很多人因为垃圾分类的问题很头痛。因为垃圾这个话题，那我就想来说说Golang里面的垃圾，于是就有了这篇博客，golang中的垃圾回收。现阶段网上针对golang垃圾回收的解析已经很多了，所以我也没有必要仔仔细细的一点点说，还是那个原则，用最直白的话告诉你，垃圾到底是怎么收的。首先本文后续都会使用 GC 代替垃圾回收这几个字。我们知道创建对象会给他分配内存资源，如果这个对象不使用了，而这个内存资源却一直被占用的话，那么我们的电脑很快就会被放满，所以需要将这些垃圾对象进行回收。要回收，那么我们必须知道什么才是垃圾，什么不是垃圾。在我们看来，一个对象以后都不用了，就是垃圾。在程序看来，一个对象没有被引用了，就是垃圾。首先说明一下，下面说的停，都是STW，stop the world，全世界暂停，所有运行的都停下来了。告诉所有人，停一下，我来记录一下当前状态。告诉所有人，你们继续，该干嘛干嘛，我标记一下要用的对象。一开始所有点是白色，首先从根节点出发，标记相连的点为灰色（相连证明有引用），并且将所有灰色的点存起来；告诉所有人，再停一下，在第二个过程中，因为所有人继续在工作，那么就会产生新的垃圾，因为第一个过程记录了状态，所以需要标记一下新的垃圾；然后清除所有白色的点，因为白色的点是没人引用的，也就是垃圾。你一定会有这样的疑问：那么既然会导致那么多问题，为什么不直接停下来，标记完回收完了再开始呢？因为慢~ 所以这样GC的原因是既要保证GC正常执行，又要保证效率，不能停的时间太长。其实第一次停的时候，启动了一个写屏障 (write barrier)它需要记录后续过程中新创建的对象。这个过程称为三色标记，有点类似广度优先搜索。这次是必须停，因为在第二个过程中引用会发生变化，从而需要停止后重新扫描一遍；然后关闭写屏障，最后再清理。开启写屏障时需要stw
关闭写屏障前需要stw
开启写屏障之后的标记过程与其他程序并发执行
关闭写屏障之后的清扫过程与其他程序并发执行
那毕竟GC还是需要STW的，虽然可能停止时间很短，但是对于程序来说，整个程序停止1秒那对于用户来说就是致命打击。所以GC肯定需要一个触发的条件，不能想来就来。这是一个触发的条件，默认GC百分比设置的是100，意思是，如果这次回收之后总共占用2M的内存，那么下次触发的条件时当超过4M的时候；同理，当这次回收之后总共占用4M，那么下次触发条件就是8M。这个简单，当一定时间（2分钟）没有执行过GC就触发GC。使用命令 `runtime.GC()` 手动触发GC。以上就是在golang中垃圾回收的大致流程，总的来说使用三色标记法进行标记清除，并且标记时与程序运行并行，为了解决问题使用写屏障来记录标记过程中对象的变更。总来的说也是为了提高垃圾回收的效率，并且尽可能的减少STW的时间。了解下来，与java的分代回收相比，golang中的回收算法理解起来更加简单一些。

golang变量(二)——map和slice详解

衍生类型，`interface{}` , `map`, `[]`, `struct`等。 `map`类似于java的hashmap，python的dict，php的hash array。常规的for循环，可以用`for k,v :=range m {}`。但在下面清空有一个坑注意：著名的`map[string]*struct`副本问题。结果： Go 中不存在引用传递，所有的参数传递都是值传递，而map是等同于指针类型的，所以在把map变量传递给函数时，函数对map的修改，也会实质改变map的值。 `slice`类似于其他语言的数组（list，array），slice初始化和map一样，这里不在重复。除了Pointer数组外，`len`表示使用长度，`cap`是总容量，`make([]int, len, cap)`可以预申请比较大的容量，这样可以减少容量拓展的消耗，前提是要用到。 `cap`是计算切片容量，`len`是计算变量长度的，两者不一样。具体例子如下：结果：分析：`cap`是计算当前slice已分配的容量大小，采用的是预分配的伙伴算法（当容量满时，拓展分配一倍的容量）。 `append`是slice非常常用的函数，用于添加数据到slice中，但如果使用不好，会有下面的问题：预期是`[1 2 3 4 5 6 7 8 9 10]`，`[1 2 3 4 5 6 7 8 9 10 11 12]`，但实际结果是：注意slice是值传递，修改一下：输出如下： `==` 只能用于判断常规数据类型，无法使用用于slice和map判断，用于判断map和slice可以使用`reflect.DeepEqual`，这个函数用了递归来判断每层的k，v是否一致。当然还有其他方式，比如转换成json，但小心有一些异常的bug，比如html编码，具体这个json问题，待后面在分析。

golang面试题2之判断字符串中字符是否全都不同

请实现一个算法，确定一个字符串的所有字符是否全都不同。这要求不允许使用额外的存储结构。给定一个string，请返回一个bool值，true代表所有字符全不同，false代表存在相同的字符。保证字符串中的字符为ASCII字符。字符串长度小于等于3000。这有几个重点：

第一个是ASCII字符，ASCII字符共有256个，其中128个是常见字符，可以在键盘上输入。128之后的是键盘上无法找到的。
然后是全部不同，也就是字符串中的字符没有重复的。
不准使用额外的储存结构，且字符串长度小于等于3000。如果不允许其他额外储存结构，这个题可以使用golang内置的方式实现。通过 strings.Count 函数判断：使用的是golang内置方法 strings.Count，可以用来判断在一个字符串中包含的另外一个字符串的数量。还有不同的方法同样可以实现，你了解吗? 推荐go相关技术专栏：
gRPC-go源码剖析与实战_带你走进gRPC-go的源码世界-CSDN博客

（十一）golang 内存分析

编写过C语言程序的肯定知道通过malloc()方法动态申请内存，其中内存分配器使用的是glibc提供的ptmalloc2。除了glibc，业界比较出名的内存分配器有Google的tcmalloc和Facebook的jemalloc。二者在避免内存碎片和性能上均比glibc有比较大的优势，在多线程环境中效果更明显。 Golang中也实现了内存分配器，原理与tcmalloc类似，简单的说就是维护一块大的全局内存，每个线程(Golang中为P)维护一块小的私有内存，私有内存不足再从全局申请。另外，内存分配与GC（垃圾回收）关系密切，所以了解GC前有必要了解内存分配的原理。为了方便自主管理内存，做法便是先向系统申请一块内存，然后将内存切割成小块，通过一定的内存分配算法管理内存。以64位系统为例，Golang程序启动时会向系统申请的内存如下图所示：预申请的内存划分为spans、bitmap、arena三部分。其中arena即为所谓的堆区，应用中需要的内存从这里分配。其中spans和bitmap是为了管理arena区而存在的。

arena的大小为512G，为了方便管理把arena区域划分成一个个的page，每个page为8KB,一共有512GB/8KB个页；
spans区域存放span的指针，每个指针对应一个page，所以span区域的大小为(512GB/8KB)乘以指针大小8byte = 512M；
bitmap区域大小也是通过arena计算出来，不过主要用于GC。 span是用于管理arena页的关键数据结构，每个span中包含1个或多个连续页，为了满足小对象分配，span中的一页会划分更小的粒度，而对于大对象比如超过页大小，则通过多页实现。根据对象大小，划分了一系列class，每个class都代表一个固定大小的对象，以及每个span的大小。如下表所示：上表中每列含义如下：
class：class ID，每个span结构中都有一个class ID, 表示该span可处理的对象类型；
bytes/obj：该class代表对象的字节数；
bytes/span：每个span占用堆的字节数，也即页数乘以页大小；
objects：每个span可分配的对象个数，也即（bytes/spans）/（bytes/obj）；
waste bytes：每个span产生的内存碎片，也即（bytes/spans）%（bytes/obj）。上表可见最大的对象是32K大小，超过32K大小的由特殊的class表示，该class ID为0，每个class只包含一个对象。 span是内存管理的基本单位，每个span用于管理特定的class对象，根据对象大小，span将一个或多个页拆分成多个块进行管理。src/runtime/mheap.go:mspan定义了其数据结构。以class 10为例，span和管理的内存如下图所示： spanclass为10，参照class表可得出npages=1,nelems=56,elemsize为144。其中startAddr是在span初始化时就指定了某个页的地址。allocBits指向一个位图，每位代表一个块是否被分配，本例中有两个块已经被分配，其allocCount也为2。next和prev用于将多个span链接起来，这有利于管理多个span。有了管理内存的基本单位span，还要有个数据结构来管理span，这个数据结构叫mcentral，各线程需要内存时从mcentral管理的span中申请内存，为了避免多线程申请内存时不断的加锁，Golang为每个线程分配了span的缓存，这个缓存即是cache。src/runtime/mcache.go:mcache定义了cache的数据结构。 mchache在初始化时是没有任何span的，在使用过程中会动态的从central中获取并缓存下来，根据使用情况，每种class的span个数也不相同。 cache作为线程的私有资源为单个线程服务，而central则是全局资源，为多个线程服务，当某个线程内存不足时会向central申请，当某个线程释放内存时又会回收进central。src/runtime/mcentral.go:mcentral定义了central数据结构。从mcentral数据结构可见，每个mcentral管理着一组有相同class的span列表。从数据结构可见，每个mcentral对象只管理特定的class规格的span。事实上每种class都会对应一个mcentral,这个mcentral的集合存放于mheap数据结构中。src/runtime/mheap.go:mheap定义了heap的数据结构。系统预分配的内存分为spans、bitmap、arean三个区域，通过mheap管理起来。接下来来看内存分配过程。针对待分配对象的大小不同有不同的分配逻辑：
(0, 16B) 且不包含指针的对象：Tiny分配；
(0, 16B) 包含指针的对象：正常分配；
[16B, 32KB]：正常分配；
(32KB, -)：大对象分配。其中Tiny分配和大对象分配都属于内存管理的优化范畴，这里暂时仅关注一般的分配方法。以申请size为n的内存为例，分配步骤如下： Golang内存分配是个相当复杂的过程，其中还掺杂了GC的处理，这里仅仅对其关键数据结构进行了说明，了解其原理而又不至于深陷实现细节。

Golang程序启动时申请一大块内存并划分成spans、bitmap、arena区域；
arena区域按页划分成一个个小块；
span管理一个或多个页；
mcentral管理多个span供线程申请使用；
mcache作为线程私有资源，资源来源于mcentral。

golang分金币算法,GoGo币