container
这份文档相当于是hpds(high performance data structure)代码仓的内容介绍,在工作中我们会遇到很多不同的场景,不同场景下使用什么样的数据结构最高效是一个很有研究价值的问题;同时另一个问题是我们能不能使用C/C++等语言帮助我们实现这些数据结构的高效实现,然后暴露出对外接口。
那么第一步是要找到有意义的问题,然后再解决,我们的问题主要从这些源采集:
- 问答网站
- stackoverflow
- benchmark
- 各种blog
- paper,以及各类标准算法以及机器学习算法(benchmark-suite)
- code
- github gist
- github/gitlab..
- 算法题网
- exercism
- project-euler
- hackerrank
落到编码层面,一个具体的实现通常需要考虑两方面的问题:
- 数据结构本身的结构(算法层面)
- 实现上的trick,比如simd,或者是代码可读性(工程层面)
值得注意的是,不少的代码仓并不会对构造对象做详尽的benchmark,这种情况下,我会尽可能的补充合适的benchmark snippet,并对结果进行分析
根本问题
在进入到更细致的问题之前,我们可以考虑一下一些根本性的问题:
- container和data structure是什么关系
- 什么算是数据结构的根本问题?
- 数据结构的设计和场景有直接关系,那该如何给场景本身划分层次?
- 如果让你总结,如何给数据结构的知识划分层次?
- 让你给自己的编程语言设计标准库,你会如何设计?
下面是对这些问题的一些探讨
container/collections vs data structure
首先我们平时工作中接触的最多的“东西”应该是container,好比Python中的list和dict以及C++中的std:vector, std:map等,它们都是容器,暴露了一部分CRUD接口的存储对象。容器的特性可以用三种行为来表征:
- access
- storage
- traversal
这些对象被期望实现下列这些接口:
- 构造
- 插入对象
- 删除对象
- 清空所有对象
- 访问对象
- 计数
而数据结构是一种更加宽泛的内容,wikipedia上将container和collection都归类为data structure
我们平时讨论的最多的,其实是ADT(abstract data type)
想要找到所有这些的集合,可以去看:xlinux.nist.gov/dads
"根本问题"
你希望通过数据结构的知识解决什么,这些问题便是“根本问题”,对于笔者,好奇的点在于,切实地搞清楚:
- 深入地学习数据结构,主要是学些什么(container/collection or algorithm)
- 开发中的问题对所学知识有怎样的依赖
- 能否通过数据结构的知识做出更好的软件
standard container
我们首先需要看下当下最主流的编程语言们的标准容器是什么样的。首先是,c++ STL容器
场景采集
code
c++ STL容器
可以使用Microsoft的STL作为参考,链接:https://learn.microsoft.com/en-us/cpp/standard-library/cpp-standard-library-reference?view=msvc-170
具体的,我们来看看stl-container STL提供了多种类型安全的容器对象,容器对象都是以类模板的形式实现的,当访问对象中的个别元素时,我们会使用到迭代器-Iterators,C++的容器可以分为3种类型:
- sequence containers
- associative containers
- container adapters
sequence container是维持插入顺序的数据结构,包括:
vector表现像array,但是可以自动增长(动态数组)。数据是随机访问并且连续存储的,其长度是高度可变的。因为上述特性,vector是被使用的最多的一种数据结构。array,与vector类似,但是长度不可变deque,双端队列,可以在头和尾快速插入和删除元素,他依旧是随机访问以及长度随意变化的,但是并非连续存储的(非线性表)list,双向链表,支持快速插入/删除操作,双向访问,但并不支持随机访问forward_list,单链表,前向访问的list版本
associative container,元素以一种预定义的顺序被存储起来,比如升序排序,无序关联容器,所有这类的容器都可以被归位两类子集:maps和sets
- 对于map而言,有
map和unordered_map - set也有
set和unordered_set
container adapters是序列容器或者关联容器的变体,序列容器不支持迭代器。包括这些内容:
queuepriority_queue:有最大值的容器总是在队列的最前方stack
另一方面,我们需要留意一下STL容器的线程安全性,它们满足如下规则:
- 任意对象可同时被多个线程访问
- 如果一个对象在线程A中被该写了,那其他任意现成均禁止访问或者改写该对象
go-bitmap
需要学习的代码是bitmap
用GO(goasm)语言实现的向量化bitmap
xsimd
C++的SIMD指令包装器
static_vector
A dynamically-resizable vector with fixed capacity and embedded storage
https://github.com/gnzlbg/static_vector
主要用于:
- 无法进行内存分配的环境,比如没有空余空间的嵌入式环境,只有静态内存空间是可使用的
- 需要在静态内存段中分配具有复杂生命周期的对象
- static_vector的存储内容本身必须位于对象内部?
在其他库中的实现:
说了这些,可能大家对该数据结构的使用场景还不是特别清楚,我们通过下面例子来深入:
- https://stackoverflow.com/questions/64516180/deciding-to-use-at-runtime-a-booststatic-vector-or-a-stdvector
small_vector
https://github.com/gharveymn/small_vector
Folly-small_vector
可以看这里
https://zhuanlan.zhihu.com/p/353485606
Boost
abseil
CPP_OPtimizations Diary
jemalloc
一种内存分配器(malloc)
https://github.com/jemalloc/jemalloc
scalloc
一种多核可扩展的内存分配器
llvm-benchmark
https://github.com/s3cur3/llvm-data-structure-benchmarks
scattered
Scattered container store each type's data member sequentially for all objects
https://github.com/gnzlbg/scattered
Annoy
plf-lib
PLF是一系列用C++实现的数据结构头文件库,请看
scal
github.com/cksystemsgroup/scal 对比并行数据结构算法
问答网站
Hinnant's short_alloc
https://stackoverflow.com/questions/33722907/hinnants-short-alloc-and-alignment-guarantees
对比矩阵乘法
https://stackoverflow.com/questions/51656818/benchmarking-matrix-multiplication-performance-c-eigen-is-much-slower-than
可以看出,numpy这样的工具已经是被高度优化过的了,所以做一些它比较擅长的事情可以获得很好的性能,那很多时候我们的目标就是找到一些工具还没有覆盖的例程(我们之所以这样做不是为了要大幅优化某一种方法,而是借助这个探索的过程来学习profiling中的一些细节并获得一些经验)
xtensor对比numpy
https://stackoverflow.com/questions/57407106/xtensor-cant-reach-numpy-performance
benchmark
c++ container benchmark
这篇博文来自博文
paper:The Graph based Benchmark Suite
摘要:这是在共享内存的多核系统上完成的一项测试,主要测试的时图的算法。
MineBench: A Benchmark Suite for Data Mining Workloads
cucis.ece.northwestern.edu/projects/DMS/publications/NarOzi06A.pdf
Poster: The Problem-Based Benchmark Suite(PBBS), V2
cs.umd.edu/~laxman/papers/pbbsv2.pdf PBBS是一个基于问题的基准测试套件,包括我多个基准测试,以其IO特性为定义基础,只在比较不同算法的实现,重点对比的是并行算法
benchmarks
比对不同语言性能的benchmarks,访问地址: github.com/kostya/benchmarks
stress-ng
最符合“压力测试”定义的基准测试,
其他资源
- github上Baptiste Wicht的代码以及博客(特别是articles的文章)
- paper: a study of emerging scale-out workloads on modern hardware
- principar kernel analysis: a tractable methodology to simulate scaled gpu workloads
- 一本书《Handbook of Energy-Aware and Green Computing》
- github搜索 bits of architecture
- Tools for microarchitectural benchmarking