2021¶

2021年8月24日
需要 1 分钟阅读时间

docker storage

docker 有3种方式使用系统存储:

bind: 宿主机目录映射方式，启动容器命令添加参数-v dir1:dir2。将宿主机的目录dir1挂载到容器的dir2目录，实际执行的mount -o bind类似命令
volume: 由docker管理的存储，先创建后使用，且可以在多个容器中共享，是官方推荐的方式
tmpfs: 使用宿主机的内存作为存储，这种使用内存文件系统来挂载到容器目录, 使用参数--mount type=tmpfs,destination=/dir, tmpfs是退出即释放的一种文件系统

docker使用的文件系统

docker使用的文件系统经过很多变化，而且在各发行版下可能不同，但目前主流的是overlay2，执行docker info 查看当前使用的是overlay2

sudo docker info | grep  Storage                                                                                                                                              
 Storage Driver: overlay2

除了overlay2，还有aufs（ubuntu），devicemapper（centos），btrfs和zfs。他们的实现都不同，都能支持分层和支持写时复制（Cow/copy-on-write），而他们实现的方式有区别，所以效率也有区别

分层：镜像都是分层的，在Dockerfile构建时，每次执行COPY/RUN时，都会增加一层
写时复制: 在容器或者DockerFile执行修改操作时，包括权限修改，会将lower layer 的文件复制到container层再修改

而容器就是在镜像顶层压栈了一个可写层，而且是临时的，当容器销毁时，这层的文件也会删除

overlay的优势

page caching，可以在多个不同实例之间共享
不同层之间，相同文件使用硬连接，节省inode 和大小

写时复制 copy-up 会导致第一次写时造成延迟，特别是大文件，拷贝起来费时。但第二次就不会延时，而且overlay2 有caching，相比其它文件系统，更减少延时

overlay的问题

实现不够完全，例如没有实现uname
先只读打开一个文件 open（read），再读写打开相同文件open（write），两个fd 会对应2个不同文件，第一个对应的lower的文件，第二个造成写时复制，对应容器里的文件。
规避方法是先执行touch 操作。现实的例子是 yum 需要安装yum-plugin-ovl。但这个只有7.2才支持，之前的话就需要先touch /var/lib/rpm/*

最佳实践

使用ssd
对于写操作比较多的场景，例如数据库，应使用映射文件(bind)或者volume。这样跳过了overlay的复杂操作，直接使用主机的文件系统

overlay的增删改

当运行docker容器时查看挂载

overlay on /var/lib/docker/overlay2/04ea1faa8074e5862f40eecdba968bd9b7f222cb30e5bf6a0b9a9c48be0940f2/merged type overlay (rw,relatime,lowerdir=/var/lib/docker/overlay2/l/B74PWZCBMRCWXFH5UL2ZXB5WEU:/var/lib/docker/overlay2/l/WNHICVPVSDNUGSCZW435TPSMOK,upperdir=/var/lib/docker/overlay2/04ea1faa8074e5862f40eecdba968bd9b7f222cb30e5bf6a0b9a9c48be0940f2/diff,workdir=/var/lib/docker/overlay2/04ea1faa8074e5862f40eecdba968bd9b7f222cb30e5bf6a0b9a9c48be0940f2/work)

docker 将镜像的文件挂载为只读，将容器层挂载为可读可写。文件系统可以分为2部分 upper（容器层） + lower （镜像层）

当在容器里执行写时，如果文件不存在，会依次遍历lower。如果都不存在就会在upper层创建文件
读也相同
删除时会创建一个without 来隐藏，这是为什么即使删除容器里的文件，镜像还是会增大。
删除目录情况也差不多

特殊情况

在保存容器后(docker commit)，会多一层，里面包含了修改的文件，以及删除后生成的without文件，然后生成镜像

但对于以下特殊目录文件不会提交，因为这些文件是运行时docker 要根据用户配置进行修改的。

/etc/hostname
/etc/hosts
/etc/resov.conf

例如docker 的link选项，会在容器的hosts 文件里定义对应的容器名->容器ip

手动mount overlayfs的例子

.
├── A
│   ├── aa
│   └── a.txt
├── B
│   ├── a.txt
│   └── b.txt
├── C
│   └── c.txt
└── worker
    └── work [error opening dir]

overlay 挂载到/tmp/test目录 sudo mount -t overlay overlay -o lowerdir=A:B,upperdir=C,workdir=worker /tmp/test/

查看test目录

/tmp/test/
├── aa
├── a.txt
├── b.txt
└── c.txt

mount  | grep 'overlay'
overlay on /tmp/test type overlay (rw,relatime,lowerdir=A:B,upperdir=C,workdir=worker)

参考

https://docs.docker.com/storage/storagedriver/

2021年8月2日
需要 1 分钟阅读时间

shell 中文件操作接口

读行

while read line ;do
#or while read -r line ;do
echo $line
done < $1

cat $1 | while read line ;do
echo $line
done

使用for时，结果略有不同, for以空格为一行

for line in $(cat $1) ;do
echo $line
done

reference

https://bash.cyberciti.biz/guide/Reads_from_the_file_descriptor_(fd)

2021年6月25日
需要 1 分钟阅读时间

setup sftp service

curlfs 和 sshfs 客户端

在debian上，之前一直用curlfs工具，将远程目录mount到本地目录。系统升级之后发现这个包没有了，原来因为ftp不安全，所以现在推荐sshfs。

reference

https://www.linuxtechi.com/configure-sftp-chroot-debian10/

2021年6月18日
需要 1 分钟阅读时间

c++ 存储周期、链接和作用域

c++中变量和函数的三个重要属性

存储周期类型：有关变量的创建和销毁链接类型：有关变量函数的内存位置作用域: 有关变量函数的可见范围

本文讨论的标识符，包括变量和函数

存储说明符

存储说明符控制变量何时分配和释放，有以下几种

automatic
thread_local
static
register
mutable
extern

说明 - automatic: 最常见的局部变量，且没有声明为static或者thread_local，位于栈上, 随着代码块的执行和结束而自动分配和销毁 - static: 静态变量, 在程序启动和结束时创建和销毁，但初始化是在第一次执行初始化代码时执行 - thread: 在线程开始和结束时分配和销毁 - dynamic: 最常见的堆上的变量, 需要执行new和delete,

auto 在c++11中不是声明存储周期，而是类型推导符, 但这种存储周期类型的依然存在（局部变量）

初始化的时机

automatic: 必须手动初始化，换句话说局部变量必须初始化，否则值为不确定
static: 在执行时初始化，且初始化一次，特殊情况下在执行前初始化
thread: 因为thread_local变量自带static性质，所以认为其同于static
dynamic: 在new时初始化

Linkage

标识符（变量&函数）用一块内存里的值或者函数体来表示的，而linkage决定其他相同的标识符是否指向同一块内存。c/c++有3种linkage, no-linkage, internal linkage和external linkage

no linkage 局部变量没有linkage, 所以两个a是独立的，后面的a会覆盖前面的a，不相干。此时linkage与可见域(scope)类似
internal linkage 表示只能在文件内部访问(file scope)，换句话就是不会暴露给链接器，用修饰符static声明internal linkage，所以允许在不同文件声明两个名称&类型相同的internal linkage 标识符，他们指向不同的内存单元。
external linkage 表示可以在程序所有地方访问，包括外部文件(global scope)，所以是真“全局”（scope&linkage），所有标识符指向独一份内存。

constexpr 特殊情况

虽然通过给constexpr添加extern修饰符来让其具备external属性，但不能在其他文件前置声明。因为constexpr是在编译期替换的，编译器（compile)的可见域限定在文件内，所以编译期无法知道constexpr的值，所以在编译期无法获取到其内存单元的值，也就无法在其他文件进行声明，只能定义。

file scope和global scope

局部变量的scope、no-linkage以及duration相同，从{开始到}结束。理论上global scope涵盖了file scope。而linkage来规定其是否能在其他文件里使用。

参考

https://en.cppreference.com/w/cpp/language/storage_duration

2021年4月15日
需要 1 分钟阅读时间

Linux 调优

系统原厂商是不喜欢讨论系统调优的，一方面说起来没完没了，二来比较复杂，而且私以为调优即说明系统默认不够好？

而且SUSE的原厂规定:

原理机制的介绍及系统调优并不在我们的技术支持范畴

这里是一点相关介绍

buffer是用于存放将要输出到disk（块设备）的数据，而cache是存放从disk上读出的数据。二者都是为提高IO性能而设计的。
- buffer：缓冲将数据缓冲下来，解决速度慢和快的交接问题；速度快的需要通过缓冲区将数据一点一点传给速度慢的区域。
例如：从内存中将数据往硬盘中写入，并不是直接写入，而是缓冲到一定大小之后刷入硬盘中。
A buffer is something that has yet to be "written" to disk.

cache：缓存实现数据的重复使用，速度慢的设备需要通过缓存将经常要用到的数据缓存起来，缓存下来的数据可以提供高速的传输速度给速度快的设备。
例如：将硬盘中的数据读取出来放在内存的缓存区中，这样以后再次访问同一个资源，速度会快很多。
A cache is something that has been "read" from the disk and stored for later use.

总之buff和cache都是内存和硬盘之间的过渡，前者是写入磁盘方向，而后者是写入内存方向

回收cache

drop_caches回收一下。
#sync;sync;sync
#echo 3 > /proc/sys/vm/drop_caches

free增加300M

swap 介绍

Swap意思是交换分区，是硬盘中的一个分区。内核将内存Page移出内存到swap分区(swap out)

swap通过 vm.swappiness 这个内核参数控制，默认值是60。cat /proc/sys/vm/swappiness 可以查看当前值
这个参数控制内核使用swap的优先级。该参数从0到100。

设置该参数为0，表示只要有可能就尽力避免交换进程移出物理内存；
设置该参数为100，这告诉内核疯狂的将swapout物理内存移到swap分区。注意：设置该参数为0，并不代表禁用swap分区，只是告诉内核，能少用到swap分区就尽量少用到，设置vm.swappiness=100的话，则表示尽量使用swap分区。

这里面涉及到当然还涉swappiness及到复杂的算法。如果以为所有物理内在用完之后，再使用swap, 实事并不是这样。以前曾经遇到过，物理内存只剩下10M了，但是依然没有使用Swap交换空间，另外一台服务器，物理内存还剩下15G，居然用了一点点Swap交换空间。其实少量使用Swap交换空间是不会影响性能，只有当内存资源出现瓶颈或者内存泄露，进程异常时导致频繁、大量使用交换分区才会导致严重性能问题。

问题：何时使用swap

这个问题如上面说的，比较难说，理论上是当物理内存不够用的时候，又需要读入内存时，会将一些长时间不用的程序的内存Page 交换出去。
但是很多时候会发现，内核即使在内存充足的情况下也是使用到swap

问题: 那些东西被swap了？

可以看下面的测试

回收swap

swapoff 之后执行sudo sysctl vm.swappiness=0 临时让内核不用swapout

并把swap的数据加载内存，并重启swap 
#swapoff -a
#swapon -a

即把swap分区清空, 自测效果如下，内核版本5.10.0-8-amd64

               total        used        free      shared  buff/cache   available
Mem:        12162380     4911564     5605744      459364     1645072     6466572
Swap:        1000444      763040      237404

重启swap后

               total        used        free      shared  buff/cache   available
Mem:        12162380     5605800     4843176      524984     1713404     5707112
Swap:        1000444           0     1000444

可见，停用swap后，swap的used大部分到了mem的used，小部分到了Mem的shared

调优的一些有效工具

perf + flame火焰图: 查看运行耗时，可以查看函数调用耗时，如果是自己的程序，可以知道哪些函数需要优化 vmstat 查看磁盘io情况，使用vmstat -t 3命令，如果b状态的数字一直很大，那么说明磁盘阻塞严重，可能是磁盘坏了，可能是程序设计不合理

还有top，iperf等等