Docker 彻底删除私有库镜像的操作

时间:2021-05-19

首先看看网上一般的做法

私有库默认是不支持删除镜像的,需要修改config.yml配置文件,在storage节点下加入 delete: enabled: true ,然后重启私有库。

docker 提供的镜像删除api为:

DELETE ip:端口/v2/<repository>/manifests/<reference>

repository 为镜像的repository

reference 为镜像push成功后生成的 digest:sha256 值

获取 digest :

curl --header "Accept: application/vnd.docker.distribution.manifest.v2+json" -I -XGET <私有库ip>:端口号/v2/<镜像repository>/manifests/<镜像tag>

注意:

--header "Accept: application/vnd.docker.distribution.manifest.v2+json" 这个header 是必须要加的,不加的话Content-Type 是v1+prettyjws,获取的digest是错误的!!

例:

curl --header "Accept: application/vnd.docker.distribution.manifest.v2+json" -I -XGET 192.168.120.107:5000/v2/my-registry/manifests/1.0

删除镜像:

例:

curl -I -X DELETE http://192.168.120.107:5000/v2/my-repository/manifests/sha256:4d523adb3c653bab7dfd0326081860b3cba24dc393f69d6731daa513c435ec0c

删除后我们查看下私有库

curl 192.168.120.107:5000/ v2/my-repository/tags/list

就会发现刚删除的那个tag不见了。但是如果在执行命令的前后车库内私有库镜像存储目录的文件大小,会发现并没有多大的变化

显然数据并没有被真的删除,我们还需要运行docker提供的垃圾回收命令。

垃圾回收

我们需要登录 私有库所在的服务器,然后执行命令:

docker exec -it <私有库的容器ID或者容器名> sh -c ' registry garbage-collect /etc/docker/registry/config.yml'

当然,也可以进入到私有库的容器中,再执行:

docker exec -it <私有库的容器ID或者容器名> shregistry garbage-collect /etc/docker/registry/config.yml

这种方法特别麻烦,只能删tag,不会删repository,删除之后会在blobs目录下留下很多空文件夹,而且如果一个repository下有多个tag,而这些tag的数据相同的话,删除其中一个tag会同时把所有tag都删了

虽然网上有删除私有库镜像的python脚本,但是我感觉并不好用。

我是不会满足于此的,于是我自己写了个sh脚本,先来看看效果。

脚本还有一些人性化的提示,而且sh脚本通俗易懂,容易扩展,脚本我也上传到gitHub上了,有兴趣的可以下载试试。

gitHub地址:https://github.com/hushuai86/docker-delete

下载运行:

#先下载脚本到/usr/local/bin/目录下 curl https://raw.githubusercontent.com/hushuai86/docker-delete/master/docker-delete-2.0.sh | sudo tee /usr/local/bin/docker-delete >/dev/null#赋予可执行权限 chmod a+x /usr/local/bin/docker-delete#私有库镜像存储目录路径全局环境变量(该路径就是运行私有库容器时,用-v 命令将私有库容器内 /var/lib/registry目录挂载到本机的路径) #例: /opt/data/registry是我运行容器时私有库镜像存储目录挂载到本地的目录 echo "export DOCKER_REGISTRY_DIR=/opt/data/registry" >>/etc/profile#运行私有库容器ID全局环境变量设置(正在运行的私有库容器的 ID) #例: 89b9b3c9054ay是我的私有库库容器的id echo "export DOCKER_REGISTRY_CONTAINER_ID=89b9b3c9054a" >>/etc/profile#使配置生效 source /etc/profile

然后就可以使用docker-delete命令了,如果你觉得脚本有哪些用着不舒服的地方,可以编辑脚本自己改改

原理解析:

(在以下的截图中 /opt/data/registry是我运行容器时私有库镜像存储目录挂载到本地的目录)

私有库镜像存储目录下有两个文件夹 blobs和 repositories

其中repositories目录下是以镜像repository命名的几个文件

也就是说想要知道私有库有哪些镜像,直接看这个文件夹有哪些子文件夹就知道了

而在每个镜像repository文件夹/_manifests/tags目录下可以 看到该镜像有哪些tag

但是镜像的真实数据并不在repositories目录下,而是以数据块的方式存储在blobs目录下,一个镜像被分成多个数据块,也就是执行垃圾回收命令时输出的 ‘marking blob …‘那样的关联关系,而镜像和数据块之间的关联关系就是在 repositories/镜像repository/_manifests/revisions/sha256/ 目录下的sha256值。

在以sha256值命名的目录下有个link的文件,内容就是这个sha256值

经过我测试发现,只要这个link文件被删除,然后在私有库容器内执行垃圾回收命令‘ registry garbage-collect /etc/docker/registry/config.yml',那么这个sha256值关联的blobs就会被彻底删除

但是,一个镜像可能有很多个tag,那么这个sha256值关联的 blobs数据 到底属于哪个 tag呢?

我们进到镜像的某个tag/index/sha256/ 目录,会发现 有个 sha256值命名的文件夹,而且这个sha256值 在之前的revisions/sha256/ 下存在。在这个文件夹下也有个link文件,保存了该sha256值。

所以根据我的理解,当我们调用docker提供的API 删除一个tag时,会在这个镜像的tag/index/sha256/<sha256值>/link文件中获取sha256值,然后看是不是还有其他tag也关联了这个sha256值,如果有的话,只删除这个tag文件夹,如果没有的话,那么在删除这个tag的文件的同时还会删掉 revisions/sha256/ 目录下的 改sha256对应的link文件,这样的话,当在容器内执行垃圾回收的命令时,就会彻底删除该sha256值关联的blobs数据。

特别注意:

在彻底删除一个镜像的数据后,需要重启下私有库容器,如果不重启的话,你再push该镜像到私有库时,总是会输出 Layer already exists ,似乎是push上去了,但是如果你删除本地的该镜像,然后再pull ,就会报错。

当然,我写的脚本里是有这个步骤的

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章