Loading... # CentOS 中常用存储占用统计以及文件查询 在 CentOS 系统中,管理磁盘空间和查询文件或文件夹的大小是系统维护的重要部分。了解如何使用各种命令来检查文件和目录的大小,有助于快速定位大文件,节省磁盘空间。本文将介绍常用的查询和统计命令,并详细说明其使用方式和参数。 ## `du`(Disk Usage)命令 du 命令用于显示目录和文件的磁盘使用情况,是 CentOS 系统中预装的工具,适用于统计特定目录或文件的大小。它非常灵活,可以结合多个参数使用,帮助我们快速分析磁盘空间占用 ### 可选参数 ```xml -a, --all 显示目录中个别文件的大小。 -B, --block-size=大小 使用指定字节数的块 -b, --bytes 显示目录或文件大小时,以byte为单位。 -c, --total 除了显示个别目录或文件的大小外,同时也显示所有目录或文件的总和。 -D, --dereference-args 显示指定符号链接的源文件大小。 -H, --si 与-h参数相同,但是K,M,G是以1000为换算单位。 -h, --human-readable 以K,M,G为单位,提高信息的可读性。 -k, --kilobytes 以KB(1024bytes)为单位输出。 -l, --count-links 重复计算硬件链接的文件。 -m, --megabytes 以MB为单位输出。 -L<符号链接>, --dereference<符号链接> 显示选项中所指定符号链接的源文件大小。 -P, --no-dereference 不跟随任何符号链接(默认) -0, --null 将每个空行视作0 字节而非换行符 -S, --separate-dirs 显示个别目录的大小时,并不含其子目录的大小。 -s, --summarize 仅显示总计,只列出最后加总的值。 -x, --one-file-xystem 以一开始处理时的文件系统为准,若遇上其它不同的文件系统目录则略过。 -X<文件>, --exclude-from=<文件> 在<文件>指定目录或文件。 --apparent-size 显示表面用量,而并非是磁盘用量;虽然表面用量通常会小一些,但有时它会因为稀疏文件间的"洞"、内部碎片、非直接引用的块等原因而变大。 --files0-from=F 计算文件F中以NUL结尾的文件名对应占用的磁盘空间如果F的值是"-",则从标准输入读入文件名 --exclude=<目录或文件> 略过指定的目录或文件。 --max-depth=N 显示目录总计(与--all 一起使用计算文件)当N为指定数值时计算深度为N,等于0时等同--summarize --si 类似-h,但在计算时使用1000 为基底而非1024 --time 显示目录或该目录子目录下所有文件的最后修改时间 --time=WORD 显示WORD时间,而非修改时间:atime,access,use,ctime 或status --time-style=样式 按照指定样式显示时间(样式解释规则同"date"命令):full-iso,long-iso,iso,+FORMAT --help 显示此帮助信息并退出 --version 显示版本信息并退出 ``` ### 常用参数 * `-a`:列出所有文件信息 * `-h`:以“人类可读”形式显示结果,单位为 KB、MB、GB。 * `-s`:只显示目录或文件的总计大小,不显示子目录的细节。 * `--max-depth=N`:指定只显示 N 层目录深度的信息。 * `-a`:显示文件和目录的详细大小(包括每个文件)。 * `-c`:显示目录和文件大小的总和。 * `-x`:只统计当前文件系统,忽略挂载点。 ### 常用命令 #### 查看目录的总大小(包括该目录及子目录所有文件) ```xml du -sh # 可以指定路径, .或者不指定则是当前目录 du -sh /path/dir ```  #### 查看子目录的大小(--max-depth\=1为递归目录深度) 如果想递归查看该目录下的所有子目录信息可以不加 `--max-depth` 限制 如果想输出的结果包含具体文件可以使用 `-ah` 参数 ```xml du -h --max-depth=1 # 也可以指定查询路径 du -h /opt --max-depth=1 # -c 最后输出总量 du -hc /opt --max-depth=1 ```  #### 按大小排序文件和子目录 ```xml # 使用 '| sort -hr' 对结果进行排序 # sort -hr: -h 选项告诉 sort 按照“人类可读”格式进行排序,-r 则使排序结果按照从大到小(倒序)的顺序显示 # 还可以使用管道符结合其他命令 如 grep 进行匹配搜索 du -h /opt --max-depth=2 | sort -hr du -h /opt --max-depth=2 | sort -hr | grep "xxx" ```  #### 排除指定文件 这个命令会显示 `/var/log` 目录下的文件大小,但排除 `.log` 文件。适用于在排除某些文件类型的情况下查看磁盘使用情况。 ```xml du /var/log -hc --exclude=*.log ```  ## `df` 命令(Disk Free) **df命令** 用于显示磁盘分区上的可使用的磁盘空间。默认显示单位为KB。可以利用该命令来获取硬盘被占用了多少空间,目前还剩下多少空间等信息。 ### 可选参数 ```xml -a或--all:包含全部的文件系统; --block-size=<区块大小>:以指定的区块大小来显示区块数目; -h或--human-readable:以可读性较高的方式来显示信息; -H或--si:与-h参数相同,但在计算时是以1000 Bytes为换算单位而非1024 Bytes; -i或--inodes:显示inode的信息; -k或--kilobytes:指定区块大小为1024字节; -l或--local:仅显示本地端的文件系统; -m或--megabytes:指定区块大小为1048576字节; --no-sync:在取得磁盘使用信息前,不要执行sync指令,此为预设值; -P或--portability:使用POSIX的输出格式; --sync:在取得磁盘使用信息前,先执行sync指令; -t<文件系统类型>或--type=<文件系统类型>:仅显示指定文件系统类型的磁盘信息; -T或--print-type:显示文件系统的类型; -x<文件系统类型>或--exclude-type=<文件系统类型>:不要显示指定文件系统类型的磁盘信息; --help:显示帮助; --version:显示版本信息。 ``` ### 常用参数: * `-h`:以“人类可读”形式显示空间大小,单位为 KB、MB、GB。 * `-T`:显示文件系统的类型(如 ext4、xfs)。 * `-i`:显示 inode 的使用情况。 * `-t`:显示特定类型的文件系统。 * `--total`:显示所有文件系统的总使用情况。 ### 常用命令 #### **查看整个系统的磁盘使用情况** ```bash df -h ``` 该命令输出整个系统中每个挂载点的使用情况,包括磁盘总大小、已用空间、可用空间和挂载点路径。`-h` 参数使输出易于阅读,适合快速了解系统空间使用状态。 #### **查看特定挂载点的使用情况** ```bash df -h /opt ``` 此命令显示 `/opt` 挂载点的磁盘使用情况,便于分析某个特定文件系统的空间占用。 #### **显示文件系统类型** ```bash df -Th ``` 结合 `-T` 参数可以查看每个文件系统的类型(如 ext4、xfs)。这对于诊断文件系统相关的问题非常有用。 #### 查看全部文件系统 ```bash df -a ``` #### **查看 inode 使用情况** ```bash df -i ``` inode 是 Linux 系统中存储文件元数据的结构,`df -i` 可以显示每个文件系统的 inode 使用情况,帮助发现 inode 耗尽的问题。 ## `find` 命令 **find命令** 用来在指定目录下查找文件。任何位于参数之前的字符串都将被视为欲查找的目录名。如果使用该命令时,不设置任何参数,则find命令将在当前目录下查找子目录与文件。并且将查找到的子目录和文件全部进行显示。 ### 可选参数 ```xml -amin<分钟>:查找在指定时间曾被存取过的文件或目录,单位以分钟计算; -anewer<参考文件或目录>:查找其存取时间较指定文件或目录的存取时间更接近现在的文件或目录; -atime<24小时数>:查找在指定时间曾被存取过的文件或目录,单位以24小时计算; -cmin<分钟>:查找在指定时间之时被更改过的文件或目录; -cnewer<参考文件或目录>查找其更改时间较指定文件或目录的更改时间更接近现在的文件或目录; -ctime<24小时数>:查找在指定时间之时被更改的文件或目录,单位以24小时计算; -daystart:从本日开始计算时间; -depth:从指定目录下最深层的子目录开始查找; -empty:寻找文件大小为0 Byte的文件,或目录下没有任何子目录或文件的空目录; -exec<执行指令>:假设find指令的回传值为True,就执行该指令; -false:将find指令的回传值皆设为False; -fls<列表文件>:此参数的效果和指定“-ls”参数类似,但会把结果保存为指定的列表文件; -follow:排除符号连接; -fprint<列表文件>:此参数的效果和指定“-print”参数类似,但会把结果保存成指定的列表文件; -fprint0<列表文件>:此参数的效果和指定“-print0”参数类似,但会把结果保存成指定的列表文件; -fprintf<列表文件><输出格式>:此参数的效果和指定“-printf”参数类似,但会把结果保存成指定的列表文件; -fstype<文件系统类型>:只寻找该文件系统类型下的文件或目录; -gid<群组识别码>:查找符合指定之群组识别码的文件或目录; -group<群组名称>:查找符合指定之群组名称的文件或目录; -help或--help:在线帮助; -ilname<范本样式>:此参数的效果和指定“-lname”参数类似,但忽略字符大小写的差别; -iname<范本样式>:此参数的效果和指定“-name”参数类似,但忽略字符大小写的差别; -inum<inode编号>:查找符合指定的inode编号的文件或目录; -ipath<范本样式>:此参数的效果和指定“-path”参数类似,但忽略字符大小写的差别; -iregex<范本样式>:此参数的效果和指定“-regexe”参数类似,但忽略字符大小写的差别; -links<连接数目>:查找符合指定的硬连接数目的文件或目录; -lname<范本样式>:指定字符串作为寻找符号连接的范本样式; -ls:假设find指令的回传值为True,就将文件或目录名称列出到标准输出; -maxdepth<目录层级>:设置最大目录层级; -mindepth<目录层级>:设置最小目录层级; -mmin<分钟>:查找在指定时间曾被更改过的文件或目录,单位以分钟计算; -mount:此参数的效果和指定“-xdev”相同; -mtime<24小时数>:查找在指定时间曾被更改过的文件或目录,单位以24小时计算; -name<范本样式>:指定字符串作为寻找文件或目录的范本样式; -newer<参考文件或目录>:查找其更改时间较指定文件或目录的更改时间更接近现在的文件或目录; -nogroup:找出不属于本地主机群组识别码的文件或目录; -noleaf:不去考虑目录至少需拥有两个硬连接存在; -nouser:找出不属于本地主机用户识别码的文件或目录; -ok<执行指令>:此参数的效果和指定“-exec”类似,但在执行指令之前会先询问用户,若回答“y”或“Y”,则放弃执行命令; -path<范本样式>:指定字符串作为寻找目录的范本样式; -perm<权限数值>:查找符合指定的权限数值的文件或目录; -print:假设find指令的回传值为True,就将文件或目录名称列出到标准输出。格式为每列一个名称,每个名称前皆有“./”字符串; -print0:假设find指令的回传值为True,就将文件或目录名称列出到标准输出。格式为全部的名称皆在同一行; -printf<输出格式>:假设find指令的回传值为True,就将文件或目录名称列出到标准输出。格式可以自行指定; -prune:不寻找字符串作为寻找文件或目录的范本样式; -regex<范本样式>:指定字符串作为寻找文件或目录的范本样式; -size<文件大小>:查找符合指定的文件大小的文件; -true:将find指令的回传值皆设为True; -type<文件类型>:只寻找符合指定的文件类型的文件; f 普通文件 l 符号连接 d 目录 c 字符设备 b 块设备 s 套接字 p Fifo -uid<用户识别码>:查找符合指定的用户识别码的文件或目录; -used<日数>:查找文件或目录被更改之后在指定时间曾被存取过的文件或目录,单位以日计算; -user<拥有者名称>:查找符和指定的拥有者名称的文件或目录; -version或——version:显示版本信息; -xdev:将范围局限在先行的文件系统中; -xtype<文件类型>:此参数的效果和指定“-type”参数类似,差别在于它针对符号连接检查。 ``` ### 常用命令 #### 搜索包含指定内容的文件 ```xml # 不指定路径为当前路径 find -type f -name "*" | xargs grep "夜半清醒的烛火不忍苛责我" # 指定路径搜索 find /home/ -type f -name "*" | xargs grep "夜半清醒的烛火不忍苛责我" ```  #### 查询指定后缀文件 在`/home`目录下查找以.txt结尾的文件 ```shell find /home -name "*.txt" # 忽略大小写 find /home -iname "*.txt" # 查找所有以.txt和.pdf结尾的文件 find /home -name "*.txt" -o -name "*.pdf" # 不是以.txt结尾的文件 find /home ! -name "*.txt" ``` #### 匹配路径查找文件 ```xml find /home -path "*local*" ``` #### 基于正则表达式查询 在`/home`目录下查找以.txt和.pdf结尾的文件 ```xml find /home -regex ".*\(\.txt\|\.pdf\)$" # 忽略大小写 find /home -iregex ".*\(\.txt\|\.pdf\)$" ``` #### 按照文件大小查询 如果想找出 `/opt` 目录下超过指定大小的大文件,例如超过 350M 的文件,可以结合 `find` 命令使用 ```xml find /opt -type f -size +350M -exec ls -lh {} \; | awk '{ print $5 ": " $9 }' # 也可以指定大小范围 例如这里查询 大于 350MB 小于 3GB的文件 find /opt -type f -size +350M -size -3G -exec ls -lh {} \; | awk '{ print $5 ": " $9 }' ```  #### 查询包含指定名称和大小的文件 如果想找出 `/opt` 目录下超过指定大小的大文件,例如超过 35M 的文件,可以结合 `find` 命令使用 然后这里还有使用 `-name` 进行名称匹配, 路径或文件必须包含指定字符 ```xml find /opt -type f -name "*.FLAC" -size +30M -size -3G -exec ls -lh {} \; | awk '{ print $5 ": " $9 }' ```  #### 查找并删除大文件 如果你确认要删除某些大文件,可以使用以下命令: ```bash find /opt -type f -size +500M -exec rm -i {} \; ``` `rm -i` 会在删除每个文件前进行确认,避免误删除。 使用这些命令可以快速识别和清理 `/opt` 目录中的大文件和子目录。 #### 根据文件时间戳进行搜索 ```shell # 命令用法 find . -type f 时间戳 ``` UNIX/Linux文件系统每个文件都有三种时间戳: * **访问时间** (-atime/天,-amin/分钟):用户最近一次访问时间。 * **修改时间** (-mtime/天,-mmin/分钟):文件最后一次修改时间。 * **变化时间** (-ctime/天,-cmin/分钟):文件数据元(例如权限等)最后一次修改时间。 搜索最近 7 天修改的文件 ```shell find /home -type f -mtime -7 ``` 搜索恰好在七天前被修改的文件 ```shell find /home -type f -atime 7 ``` 搜索被修改超过七天的文件 ```shell find /home -type f -atime +7 ``` 搜索修改时间超过10分钟的文件 ```shell find /home -type f -amin +10 ``` 找出比 `file.log` 修改时间更长的文件 ```shell find /home -type f -newer file.log ``` #### 查找到的文件按照大小排序输出 使用 `find` 命令 结合 `xargs` 进行查询后排序 ```xml find /home -type f -atime +7 -print0 | xargs -0 ls -lhS ```  最后修改:2024 年 09 月 17 日 © 允许规范转载 打赏 赞赏作者 支付宝微信 赞 1 如果文章有帮助到你,请随意赞赏
3 条评论
修辞手法运用娴熟,比喻贴切,感染力强。
以终为始的思考方式为行业指明方向。
思想的火花在字句间迸发,照亮认知盲区。