Linux下如何寻找相同文件的方法

 更新时间:2020年06月23日 09:27:25   作者:良许  
这篇文章主要介绍了Linux下如何寻找相同文件的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

随着电脑的使用,系统里将产生很多垃圾,最典型的就是同一份文件被保存到了不同的位置,这样导致的结果就是磁盘空间被大量占用,系统运行越来越慢。

所以如果你的电脑空间告急的话,可以试着去删除这样的文件,释放一些空间。在 Linux 下,我们可以通过识别文件的 inode 值来找出系统中的相同文件。

inode 是一个数据结构,记录了文件所有信息,除了文件名和文件内容。如果两个或多个文件具有相同的 inode 值,即使它们的文件名不一样,位置不一样,它们的内容、所有者、权限其实都是一样的,我们可以将其视有相同文件。

这类型的文件其实就是所谓的「硬链接」。硬链接具有相同的 inode 值,但文件名不一样。而软链接其实就是快捷方式,它指向目标文件,但有着自己的 inode 值。

$ ls -l my*
-rw-r--r-- 4 liangxu liangxu  228 Apr 12 19:37 myfile
lrwxrwxrwx 1 liangxu liangxu   6 Apr 15 11:18 myref -> myfile
-rw-r--r-- 4 liangxu liangxu  228 Apr 12 19:37 mytwin

我们无法直接知道同一目录下有哪些文件是有相同的 inode 值,但要识别起来也不难。其实我们只要使用 ls -i 命令,再以 inode 值进行排序,就可以直接找到这些文件。

$ ls -i | sort -n | more
 ...
 788000 myfile  <==
 788000 mytwin  <==
 801865 Name_Labels.pdf
 786692 never leave home angry
 920242 NFCU_Docs
 800247 nmap-notes

在这个结果的第一列里,就是对应的 inode 值。所以从这个结果里我们一眼就可以看出来,哪些文件具有相同 inode 值。

如果你只是想找到一个文件的对应硬链接文件,我们可以使用 find 命令,再加个 -samefile 选项即可快速找到。

$ find . -samefile myfile
./myfile
./save/mycopy
./mytwin

这些文件都是有相同的 inode 值,不信的话可以再使用 ls 命令来查看更多信息:

$ find . -samefile myfile -ls
 788000  4 -rw-r--r--  4 liangxu  liangxu   228 Apr 12 19:37 ./myfile
 788000  4 -rw-r--r--  4 liangxu  liangxu   228 Apr 12 19:37 ./save/mycopy
 788000  4 -rw-r--r--  4 liangxu  liangxu   228 Apr 12 19:37 ./mytwin

我们可以看到,除了文件名之外,这几个文件名的信息完全一样。细心的朋友可能会注意到,在第2列(硬连接数)是4,而实际上我们找出来的文件只有3个,这说明还有一个文件与他们共享 inode 值,只是我们通过这条命令没有找出来而已。

作为一个懒人,每次敲命令多麻烦,直接上脚本找出目录下的相同文件!

#!/bin/bash

# seaches for files sharing inodes

prev=""

# list files by inode
ls -i | sort -n > /tmp/$0

# search through file for duplicate inode #s
while read line
do
  inode=`echo $line | awk '{print $1}'`
  if [ "$inode" == "$prev" ]; then
    grep $inode /tmp/$0
  fi
  prev=$inode
done < /tmp/$0

# clean up
rm /tmp/$0

运行结果:

$ ./findHardLinks
 788000 myfile
 788000 mytwin

当然了,你还可以使用 find 命令,根据 inode 值,找到系统里所有相同文件。

$ find / -inum 788000 -ls 2> /dev/null
 788000  4 -rw-r--r--  4 liangxu  liangxu  228 Apr 12 19:37 /tmp/mycopy
 788000  4 -rw-r--r--  4 liangxu  liangxu  228 Apr 12 19:37 /home/liangxu/myfile
 788000  4 -rw-r--r--  4 liangxu  liangxu  228 Apr 12 19:37 /home/liangxu/save/mycopy
 788000  4 -rw-r--r--  4 liangxu  liangxu  228 Apr 12 19:37 /home/liangxu/mytwin

在这条命令里,我们将错误提示重定向到 /dev/null 这个特殊文件里,这样在搜索一些我们没有权限访问的路径时,不会满屏的 permission denied 。

到此这篇关于Linux下如何寻找相同文件的方法的文章就介绍到这了,更多相关Linux 寻找相同文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 阿里云CentOS挂载新数据盘的方法

    阿里云CentOS挂载新数据盘的方法

    本篇文章主要介绍了阿里云CentOS挂载新数据盘的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-12-12
  • .htaccess设置指南经典说明

    .htaccess设置指南经典说明

    .htaccess 会降低APACHE的性能,除非你对目录权限要求很高或需要做UrlRewrite,否则不推荐你使用.
    2008-04-04
  • Centos7上网及添加静态IP方法介绍

    Centos7上网及添加静态IP方法介绍

    本文给大家详细介绍了Centos7上网及添加静态IP的方法,并把步骤做了详细说明,需要的朋友跟着学习下。
    2018-02-02
  • IO多路复用之epoll全面总结(必看篇)

    IO多路复用之epoll全面总结(必看篇)

    下面小编就为大家带来一篇IO多路复用之epoll全面总结(必看篇)。小编觉得挺不错的。现在就分享给大家。也给大家做个参考。一起跟随小编过来看看吧
    2016-12-12
  • Linux学习第一篇 虚拟机和镜像文件安装配置

    Linux学习第一篇 虚拟机和镜像文件安装配置

    这篇文章主要为大家详细介绍了Linux学习第一篇,虚拟机和镜像文件安装配置,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-05-05
  • ROS控制Turtlebot3移动机器人的基础教程

    ROS控制Turtlebot3移动机器人的基础教程

    这篇文章主要给大家介绍了关于ROS控制Turtlebot3移动机器人的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-11-11
  • 配置apache支持apk ipk下载的方法

    配置apache支持apk ipk下载的方法

    这篇文章主要介绍了配置apache支持apk ipk下载的方法,需要的朋友可以参考下
    2014-04-04
  • Apache Kafka 分区重分配的实现原理解析

    Apache Kafka 分区重分配的实现原理解析

    这篇文章主要介绍了Apache Kafka 分区重分配的实现原理,本文结合 2.0.0 版本的 Kafka 源码,详细介绍了 Kafka 分区副本重分配的流程和逻辑,需要的朋友可以参考下
    2022-07-07
  • Linux编辑启动、停止与重启springboot jar包脚本实例

    Linux编辑启动、停止与重启springboot jar包脚本实例

    这篇文章主要给大家介绍了关于Linux编辑启动、停止与重启springboot jar包脚本的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-03-03
  • PHP程序员玩转Linux系列 Nginx中的HTTPS详解

    PHP程序员玩转Linux系列 Nginx中的HTTPS详解

    这篇文章主要为大家详细介绍了PHP程序员玩转Linux系列文章,MySQL备份还原教程,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-04-04

最新评论