代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
Java
】
查找并删除重复文件
作者:
kevincat
/ 发布于
2014/10/10
/
324
package workspace; import java.io.File; import java.io.FileInputStream; import java.io.InputStream; import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java.util.Map; import org.apache.commons.codec.digest.DigestUtils; import org.apache.commons.io.FileUtils; public class FileDuplicateMain { private static Map<String, String> md5Map = new HashMap<String, String>(); private static Map<String, List<String>> duplicateMap = new HashMap<String, List<String>>(); public static void main(String[] args) throws Exception { String dir = "e:/ebook"; Collection<File> files = listFile(dir); for (File file : files) { compare(file.getAbsolutePath()); } for (List<String> duplicateFileList : duplicateMap.values()) { System.out.println(duplicateFileList); } //删除 /*for (List<String> duplicateFileList : duplicateMap.values()) { for (int i = 0; i < duplicateFileList.size() - 1; i++) { String filePath = duplicateFileList.get(i); File file = new File(filePath); file.delete(); } }*/ } public static void compare(String filePath) throws Exception { String md5 = fileToMd5(filePath); if (md5Map.keySet().contains(md5)) { List<String> fileNameList = duplicateMap.get(md5); if (fileNameList == null) { fileNameList = new ArrayList<String>(); } fileNameList.add(filePath); //加入第一个 fileNameList.add(md5Map.get(md5)); duplicateMap.put(md5, fileNameList); } else { md5Map.put(md5, filePath); } } public static Collection<File> listFile(String dir) { return FileUtils.listFiles(new File(dir), null, true); } public static String fileToMd5(String file) throws Exception { //long fromTime = System.currentTimeMillis(); InputStream is = new FileInputStream(new File(file)); byte[] data = new byte[1024]; String md5 = ""; while ((is.read(data)) != -1) { String tmp = DigestUtils.md5Hex(data); md5 = EncodeUtils.md5Hex(md5 + tmp); } is.close(); //System.out.println(file + "计算MD5时间:\t" + (System.currentTimeMillis() - fromTime)); return md5; } }
试试其它关键字
Commons-IO
重复文件
同语言下
.
List 切割成几份 工具类
.
一行一行读取txt的内容
.
Java PDF转换成图片并输出给前台展示
.
java 多线程框架
.
double类型如果小数点后为零则显示整数否则保留两位小
.
将图片转换为Base64字符串公共类抽取
.
sqlParser 处理SQL(增删改查) 替换schema 用于多租户
.
JAVA 月份中的第几周处理 1-7属于第一周 依次类推 29-
.
java计算两个经纬度之间的距离
.
输入时间参数计算年龄
可能有用的
.
C#实现的html内容截取
.
List 切割成几份 工具类
.
SQL查询 多列合并成一行用逗号隔开
.
一行一行读取txt的内容
.
C#动态修改文件夹名称(FSO实现,不移动文件)
.
c# 移动文件或文件夹
.
c#图片添加水印
.
Java PDF转换成图片并输出给前台展示
.
网站后台修改图片尺寸代码
.
处理大图片在缩略图时的展示
kevincat
贡献的其它代码
(
1
)
.
查找并删除重复文件
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3