代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
Java
】
提取java文件中的中文,可用作国际化
作者:
cmy00cmy
/ 发布于
2013/11/28
/
461
提取代码文件中的中文,方便国际化。用正则表达式匹配,已排除:// /* */ * 后的注释内容
package com.cmy.seekChinese; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Scanner; import java.util.concurrent.Callable; import java.util.concurrent.ExecutionException; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors; import java.util.concurrent.Future; import java.util.regex.Matcher; import java.util.regex.Pattern; public class FileSearch { public static void main(String args[]) throws Exception{ Scanner in = new Scanner(System.in); System.out.println("base directory"); String directory = in.nextLine(); String keywordString = "^[^//*]*[\\u4e00-\\u9fa5]+"; ExecutorService pool = Executors.newCachedThreadPool();//线程池 MatchCounter dataArrayList = new MatchCounter(new File(directory), keywordString, pool); Future<ArrayList<String>> resultFuture = pool.submit(dataArrayList);//获取结果 //输出结果 int i = 0; FileOutputStream fos = new FileOutputStream("d:\\test.txt", true); for (String string : resultFuture.get()) { i++; fos.write(string.getBytes()); System.out.print(string); if (i%4 == 0) { System.out.println(); fos.write("\r\n".getBytes()); } } fos.close(); pool.shutdown(); System.exit(0); } } class MatchCounter implements Callable<ArrayList<String>>{ public MatchCounter(File directoryFile, String keyword, ExecutorService pool){ this.directoryFile = directoryFile; this.keyword = keyword; this.pool = pool; } @Override public ArrayList<String> call() throws Exception { // TODO Auto-generated method stub ArrayList<String> dataArrayList = new ArrayList<String>(); ArrayList<String> temp = new ArrayList<String>(); try{ File[] files = directoryFile.listFiles(); ArrayList<Future<ArrayList<String>>> results = new ArrayList<Future<ArrayList<String>>>(); for(File file : files){ if(file.isDirectory()){//查找所有文件,加入数组 MatchCounter counter = new MatchCounter(file, keyword, pool); Future<ArrayList<String>> resultFuture = pool.submit(counter); results.add(resultFuture); } else{//查找文件内容 System.out.println(file.getName()); if((temp = search(file)) != null) dataArrayList.addAll(temp); } } //统计结果 for(Future<ArrayList<String>> resultFuture : results){ try{ dataArrayList.addAll(resultFuture.get()); } catch (ExecutionException e) { // TODO: handle exception e.printStackTrace(); } } } catch (Exception e) { // TODO: handle exception e.printStackTrace(); } return dataArrayList; } public ArrayList<String> search(File file) throws InterruptedException{ try { ArrayList<String> data = new ArrayList<String>(); BufferedReader inScanner = new BufferedReader(new InputStreamReader(new FileInputStream(file),"UTF-8")); boolean found = false; String string; while ((string = inScanner.readLine()) != null) { //正则表达式匹配,选出行 Pattern pattern = Pattern.compile(keyword); Matcher matcher = pattern.matcher(string); if(matcher.find()){ found = true; Pattern con = Pattern.compile("[\u4e00-\u9fa5].*[\u4e00-\u9fa5]+"); //再匹配一次,挑出内容 Matcher matcher2 = con.matcher(string); System.out.println(string); if(matcher2.find()) { String filePath = file.getPath(); String[] folder = filePath.split("\\\\"); //System.out.println(matcher2.group()); //System.out.println(matcher2.groupCount()); data.add(" |");//大类 data.add(folder[8] + "|");//文件夹 data.add(" |");//类型 data.add(matcher2.group() + "|");//中文内容 } } } inScanner.close(); return data; } catch (IOException e) { // TODO: handle exception e.printStackTrace(); return null; } } private File directoryFile; private String keyword; private ExecutorService pool; }
试试其它关键字
提取java中文
同语言下
.
List 切割成几份 工具类
.
一行一行读取txt的内容
.
Java PDF转换成图片并输出给前台展示
.
java 多线程框架
.
double类型如果小数点后为零则显示整数否则保留两位小
.
将图片转换为Base64字符串公共类抽取
.
sqlParser 处理SQL(增删改查) 替换schema 用于多租户
.
JAVA 月份中的第几周处理 1-7属于第一周 依次类推 29-
.
java计算两个经纬度之间的距离
.
输入时间参数计算年龄
可能有用的
.
C#实现的html内容截取
.
List 切割成几份 工具类
.
SQL查询 多列合并成一行用逗号隔开
.
一行一行读取txt的内容
.
C#动态修改文件夹名称(FSO实现,不移动文件)
.
c# 移动文件或文件夹
.
c#图片添加水印
.
Java PDF转换成图片并输出给前台展示
.
网站后台修改图片尺寸代码
.
处理大图片在缩略图时的展示
cmy00cmy
贡献的其它代码
(
1
)
.
提取java文件中的中文,可用作国际化
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3