由一道Neusoft題中想到的Java日志API
先來看看這一季度的試題的總體要求:
部門已經完成了多次編程考試,為了方便對每個人的考試情況進行跟蹤,需要
將所有人員的成績進行合并、匯總。
歷次考試成績格式為Excel格式,共有三列數據:郵件地址、姓名、成績。為了
簡化代碼實現,在統計時,會先將Excel格式的成績單“另存為”保存類型為“文本文件
(制表符分隔)(*.txt)”格式的文件,文件名稱格式為“yyyymm.txt”(即:4位年份2位
月分.txt),作為程序的輸入文件進行讀取、合并操作。
輸入文件保存在c:\test\src\文件夾下,此文件夾下不會有其它文件。在匯總處
理之前,我們會檢查此文件夾下的輸入文件,確保文件名符合輸入要求。
在讀取文件進行處理的過程中,如果遇到非法的數據,可以直接跳過當前人員的
成績,繼續(xù)處理其它數據。同時,需要將錯誤發(fā)生的源文件名,錯誤發(fā)生的行數,及
所在行內容記錄在日志文件c:\test\test.log文件中。
記錄信息為“數據錯誤:yyyymm.txt 第 N 行。”。其中,yyyymm.txt、N分別為實際
的文件名與行數。
合并后文件格式仍為文本文件,前兩列為:郵件地址、姓名,從第三列開始,按
考試日期先后順序逐一列出每次考試的成績,如果某次考試缺考,則成績以“--”
代替。合并后文件名稱為“result.txt”,保存在c:\test\文件夾下。
便于后續(xù)做進一步檢索與處理,輸出文件格式需要嚴格符合下面的要求:
1)不需要有表頭列,從文件***行開始即為人員的成績。
2)列寬與對齊方式:前兩列,“郵件地址”列寬30字符,左對齊;“姓名”列寬15
字符,左對齊;從第三列開始,列寬統一為4字符且右對齊。
3)每位人員的成績?yōu)橐恍袛祿心Q行要符合windows平臺習慣。
4)人員成績按姓名的漢語拼音順序排序,如果姓名相同,按郵件地址字母順序排序。
附件給出輸入文件與輸出文件的示例,可仔細閱讀以幫助理解上述格式要求。
提示:1)如果采用Java語言完成,編程過程中可以使用apache commons包中的api(這個
建議與考查的內容無關,至少便于對文件讀寫,評分是不會有任何影響)。
例如:固定列寬并且有對齊要求的文本格式化,可以使用commons-lang包中StringUtils
提供的LeftPad、RightPad方法(當然,這現方式并不強制要求,你也可以直接使用jdk
提供的PrintWriter.printf或者String.format或者其它方法這現同樣的目的,選擇自己
熟悉的就可以)
除以上包以外,請使用j2se6.0的標準內容。引入其他第3方庫(如使用數據庫)并不符合
考試要求。
2)日志記錄推薦使用log4j或log4net。配置格式不做強制要求,但需要在源文件存在錯誤
時按要求記錄問題。
我們仍然忽略任何第三方API,只要是Java API能完成的工作,我們不只用第三方工具。看了這個需求,其中需要進行日志的操作和數據格式化輸出,其余就是簡單IO和一個合并算法。日中日志我們可以使用java.util.logging的API,數據格式化就使用String.format()方法,下面我們來分析分析。
要使用Java的日志API,結合使用比較多的Log4j,首先想到的是日志的配置,下面來看看如何配置Java的日志API:
Java代碼
- package logging;
- import java.text.DateFormat;
- import java.text.SimpleDateFormat;
- import java.util.Date;
- import java.util.logging.Formatter;
- import java.util.logging.LogRecord;
- /**
- * 日志記錄器格式
- *
- * @author Nanlei
- *
- */
- public class LogFormatter extends Formatter {
- @Override
- public String format(LogRecord record) {
- Date date = new Date();
- DateFormat df = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
- String dateStr = df.format(date);
- return "[" + dateStr + "] [" + record.getLevel() + "]"
- + record.getClass() + " : " + record.getMessage() + "\n";
- }
- }
這個類是用來規(guī)范日志記錄格式的,我們自定義的日志記錄方式可以通過擴展Formatter類來進行,覆蓋其中的format方法即可,其中的程序是生成日期,然后返回我們要在日志中看到的日志格式,這都很好理解,就不多說什么了。
寫好了日志格式,那么在實際中該如何來使用呢,也很簡單:
Java代碼
- private static final Logger logger = Logger.getLogger(Main.class.getName());
- private static void setLoggerSettings() throws Exception {
- logger.setLevel(Level.INFO);
- FileHandler fileHandler = new FileHandler("c:\\test\\test.log");
- fileHandler.setFormatter(new LogFormatter());
- logger.addHandler(fileHandler);
- }
在類中聲明一個靜態(tài)的成員變量,然后對其進行一些設置,這里包括日志級別,輸出位置和格式,那么格式就是上面那個類中設置的,調用setLoggerSettings()方法之后,就可以使用日志API了,這很簡單。
下面來分析題目需求,要從幾個文件中來讀取信息然后進行合并,文件中可能有非法數據,要進行處理。文件中的信息包括電子郵件,姓名和每次的成績,要求合并成績到一條記錄中,那么我們就要首先讀取這些信息,然后進行合并處理。信息是用制表符分隔的,那么讀取上來后就要根據制表符分割,如果發(fā)現分割出現問題,就記錄日志。
首先抽象出數據中的對象,就是考試記錄對象,我們簡單刻畫這個對象:
Java代碼
- package bean;
- /**
- * 考試記錄bean
- *
- * @author Nanlei
- *
- */
- public class ExamRecord {
- private String email;// 電子郵件
- private String name;// 人名
- private String record;// 單條成績
- private String[] records;// 考試記錄
- public ExamRecord() {
- super();
- }
- public ExamRecord(String email, String name, String record) {
- super();
- this.email = email;
- this.name = name;
- this.record = record;
- }
- public String getEmail() {
- return email;
- }
- public void setEmail(String email) {
- this.email = email;
- }
- public String getName() {
- return name;
- }
- public void setName(String name) {
- this.name = name;
- }
- public String getRecord() {
- return record;
- }
- public void setRecord(String record) {
- this.record = record;
- }
- public String[] getRecords() {
- return records;
- }
- public void setRecords(String[] records) {
- this.records = records;
- }
- @Override
- public String toString() {
- return "ExamRecord [email=" + email + ", name=" + name + ", record="
- + record + ", records=" + records + "]";
- }
- }
這里可說的不多,主要是構造方法,重載的方法有一個是填充record的,就是每條記錄的成績,而records變量是我們后期進行填充的。
我們開始編寫readFromFile(String basePath)方法:
Java代碼
- Set
flagSet = new TreeSet(); - List
infoList = new ArrayList(); - List
recordList = new ArrayList(); - List
recordsPerFile = new ArrayList(); // 標識每個文件中合法記錄的數量
這些變量用于對數據進行處理。flagSet一看名字就是一個標識位,為什么用Set,因為合并之后每人是一條記錄,那么處理后就合并了,而原始數據中一個人的信息可能有多條,那么我們要記錄到底有多少不重復的人,就使用Set了,它會為我們自動去除重復的,同時TreeSet會按找字母順序為我們自動排序,那么需求中的要求就滿足了,我們不用再寫排序的方法。InfoList用于放置從文件連續(xù)讀出的原始數據,recordList是方法返回的結果,也是我們寫入結果文件的最終對象,recordsPerFile是輔助變量,用于存儲從每個文件中讀取的文件數量,這是處理拼裝大規(guī)模數據的基本方法,用于后期數據處理時的循環(huán)變量控制。
Java代碼
- File file = new File(basePath);
- if (!file.isDirectory()) {
- logger.info(file.getAbsolutePath() + " is not a directory");
- } else {
- try {
- String[] files = file.list();
- for (int i = 0; i < files.length; i++) {
- File targetFile = new File(basePath + "\\" + files[i]);
- BufferedReader br = new BufferedReader(
- new InputStreamReader(new FileInputStream(
- targetFile), "GBK"));
- String s = null;
- int line = 0;
- int num = 0;
- while ((s = br.readLine()) != null) {
- if (line == 0) {
- } else {
- String[] infos = s.split("\t");
- if (infos.length != 3) {
- logger.info("錯誤數據 " + files[i] + " 第"
- + (line + 1) + "行");
- } else {
- flagSet.add(infos[0] + "\t" + infos[1]);
- infoList.add(new ExamRecord(infos[0], infos[1],
- infos[2]));
- num++;
- }
- }
- line++;
- }
- recordsPerFile.add(num);
- br.close();
- }
- } catch (Exception e) {
- e.printStackTrace();
- }
這部分就是從文件夾下讀取文件并寫入我們準備的變量中,首先進行文件夾判斷,之后開始讀取,我們將數據分行讀取,然后用split函數對原始數據進行分隔,如果沒有得到3個數據部分,那么視為該數據無效,就寫日志,如果獲取到了三個部分,首先將電子郵件和姓名存入Set,剩余信息存入infoList,使用輔助循環(huán)變量num來計算數量。
至此,我們已經讀取到所需數據了,下面就是對數據進行處理了,首先是對我們的結果recordList進行一些初始化操作:
Java代碼

- Iterator
it = flagSet.iterator(); - String str = null;
- while (it.hasNext()) {
- str = it.next();
- String[] infos = str.split("\t");
- ExamRecord er = new ExamRecord();
- er.setEmail(infos[0]);
- er.setName(infos[1]);
- String[] arrays = new String[recordsPerFile.size()];
- er.setRecords(arrays);
- recordList.add(er);
- }
這里我們可以從flagSet中獲取最終結果數量,然后對應寫入recordList并初始化records數組,就做完了,下面是對成績的處理了,這部分涉及到題目的核心算法,下面所示代表我的一個處理方式,可能不是***的:
Java代碼
- // 開始處理成績
- for (int i = 0; i < recordsPerFile.size(); i++) {
- int num = recordsPerFile.get(i);
- int count = 0;
- while (count < recordList.size()) {
- ExamRecord tmpER = recordList.get(count);
- tmpER.getRecords()[i] = "--";
- for (int j = 0; j < num; j++) {
- ExamRecord er = infoList.get(j);
- if (tmpER.getEmail().equals(er.getEmail())) {
- tmpER.getRecords()[i] = er.getRecord();
- }
- }
- count++;
- }
- for (int k = 0; k < num; k++) {
- infoList.remove(0);
- }
- }
解釋一下:我們首先變量recordsPerFile,這里標識出一共讀取出幾個文件,每個文件中的記錄數量是多少,下面的while循環(huán)是變量recordList,就是我們每次要處理幾個用戶。進入while循環(huán),首先獲取一個ExamRecord對象,然后對其成績欄位進行填充,如果沒有值,那么就是”--”,下面開始處理infoList部分,這里就看到輔助變量的用途了,因為每個文件中可能沒有全部人員的記錄,就是文件記錄數小于總人數,那么怎么辦呢,每次遍歷多少呢?就是輔助變量中記錄的數據,兩個集合的記錄數不同,也同時可以遍歷來進行對比處理,這就是一種方法,如果發(fā)現相同數據,在相應位置填充,***的for循環(huán)是刪除我們處理過的數據,每次刪除0號元素,刪除的次數是輔助變量中記錄的。此時我們的數據處理完成,獲得了recordList。
下面是寫入文件的操作:
Java代碼
- private static void writeResultToFile(String fileName,
- List
recordList) { - BufferedOutputStream output = null;
- try {
- output = new BufferedOutputStream(new FileOutputStream(fileName));
- for (int i = 0; i < recordList.size(); i++) {
- ExamRecord examRecord = recordList.get(i);
- output.write(String.format("%-30s", examRecord.getEmail())
- .getBytes());
- output.write(String.format("%-15s", examRecord.getName())
- .getBytes());
- for (int j = 0; j < examRecord.getRecords().length; j++) {
- output.write(String.format("%4s",
- examRecord.getRecords()[j]).getBytes());
- }
- output.write("\r\n".getBytes());
- }
- output.flush();
- } catch (Exception e) {
- e.printStackTrace();
- } finally {
- try {
- if (output != null) {
- output.close();
- }
- } catch (IOException e) {
- e.printStackTrace();
- }
- }
- }
這里就沒什么多說的了,就是需求中要求對數據格式進行處理,左對齊還是右對齊也很簡單了。這里使用了C語言中printf()函數的格式,String的format()方法支持這點,就很簡單了。
主函數如下:
Java代碼
- public static void main(String[] args) throws Exception {
- long start = System.currentTimeMillis();
- // 設置Log
- setLoggerSettings();
- // 讀取文件到對象中
- List
recordList = readFromFile( "c:\\test\\src");- // 將結果寫入文件
- writeResultToFile("c:\\test\\result.txt", recordList);
- long end = System.currentTimeMillis();
- System.out.println(end - start + " ms!");
- }
執(zhí)行主函數,就可以在相應位置看到結果。

原始數據和源碼見原文鏈接:
http://sarin.javaeye.com/blog/941386。
本文系作者本人的探索,希望大家批評指正。也希望和Neusofter們交流提高。
【編輯推薦】