由一道Neusoft題中想到的Java日志API

作者：sarin 2011-03-07 13:29:52

我們仍然忽略任何第三方API，只要是Java API能完成的工作，我們不只用第三方工具。看了這個需求，其中需要進行日志的操作和數據格式化輸出，其余就是簡單IO和一個合并算法。日中日志我們可以使用java.util.logging的API，數據格式化就使用String.format()方法，下面我們來分析分析。

先來看看這一季度的試題的總體要求：

部門已經完成了多次編程考試，為了方便對每個人的考試情況進行跟蹤，需要

將所有人員的成績進行合并、匯總。

歷次考試成績格式為Excel格式，共有三列數據：郵件地址、姓名、成績。為了

簡化代碼實現，在統計時，會先將Excel格式的成績單“另存為”保存類型為“文本文件

(制表符分隔)(*.txt)”格式的文件，文件名稱格式為“yyyymm.txt”(即：4位年份2位

月分.txt)，作為程序的輸入文件進行讀取、合并操作。

輸入文件保存在c:\test\src\文件夾下，此文件夾下不會有其它文件。在匯總處

理之前，我們會檢查此文件夾下的輸入文件，確保文件名符合輸入要求。

在讀取文件進行處理的過程中，如果遇到非法的數據，可以直接跳過當前人員的

成績，繼續(xù)處理其它數據。同時，需要將錯誤發(fā)生的源文件名，錯誤發(fā)生的行數，及

所在行內容記錄在日志文件c:\test\test.log文件中。

記錄信息為“數據錯誤：yyyymm.txt 第 N 行。”。其中，yyyymm.txt、N分別為實際

的文件名與行數。

合并后文件格式仍為文本文件，前兩列為：郵件地址、姓名，從第三列開始，按

考試日期先后順序逐一列出每次考試的成績，如果某次考試缺考，則成績以“--”

代替。合并后文件名稱為“result.txt”，保存在c:\test\文件夾下。

便于后續(xù)做進一步檢索與處理，輸出文件格式需要嚴格符合下面的要求：

1)不需要有表頭列，從文件***行開始即為人員的成績。

2)列寬與對齊方式：前兩列，“郵件地址”列寬30字符，左對齊;“姓名”列寬15

字符，左對齊;從第三列開始，列寬統一為4字符且右對齊。

3)每位人員的成績?yōu)橐恍袛祿心Q行要符合windows平臺習慣。

4)人員成績按姓名的漢語拼音順序排序，如果姓名相同，按郵件地址字母順序排序。

附件給出輸入文件與輸出文件的示例，可仔細閱讀以幫助理解上述格式要求。

提示：1)如果采用Java語言完成，編程過程中可以使用apache commons包中的api(這個

建議與考查的內容無關，至少便于對文件讀寫，評分是不會有任何影響)。

例如：固定列寬并且有對齊要求的文本格式化，可以使用commons-lang包中StringUtils

提供的LeftPad、RightPad方法(當然，這現方式并不強制要求，你也可以直接使用jdk

提供的PrintWriter.printf或者String.format或者其它方法這現同樣的目的，選擇自己

熟悉的就可以)

除以上包以外，請使用j2se6.0的標準內容。引入其他第3方庫(如使用數據庫)并不符合

考試要求。

2)日志記錄推薦使用log4j或log4net。配置格式不做強制要求，但需要在源文件存在錯誤

時按要求記錄問題。

要使用Java的日志API，結合使用比較多的Log4j，首先想到的是日志的配置，下面來看看如何配置Java的日志API：

Java代碼

package logging;     
import java.text.DateFormat;     
import java.text.SimpleDateFormat;     
import java.util.Date;     
import java.util.logging.Formatter;     
import java.util.logging.LogRecord;     
/**    
 * 日志記錄器格式    
 *     
 * @author Nanlei    
 *     
 */    
public class LogFormatter extends Formatter {     
    @Override    
    public String format(LogRecord record) {     
        Date date = new Date();     
        DateFormat df = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");     
        String dateStr = df.format(date);     
        return "[" + dateStr + "] [" + record.getLevel() + "]"    
                + record.getClass() + " : " + record.getMessage() + "\n";     
    }     
}

這個類是用來規(guī)范日志記錄格式的，我們自定義的日志記錄方式可以通過擴展Formatter類來進行，覆蓋其中的format方法即可，其中的程序是生成日期，然后返回我們要在日志中看到的日志格式，這都很好理解，就不多說什么了。

寫好了日志格式，那么在實際中該如何來使用呢，也很簡單：

Java代碼

private static final Logger logger = Logger.getLogger(Main.class.getName());     
private static void setLoggerSettings() throws Exception {     
    logger.setLevel(Level.INFO);     
    FileHandler fileHandler = new FileHandler("c:\\test\\test.log");     
    fileHandler.setFormatter(new LogFormatter());     
    logger.addHandler(fileHandler);     
}

在類中聲明一個靜態(tài)的成員變量，然后對其進行一些設置，這里包括日志級別，輸出位置和格式，那么格式就是上面那個類中設置的，調用setLoggerSettings()方法之后，就可以使用日志API了，這很簡單。

下面來分析題目需求，要從幾個文件中來讀取信息然后進行合并，文件中可能有非法數據，要進行處理。文件中的信息包括電子郵件，姓名和每次的成績，要求合并成績到一條記錄中，那么我們就要首先讀取這些信息，然后進行合并處理。信息是用制表符分隔的，那么讀取上來后就要根據制表符分割，如果發(fā)現分割出現問題，就記錄日志。

首先抽象出數據中的對象，就是考試記錄對象，我們簡單刻畫這個對象：

Java代碼

package bean;     
/**    
 * 考試記錄bean    
 *     
 * @author Nanlei    
 *     
 */    
public class ExamRecord {     
    private String email;// 電子郵件     
    private String name;// 人名     
    private String record;// 單條成績     
    private String[] records;// 考試記錄     
    public ExamRecord() {     
        super();     
    }     
    public ExamRecord(String email, String name, String record) {     
        super();     
        this.email = email;     
        this.name = name;     
        this.record = record;     
    }     
    public String getEmail() {     
        return email;     
    }     
    public void setEmail(String email) {     
        this.email = email;     
    }     
    public String getName() {     
        return name;     
    }     
    public void setName(String name) {     
        this.name = name;     
    }     
    public String getRecord() {     
        return record;     
    }     
    public void setRecord(String record) {     
        this.record = record;     
    }     
    public String[] getRecords() {     
        return records;     
    }     
    public void setRecords(String[] records) {     
        this.records = records;     
    }     
    @Override    
    public String toString() {     
        return "ExamRecord [email=" + email + ", name=" + name + ", record="    
                + record + ", records=" + records + "]";     
    }     
}

這里可說的不多，主要是構造方法，重載的方法有一個是填充record的，就是每條記錄的成績，而records變量是我們后期進行填充的。

我們開始編寫readFromFile(String basePath)方法：

Java代碼

Set flagSet = new TreeSet();     
List infoList = new ArrayList();     
List recordList = new ArrayList();     
List recordsPerFile = new ArrayList();// 標識每個文件中合法記錄的數量

這些變量用于對數據進行處理。flagSet一看名字就是一個標識位，為什么用Set，因為合并之后每人是一條記錄，那么處理后就合并了，而原始數據中一個人的信息可能有多條，那么我們要記錄到底有多少不重復的人，就使用Set了，它會為我們自動去除重復的，同時TreeSet會按找字母順序為我們自動排序，那么需求中的要求就滿足了，我們不用再寫排序的方法。InfoList用于放置從文件連續(xù)讀出的原始數據，recordList是方法返回的結果，也是我們寫入結果文件的最終對象，recordsPerFile是輔助變量，用于存儲從每個文件中讀取的文件數量，這是處理拼裝大規(guī)模數據的基本方法，用于后期數據處理時的循環(huán)變量控制。

Java代碼

File file = new File(basePath);     
        if (!file.isDirectory()) {     
            logger.info(file.getAbsolutePath() + " is not a directory");     
        } else {     
            try {     
                String[] files = file.list();     
                for (int i = 0; i < files.length; i++) {     
                    File targetFile = new File(basePath + "\\" + files[i]);     
                    BufferedReader br = new BufferedReader(     
                            new InputStreamReader(new FileInputStream(     
                                    targetFile), "GBK"));     
                    String s = null;     
                    int line = 0;     
                    int num = 0;     
                    while ((s = br.readLine()) != null) {     
                        if (line == 0) {     
    
                        } else {     
                            String[] infos = s.split("\t");     
                            if (infos.length != 3) {     
                                logger.info("錯誤數據 " + files[i] + " 第"    
                                        + (line + 1) + "行");     
                            } else {     
                                flagSet.add(infos[0] + "\t" + infos[1]);     
                                infoList.add(new ExamRecord(infos[0], infos[1],     
                                        infos[2]));     
                                num++;     
                            }     
                        }     
                        line++;     
                    }     
                    recordsPerFile.add(num);     
                    br.close();     
                }     
            } catch (Exception e) {     
                e.printStackTrace();     
            }

這部分就是從文件夾下讀取文件并寫入我們準備的變量中，首先進行文件夾判斷，之后開始讀取，我們將數據分行讀取，然后用split函數對原始數據進行分隔，如果沒有得到3個數據部分，那么視為該數據無效，就寫日志，如果獲取到了三個部分，首先將電子郵件和姓名存入Set，剩余信息存入infoList，使用輔助循環(huán)變量num來計算數量。

至此，我們已經讀取到所需數據了，下面就是對數據進行處理了，首先是對我們的結果recordList進行一些初始化操作：

Java代碼

Iterator it = flagSet.iterator();     
            String str = null;     
            while (it.hasNext()) {     
                str = it.next();     
                String[] infos = str.split("\t");     
                ExamRecord er = new ExamRecord();     
                er.setEmail(infos[0]);     
                er.setName(infos[1]);     
                String[] arrays = new String[recordsPerFile.size()];     
                er.setRecords(arrays);     
                recordList.add(er);     
            }

這里我們可以從flagSet中獲取最終結果數量，然后對應寫入recordList并初始化records數組，就做完了，下面是對成績的處理了，這部分涉及到題目的核心算法，下面所示代表我的一個處理方式，可能不是***的：

Java代碼

// 開始處理成績     
            for (int i = 0; i < recordsPerFile.size(); i++) {     
                int num = recordsPerFile.get(i);     
                int count = 0;     
                while (count < recordList.size()) {     
                    ExamRecord tmpER = recordList.get(count);     
                    tmpER.getRecords()[i] = "--";     
                    for (int j = 0; j < num; j++) {     
                        ExamRecord er = infoList.get(j);     
                        if (tmpER.getEmail().equals(er.getEmail())) {     
                            tmpER.getRecords()[i] = er.getRecord();     
                        }     
                    }     
                    count++;     
                }     
                for (int k = 0; k < num; k++) {     
                    infoList.remove(0);     
                }     
            }

解釋一下：我們首先變量recordsPerFile，這里標識出一共讀取出幾個文件，每個文件中的記錄數量是多少，下面的while循環(huán)是變量recordList，就是我們每次要處理幾個用戶。進入while循環(huán)，首先獲取一個ExamRecord對象，然后對其成績欄位進行填充，如果沒有值，那么就是”--”，下面開始處理infoList部分，這里就看到輔助變量的用途了，因為每個文件中可能沒有全部人員的記錄，就是文件記錄數小于總人數，那么怎么辦呢，每次遍歷多少呢?就是輔助變量中記錄的數據，兩個集合的記錄數不同，也同時可以遍歷來進行對比處理，這就是一種方法，如果發(fā)現相同數據，在相應位置填充，***的for循環(huán)是刪除我們處理過的數據，每次刪除0號元素，刪除的次數是輔助變量中記錄的。此時我們的數據處理完成，獲得了recordList。

下面是寫入文件的操作：

Java代碼

private static void writeResultToFile(String fileName,     
        List recordList) {     
    BufferedOutputStream output = null;     
    try {     
        output = new BufferedOutputStream(new FileOutputStream(fileName));     
        for (int i = 0; i < recordList.size(); i++) {     
            ExamRecord examRecord = recordList.get(i);     
            output.write(String.format("%-30s", examRecord.getEmail())     
                    .getBytes());     
            output.write(String.format("%-15s", examRecord.getName())     
                    .getBytes());     
            for (int j = 0; j < examRecord.getRecords().length; j++) {     
                output.write(String.format("%4s",     
                        examRecord.getRecords()[j]).getBytes());     
            }     
            output.write("\r\n".getBytes());     
        }     
        output.flush();     
    } catch (Exception e) {     
        e.printStackTrace();     
    } finally {     
        try {     
            if (output != null) {     
                output.close();     
            }     
        } catch (IOException e) {     
            e.printStackTrace();     
        }     
    }     
}

這里就沒什么多說的了，就是需求中要求對數據格式進行處理，左對齊還是右對齊也很簡單了。這里使用了C語言中printf()函數的格式，String的format()方法支持這點，就很簡單了。

主函數如下：

Java代碼

public static void main(String[] args) throws Exception {     
        long start = System.currentTimeMillis();     
        // 設置Log     
        setLoggerSettings();     
        // 讀取文件到對象中     
        List recordList = readFromFile("c:\\test\\src");     
        // 將結果寫入文件     
        writeResultToFile("c:\\test\\result.txt", recordList);     
        long end = System.currentTimeMillis();     
        System.out.println(end - start + " ms!");     
    }

執(zhí)行主函數，就可以在相應位置看到結果。

原始數據和源碼見原文鏈接：

http://sarin.javaeye.com/blog/941386。

本文系作者本人的探索，希望大家批評指正。也希望和Neusofter們交流提高。

【編輯推薦】

Java API解析名稱空間的幾種方法
發(fā)現Java虛擬機內存泄露問題
Java編譯過程與c/c++編譯過程有何不同
程序員必備Java API
VMWare發(fā)布虛擬基礎架構Java API及Jython腳本示例

責任編輯：金賀來源： JavaEye博客

Neusoft Java API

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

由一道Neusoft題中想到的Java日志API