实例讲解Java读取一般文本文件和word文档的方法
一般文本文件
我们以日志文件.log文件为例:
importjava.io.BufferedReader;
importjava.io.File;
importjava.io.FileInputStream;
importjava.io.FileNotFoundException;
importjava.io.FileReader;
importjava.io.IOException;
publicclassFile_Test{
/**
*@paramargs
*/
publicstaticvoidmain(String[]args){
Filefile=newFile("D:\\logserrorMsg.log");
if(file.exists()){
System.out.println("此文件存在");
}else{
System.out.println("此文件不存在");
}
try{
FileReaderfr=newFileReader(file);
BufferedReaderbr=newBufferedReader(fr);
Strings;
while((s=br.readLine())!=null){
System.out.println(s);
}
System.out.println("文件大小为(MB):"+newFileInputStream(file).available()/1024/1024+"M");
}catch(FileNotFoundExceptione){
e.printStackTrace();
}catch(IOExceptione){
e.printStackTrace();
}
}
}
.doc文件
这里我们使用WordExtractor读取Word文档,WordExtractor来自于Apache的poi类库项目,官方下载地址:https://poi.apache.org/download.html
importjava.io.FileInputStream;
importorg.textmining.text.extraction.WordExtractor;
publicclassWordTest{
publicstaticvoidmain(Stringargs[])throwsException{
newWordTest().readByOther();
}
publicvoidreadByText()throwsException{
FileInputStreamin=newFileInputStream("C://test.doc");
WordExtractorextractor=newWordExtractor();
Stringstr=extractor.extractText(in);
System.out.println(str);
}
}