志在指尖
用双手敲打未来

apache tika检测文件是否损坏

ApacheTika用于文件类型检测和从各种格局的文件内容提取的库。
将上传文件至服务器,进行解析文件时,经常需要判别文件是否损坏。咱们能够运用tika来检测文件是否损坏
maven引进如下:
org.apache.tikatika-app1.18xercesxercesImpl2.11.0
如果jar包抵触时能够引进如下:Java
org.apache.tikatika-core1.18org.apache.tikatika-parsers1.18xercesxercesImpl2.11.0
运用tika检测文件是否损坏:
如果从输入流读取失败,则parse办法抛出IOException反常,从流中获取的文档不能被解析抛TikaException反常,处理器不能处理事件则抛SAXException反常
当文档不能被解析时,阐明文档损坏
履行过程:
publicstaticvoidmain(String[]args){
try{
//Assumesample.txtisinyourcurrentdirectory
Filefile=newFile(“D:\\测验.txt”);
booleanresult=isParseFile(file);
}catch(Exceptione){
e.printStackTrace();
}
}
/**
*验证文件是否损坏
*
*@paramfile文件
*@returntrue/false
*@throwsException
*/
privatestaticbooleanisParseFile(Filefile)throwsException{
try{
Tikatika=newTika();
Stringfilecontent=tika.parseToString(file);
System.out.println(filecontent);
returntrue;
}catch(TikaExceptione){
returnfalse;
}
}

未经允许不得转载:IT技术网站 » apache tika检测文件是否损坏
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!

 

志在指尖 用双手敲打未来

登录/注册IT技术大全

热门IT技术

C#基础入门   SQL server数据库   系统SEO学习教程   WordPress小技巧   WordPress插件   脚本与源码下载