TIKA - 提取JAR文件

TIKA提取JAR文件 - 从简单和简单的步骤学习TIKA，从基本到高级概念，包括概述，架构，环境，参考API，文件格式，文档类型检测，内容提取，元数据提取，语言检测，GUI，提取PDF ，提取ODF，提取MS-Office文件，提取文本文档，提取HTML文档，提取XML文档，提取.class文件，提取JAR文件，提取图像文件，提取mp4文件，提取mp3文件。

以下是从Java Archive(jar)文件中提取内容和元数据的程序 :

import java.io.File;import java.io.FileInputStream;import java.io.IOException;import org.apache.tika.exception.TikaException;import org.apache.tika.metadata.Metadata;import org.apache.tika.parser.ParseContext;import org.apache.tika.sax.BodyContentHandler;import org.apache.tika.parser.pkg.PackageParser;import org.xml.sax.SAXException;public class PackageParse {   public static void main(final String[] args) throws IOException,SAXException, TikaException {      //detecting the file type      BodyContentHandler handler = new BodyContentHandler();      Metadata metadata = new Metadata();      FileInputStream inputstream = new FileInputStream(new File("Example.jar"));      ParseContext pcontext = new ParseContext();            //Package parser      PackageParser packageparser = new PackageParser();      packageparser.parse(inputstream, handler, metadata,pcontext);      System.out.println("Contents of the document: " + handler.toString());      System.out.println("Metadata of the document:");      String[] metadataNames = metadata.names();            for(String name : metadataNames) {         System.out.println(name + ":   " + metadata.get(name));      }   }}

将上述代码保存为 PackageParse.java ，使用以下命令从命令提示符编译它 :

javac PackageParse.javajava PackageParse

下面给出了包含在包内的Example.java的快照.

JAVA示例

jar文件具有以下属性 :

JAR示例

执行上述程序后，它将为您提供以下输出 :

输出 :

Contents of the document:META-INF/MANIFEST.MFit1352/tika/examples/Example.classMetadata of the document:Content-Type:   application/zip