开发手册 欢迎您!
软件开发者资料库

TIKA - GUI

TIKA GUI - 从简单和简单的步骤学习TIKA,从基本到高级概念,包括概述,架构,环境,参考API,文件格式,文档类型检测,内容提取,元数据提取,语言检测,GUI,提取PDF,提取ODF,提取MS-Office文件,提取文本文档,提取HTML文档,提取XML文档,提取.class文件,提取JAR文件,提取图像文件,提取mp4文件,提取mp3文件。

图形用户界面(GUI)

  • Tika在以下链接中提供了一个jar文件及其源代码 https://tika.apache.org/download.html.

  • 下载这两个文件,设置jar文件的类路径.

  • 提取源代码zip文件夹,打开tika-app文件夹.

  • 在提取的文件夹"tika-1.6\tika-app\src\main\java\org\apache\Tika\gui"

  • 编译两个类文件并执行TikaGUI.java类文件,它会打开以下窗口.

打开窗口

现在让我们看看如何使用Tika GUI.

在GUI上,单击"打开","浏览"和选择要提取的文件,或将其拖到窗口的空白处.

Tika提取文件的内容并以五种不同的格式显示,即.元数据,格式化文本,纯文本,主要内容和结构化文本.您可以选择任何所需的格式.

同样,您还可以在"tika-1.6\tikaapp\src\main\java\org\apache\tika\cli"文件夹.

下图显示了Tika可以做些什么.当我们将图像放在GUI上时,Tika会提取并显示其元数据.

GUI