开发手册 欢迎您!
软件开发者资料库

jsoup - 使用DOM方法

jsoup使用DOM方法 - 从简单和简单的步骤学习jsoup,从基本到高级概念,包括概述,环境设置,解析字符串,解析主体,加载URL,加载文件,使用DOM方法,使用选择器语法,提取属性,提取文本,提取HTML,使用URL,设置属性,设置HTML,文本内容,清理HTML。

以下示例将在将HTML字符串解析为Document对象后展示DOM方法的使用.

语法

Document document = Jsoup.parse(html);Element sampleDiv = document.getElementById("sampleDiv");Elements links = sampleDiv.getElementsByTag("a");

其中

  • document  :  document对象代表HTML DOM.

  • Jsoup : 用于解析给定HTML字符串的主类.

  • html :  HTML字符串.

  • sampleDiv :  Element对象表示由id"sampleDiv"标识的html节点元素.

  • links :  Elements对象表示由标签"a"标识的多个节点元素.

描述

parse(String html)方法将输入HTML解析为新的Document.此文档对象可用于遍历和获取html dom的详细信息.

示例

使用您选择的任何编辑器创建以下Java程序比方说C:/> jsoup.

JsoupTester.java

import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;public class JsoupTester {   public static void main(String[] args) {         String html = "Sample Title"         + ""         + "

Sample Content

"         + "Google
"         +"";      Document document = Jsoup.parse(html);      System.out.println(document.title());      Elements paragraphs = document.getElementsByTag("p");      for (Element paragraph : paragraphs) {         System.out.println(paragraph.text());      }      Element sampleDiv = document.getElementById("sampleDiv");      System.out.println("Data: " + sampleDiv.text());      Elements links = sampleDiv.getElementsByTag("a");      for (Element link : links) {         System.out.println("Href: " + link.attr("href"));         System.out.println("Text: " + link.text());      }   }}

验证结果

编译班级使用 javac 编译器如下:

C:\jsoup>javac JsoupTester.java

现在运行JsoupTester来查看结果.

C:\jsoup>java JsoupTester

查看结果.

Sample TitleSample ContentData: GoogleHref: www.google.comText: Google