以下示例将展示将HTML字符串解析为Document对象.
语法
Document document = Jsoup.parse(html);
其中
文件 : document对象代表HTML DOM.
Jsoup : 用于解析给定HTML字符串的主类.
html : HTML字符串.
描述
parse(String html)方法将输入HTML解析为一份新文件.此文档对象可用于遍历和获取html dom的详细信息.
示例
使用您选择的任何编辑器创建以下Java程序比方说C:/> jsoup.
JsoupTester.java
import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;public class JsoupTester { public static void main(String[] args) { String html = "Sample Title " + "Sample Content
"; Document document = Jsoup.parse(html); System.out.println(document.title()); Elements paragraphs = document.getElementsByTag("p"); for (Element paragraph : paragraphs) { System.out.println(paragraph.text()); } }}
验证结果
编译班级使用 javac 编译器如下:
C:\ _jsoup> javac JsoupTester.java
现在运行JsoupTester来查看结果.
C:\ jsoup> java JsoupTester
查看结果.
Sample TitleSample Content