1、通过NuGet获取AngleSharp
1)使用Nuget管理控制台
将AngleSharp集成到项目中的最简单方法是使用NuGet。您可以通过打开包管理器控制台(PM)并键入以下语句来安装AngleSharp:
Install-Package AngleSharp
2)使用Nuget图形管理器
使用Nuget的界面的管理器搜索"AngleSharp
"=> 找到点出点击"安装
"。
相关文档:VS(Visual Studio)中Nuget的使用
2、使用AngleSharp解析html的示例
var source = @"Error 404 (Not Found)!!1 www.google.com/>404. That’s an error.
The requested URL
/error
was not found on this server. That’s all we know.";//使用AngleSharp的默认配置var config = Configuration.Default;//使用给定的配置创建用于评估web页面的新上下文var context = BrowsingContext.New(config);//只需要获得DOM表示var document = await context.OpenAsync(req => req.Content(source));//将其序列化回控制台Console.WriteLine(document.DocumentElement.OuterHtml);
3、简单操作document(Dom文档)
static async Task FirstExample(){ //使用AngleSharp的默认配置 var config = Configuration.Default; //使用给定的配置创建用于评估web页面的新上下文 var context = BrowsingContext.New(config); //从响应的内容解析文档到虚拟请求 var document = await context.OpenAsync(req => req.Content("Some example source
This is a paragraph element")); //对文档执行如下操作 Console.WriteLine("Serializing the (original) document:"); Console.WriteLine(document.DocumentElement.OuterHtml); var p = document.CreateElement("p"); p.TextContent = "This is another paragraph."; Console.WriteLine("Inserting another element in the body ..."); document.Body.AppendChild(p); Console.WriteLine("Serializing the document again:"); Console.WriteLine(document.DocumentElement.OuterHtml);}
4、获取html中的元素
static async Task UsingLinq(){ //使用默认配置创建一个用于评估web页面的新上下文 var context = BrowsingContext.New(Configuration.Default); //根据虚拟请求/响应模式创建文档 var document = await context.OpenAsync(req => req.Content("
- First item
- Second item
- Third item!
- Last item!