当前位置:首页 > 行业动态 > 正文

HTML 使用Html Agility Pack从HTML BODY节点中提取内部文本

要使用Html Agility Pack从HTML BODY节点中提取内部文本,首先需要安装Html Agility Pack库,在C#项目中,可以通过NuGet包管理器安装。

HTML 使用Html Agility Pack从HTML BODY节点中提取内部文本  第1张

安装完成后,可以使用以下步骤来提取HTML BODY节点中的内部文本:

1、引入命名空间:

using HtmlAgilityPack; 

2、创建一个HtmlDocument对象,加载HTML内容:

var html = "<html><body>这是一个示例文本</body></html>";
var document = new HtmlDocument();
document.LoadHtml(html); 

3、获取BODY节点:

var bodyNode = document.DocumentNode.SelectSingleNode("//body"); 

4、提取BODY节点中的内部文本:

var innerText = bodyNode.InnerText;
Console.WriteLine(innerText); // 输出: 这是一个示例文本 

以下是完整的示例代码:

using System;
using HtmlAgilityPack;
namespace HtmlAgilityPackDemo
{
    class Program
    {
        static void Main(string[] args)
        {
            var html = "<html><body>这是一个示例文本</body></html>";
            var document = new HtmlDocument();
            document.LoadHtml(html);
            var bodyNode = document.DocumentNode.SelectSingleNode("//body");
            var innerText = bodyNode.InnerText;
            Console.WriteLine(innerText); // 输出: 这是一个示例文本
        }
    }
} 
0