在C语言中,可以使用libcurl库来获取网址中的HTML内容,然后使用正则表达式来匹配和提取HTML标签,以下是一个简单的示例:
1、需要安装libcurl库,在Debian/Ubuntu系统上,可以使用以下命令安装:
sudo aptget install libcurl4openssldev
2、创建一个名为main.c
的文件,并添加以下代码:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <curl/curl.h>
// 回调函数,用于将获取到的数据写入字符串
size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream) {
size_t written = fwrite(ptr, size, nmemb, (FILE *)stream);
return written;
}
int main() {
CURL *curl;
CURLcode res;
char *html_content = malloc(1);
html_content[0] = '