如何用python爬取图片

admin
行业动态
2024-04-13
2

要用Python爬取图片，我们可以使用requests库和BeautifulSoup库，以下是详细的技术教学：

1、确保已经安装了requests和BeautifulSoup库，如果没有安装，可以使用以下命令进行安装：

Bash

pip install requests
pip install beautifulsoup4

2、导入所需库：

如何用python爬取图片

Python

import requests
from bs4 import BeautifulSoup
import os

3、定义一个函数，用于下载图片：

Python

def download_image(url, save_path):
    response = requests.get(url)
    with open(save_path, 'wb') as f:
        f.write(response.content)

4、定义一个函数，用于获取网页中的所有图片链接：

如何用python爬取图片

Python

def get_image_urls(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')
    img_tags = soup.find_all('img')
    img_urls = [img['src'] for img in img_tags if 'src' in img.attrs]
    return img_urls

5、定义主函数，用于爬取网页中的所有图片：

Python

def main(url, save_dir):
    if not os.path.exists(save_dir):
        os.makedirs(save_dir)
    img_urls = get_image_urls(url)
    for img_url in img_urls:
        save_path = os.path.join(save_dir, img_url.split('/')[1])
        download_image(img_url, save_path)
        print(f'下载完成：{img_url} > {save_path}')

6、调用主函数，开始爬取图片：

如何用python爬取图片

Python

if __name__ == '__main__':
    url = 'https://www.example.com'  # 替换为目标网站的URL
    save_dir = 'images'  # 图片保存的文件夹名称
    main(url, save_dir)

将以上代码保存为一个Python文件，例如download_images.py，然后在命令行中运行该文件，即可开始爬取图片，注意将url变量替换为目标网站的URL。

如何用python爬取图片

相关推荐

热门文章

云服务器在搭建实时报警平台中扮演什么角色？

MySQL存储过程的高效使用与编写指南，如何优化C语言中的MySQL存储过程？

配件网站模板_网站模板设置

如何轻松租用云服务器，关键步骤和技巧指南

如何检查网络连接状态以确保设备已连接到互联网？

是否必须购买云数据库以配合云服务器使用？

CFTPSSL证书是什么？它如何提升文件传输的安全性？

为什么服务器在技术世界中如此受到青睐？

如何用python爬取图片

相关文章

相关推荐

热门文章