你想在电脑上安装Python的BeautifulSoup吗?现在进来,发现如何使用pip install BeautifulSoup命令在Windows、macOS和Linux上安装BeautifulSoup。

BeautifulSoup毫无疑问是Python中最受欢迎的网络爬虫工具。虽然它通常与HTTP库Requests一起使用,但也可以在Selenium甚至Scrapy中看到它的应用。这是因为它的学习曲线以及从网页文档中解析和提取数据变得非常简单。

有趣的是,BeautifulSoup并不属于Python标准库的一部分。这意味着您需要将其作为第三方工具安装才能使用它。在本文中,我将向您展示如何使用pip install命令来安装Python。

如何在计算机上安装 BeautifulSoup

安装 BeautifulSoup 的第一步是在您的计算机上安装 Python。我建议您从Python官方网站下载最新版本的Python 3。这是下载页面的链接。Python 可用于 Windows、macOS、Linux/UNIX 和许多其他操作系统。

如果您已经下载并安装了它,或者甚至已经安装了它,则可以在命令提示符或终端中使用以下命令来验证安装的 Python 版本。

python3 —version

>> Python 3.11.0

您可以在开头看到带有 (>>) 的输出。如果您没有看到这一点,肯定会出现错误,表明安装不成功。

安装 Python 后,您可以进入下一步,即升级 pip 版本,然后安装 BeautifulSoup。您执行此操作的方式取决于您的计算机操作系统。


安装 Windows 版 BeautifulSoup

建议您在安装之前将 pip 版本升级到最新版本。使用下面的代码安装最新版本的 pip。

pip3 install —upgrade pip

如果上面的代码成功运行,那么现在就可以在您的系统上安装 BeautifulSoup 了。您也可以使用下面的 pip 命令来完成此操作。

pip install beautifulsoup4

正如你所看到的,我没有输入 beautifulsoup 而是输入 beautifulsoup4。


为 Linux 和 macOS 安装 BeautifulSoup

与 Windows 一样,建议您将 pip 升级到最新版本以防止出现任何问题。但在大多数情况下,安装不会出现任何问题,但会在屏幕上记录警告。以下是用于在 macOS 和 Linux 中升级 pip 版本的 pip 命令。

sudo pip3 install —upgrade pip

上面的命令将为您将 pip 升级到最新版本。pip 升级后,您可以使用下面的 pip 命令来安装 BeautifulSoup。

sudo pip install beautifulsoup4

如何导入和使用BeautifulSoup现在您已经导入了 BeautifulSoup,是时候使用它了,无论您使用的是 Windows、macOS,甚至 Linux,您都可以以相同的方式使用它。如果您习惯导入其他模块,您可能需要使用“import beautifulsoup4”导入它。但这会抛出异常。相反,您可以导入它,如下所示。

import requests

from bs4 import BeautifulSoup

page_content = requests.get(“YOUR_TARGET_URL”).content

soup = BeautifulSoup(page_content, “html.parser”)

a_elements = soup.find_all(“a”)

for a in a_elements:

            print(a)

上述代码将访问您提供的作为 YOUR_TARGET_URL 替换的任何 URL,并下载页面内容。然后它将其输入 BeaitufulSoup 并找到所有锚元素 (<a>);然后,使用 for 循环语句,在控制台上打印出所有元素。如果您检查上面的代码,您会看到我添加了“html.parser”作为 BeautifulSoup 的第二个参数。

这用于指定要使用的解析器,在我自己的例子中,是 html.parser。这不是强制性的,因为如果您不指定,BeautifulSoup 会为您选择。但是,它会在屏幕上为您打印一条警告消息。


结    论

BeautifulSoup库非常适用于网络爬虫,因为它可以使用易学的API轻松提取数据。BeautifulSoup通常与requests一起使用,方便从网页上进行数据抓取,但也有很多开发者将其与Selenium和其他网络爬虫工具一起使用。

这篇文章有用吗?

点击星号为它评分!

平均评分 / 5. 投票数:

到目前为止还没有投票!成为第一位评论此文章。

No more articles