Scraping Browser 是 Bright Data 开发并投放市场的新工具之一。该工具的开发旨在通过为您提供对代理基础架构和永不失败的高效解锁系统的访问权限,使网络抓取变得更加容易。

无限制网络爬虫的首选插件

  • 具有良好的地理定位支持和优秀的地理目标定向支持
  • 基于Bright Data代理架构构建
  • 强大的解封技术
  • 易于与流行的自动化浏览器API集成和使用
  • 高度可扩展,可以处理任意数量的浏览器会话
  • 减少您用于网络爬虫的抓取资源

对Brightdata的Scraping Browser进行的专业评估

Scraping Browser 刚刚由Bright Data推出。从这个工具的名称来看,您会认为它是一个普通的浏览器,您可以使用它来满足您的抓取需求。实际上,它甚至不是一个独立的网络浏览器——它是一个集成到 Puppeteer 和 Playwright 中的网络浏览器。

但是为什么要使用它而不是仅仅使用任何其他无头浏览器来满足您的抓取需求呢?好吧,它为您提供的浏览器不仅仅是用于呈现网页和呈现/执行 javascript 的网络浏览器。它是一款具有强大解锁技术的Scraping Browser,利用了 Bright Data 的代理基础设施。您可以将其视为自动化浏览器、Web 解锁器和代理的组合。

这是同类产品中的一种,因为市场上没有该工具的其他竞争对手。如果您正在寻找在您的抓取项目中遇到麻烦的网络阻塞,那么 Scraping Browser 是适合您的工具。该工具的开发易于使用,并且从另一个工具移植到集成它更容易,因为它与 Puppeteer 和 Playwright 兼容。


世界排名第一的Scraping Browser解决方案(三合一浏览器)

与 Bright Data 提供的所有其他产品线一样,Scraping Browser 确实有它要解决的问题。但它要解决的问题是什么?

通常,Scraping Browser 的强大之处在于它可以帮助您规避块并减少您在网络抓取时必须处理的资源。让我们来看看 Scraping Browser 的一些最佳用例。

网页抓取

从这个工具的名字就可以看出它是一个网页抓取工具。但是它在网络抓取方面有多好,有什么特点让它如此出色?您可以将参数传递给 Puppeteer 和 Playwright 以使用此浏览器。

它开箱即用地兼容 Puppeteer 和 Playwright。有了这个,您不需要设置额外的代理,因为它已经基于Bright Data 提供的代理网络和网络解锁器。由于其地理定位选项,它确实支持本地化的网络抓取。

浏览器自动化

虽然此浏览器是为网络抓取而开发的,但它也是在网络浏览器上自动执行其他非抓取任务的完美工具。您可以使用它来自动执行诸如滚动、单击按钮、在输入字段中键入、加载整页、导航页面等许多其他任务。

这些连同其解锁功能使其成为自动执行任务的完美浏览器。您可以将 Puppeteer 和 Playwright API 与 Scraping Browser 一起使用来确保这一点。

畅通基础设施

Scraping Browser 的显着特点是它的解锁功能。有趣的是,由于网站不支持自动访问,因此自动浏览器阻止非常普遍。

随着网站的反垃圾邮件系统变得有效和复杂,基本的解锁技术已不起作用。一些团队拥有内部解锁技术。如果您没有并且由于要求而不想投资,那么 Scraping Browser 是一个不错的选择。


Scraping Browser的工作原理

Bright Data 的 Scraping Browser 有一个看起来很简单的工作模型。然而,它在某种程度上是复杂的。基本思想是它可以帮助您处理网络抓取时的障碍。但是它是如何工作的呢?

Scraping Browser 基本上充当您的代理。它被集成到Puppeteer 和 Playwright中作为浏览器。但是,当您发送 Web 请求时,请求会发送到该工具,然后该工具会处理所有形式的块。

从文章的开头,就提到了Scraping Browser是一个自动化浏览器,它利用了Bright Data的网络畅通和代理基础设施。这两个是 Scraping Browser 的主要真正力量。通过帮助处理代理、验证码和标头,您将专注于采取其他行动以获取所需数据——而不是处理块。


定价和功能

Scraping Browser将帮助您节省时间甚至金钱,但代价是什么?该浏览器是一种高级工具,也是同类产品中的一种。这意味着您必须为此付费。但是,如果您查看 Bright Data 的主页,则不会获得此信息。您将需要检查仪表板以查看定价,因为它不是 Bright Data 提供的主要服务。定价非常简单,遵循现收现付模式。

它根据流量(带宽)和会话收费。Bandits 的估计成本是每 GB 20 美元。对于会话,您将被收取每小时 0.10 美元的费用。考虑到您不必处理代理和解除阻塞,这个价格非常值得。它还可以让您免去拥有内部畅通基础设施的麻烦。重要的是您知道这里使用的术语是估计成本。这是因为有些变量会改变成本并使其价格更高一些。但总的来说,就刮擦困难的刮擦目标而言,定价是负担得起且便宜的。

Scraping Browser的特点

  • Scraping Browser 建立在两个重要的基础设施之上——网络解锁器和代理网络。
  • 支持本地化数据抓取,因为 Bright Data 代理网络在世界所有地区都有 IP。
  • 由于其动态有效的 Web 解锁器,可有效对抗 Web 拦截器和反垃圾邮件系统。
  • 价格实惠且便宜,并且基于带宽和会话使用情况。它遵循现收现付模式。
  • 开箱即用地兼容 Puppeteer 和 Playwright。如果使用 Puppeteer 或 Playwright,也很容易从其他工具移植到 Scraping Browser。
  • 相当可扩展,可以根据您的需要处理任意数量的浏览器会话。
  • 一种超快速、高效的可靠解决方案,可为您提供出色的正常运行时间,非常适合关键应用程序。

如何使用Scraping Browser

使用 Scraping Browser 非常简单,除了您应该已经拥有的 Puppeteer 或 Playwright 之外,不需要您安装任何工具。按照下面突出显示的步骤设置和使用 Scraping Browser。

使用 Scraping Browser 非常简单,除了您应该已经拥有的 Puppeteer 或 Playwright 之外,不需要您安装任何工具。按照下面突出显示的步骤设置和使用 Scraping Browser。

  • 前往 Bright Data 网站并创建一个帐户。您需要验证您的帐户并添加付款方式。
  • 完成后,您将获得 5 美元的免费使用额度。您可以将其用作免费礼物来测试 Scraping Browser。不用担心,未经您同意添加的付款方式不会向您收费。
  • 在左侧的导航部分,单击代理和抓取基础设施图标。
代理和抓取基础设施
  • 单击“添加代理”按钮,然后从出现的下拉列表中选择“Scraping Browser”。
添加代理按钮并选择抓取浏览器
  • 在提供的输入字段中,为代理命名。确保它很短并仔细考虑,因为之后无法更改。但是,您仍然可以根据需要创建新的代理。请记住,在文章的开头,我将 Scraping Browser 描述为代理,从这里,您可以看到它是代理。
  • 单击添加代理按钮。您将被带到一个页面,您可以在其中复制 API 参数,例如主机、用户名和密码。您将需要它们来配置 Puppeteer。
  • 安装人偶核心。没有安装浏览器的版本。为 nodeJS 执行此操作的命令是“npm i puppeteer-core”
  • 下面是一个黄色的世界代码,演示了如何使用 Scraping Browser 工具通过 Puppeteer API 进行网页抓取。
const puppeteer = require('puppeteer-core');

const browser = await puppeteer.connect ({ browserURL :

'http://username:[email protected]:9222/ ', });

const page = await browser.newPage (); await page.goto('https://example.com/');
  • 您应该将代理主机、用户名和密码与您自己复制的访问参数交换。

我们的判决

Scraping Browser工具充当代理,帮助您在抓取时避免阻塞。在撰写本文时,Scraping Browser 还不到 3 天。因此,网上几乎没有关于它的详细信息。我们确实尝试使用该工具并且它起作用了。

但是,需要在一段时间内并在尽可能多的站点上进行试用,并使用其他用户的评论。但是对于它的构建目的,它起作用了。它速度很快,可以为您解决令人头疼的块问题。定价也很实惠,非常值得。

这篇文章有用吗?

点击星号为它评分!

平均评分 / 5. 投票数:

到目前为止还没有投票!成为第一位评论此文章。

No more articles