如何在 Jupyter Notebook 中安裝 BeautifulSoup

?

?
在 Jupyter Notebook 上安裝 BeautifulSoup 非常簡單,您將為出色的 Web 抓取和數據提取做好準備。它是一個 Python 庫,使 HTML 和 XML 處理 Web 數據。它將幫助您在 Jupyter Notebook 中啟動并運行 BeautifulSoup,以便您可以輕松抓取和分析 Web 內容。本文將引導排名的初學者到經驗豐富的開發人員,確定如何快速有效地設置 BeautifulSoup。

?

設置 Jupyter Notebook

以下是在 Jupyter Notebook 中安裝 BeautifulSoup 之前應遵循的一些先決條件。

安裝 Jupyter Notebook

Jupyter Notebook 的安裝 相對簡單,最簡單的方法是使用名為 pip 的 Python 安裝程序執行此作。打開終端或命令提示符并運行以下命令:

pip install notebook

啟動 Jupyter Notebook

安裝后,您可以在終端或命令提示符下使用以下行啟動 Jupyter Notebook:

jupyter notebook

創建新筆記本

創建新筆記本,請單擊儀表板右側的“新建”按鈕,然后選擇“python3(或安裝的任何 Python 版本)。它將打開一個新的筆記本,您可以在其中編寫和執行 Python 代碼。

如何在 Jupyter Notebook 中安裝 BeautifulSoup

步驟 1:打開 Jupyter 筆記本

首先,打開 Jupyter Notebook。您可以從命令行啟動 Jupyter Notebook。這將在您的 Web 瀏覽器中打開一個帶有 Jupyter Notebook 界面的新選項卡。

jupyter notebook

第 2 步:安裝 BeautifulSoup

使用 pip 和以下命令將 BeautifulSoup 安裝到 Jupyter Notebook 的新單元格中。這將運行 beautiful soup 及其所有依賴項的安裝。感嘆號 !用于直接從 Jupyter Notebook 單元運行 shell 命令。

!pip install beautifulsoup4

第 3 步:驗證安裝

安裝后,請檢查 BeautifulSoup 是否安裝正確。創建一個新單元格并嘗試導入 BeautifulSoup:

pip show beautifulsoup4

除非有錯誤,或者打印了版本號,否則 BeautifulSoup 安裝成功并準備就緒。

BeautifulSoup 的用法示例

下面是如何使用 BeautifulSoup 庫的一個非常簡單的示例。此腳本將向您展示如何解析示例 HTML 文檔以獲取感興趣的數據:

解釋:

在下面的示例中,BeautifulSoup 用于解析示例 HTML 文檔并提取特定數據。首先,導入 BeautifulSoup 庫并定義示例 HTML 字符串。然后使用 'html.parser' 參數通過 BeautifulSoup 解析 HTML,以創建解析樹。該腳本演示了如何提取 HTML 文檔的標題并打印它,以及如何通過迭代 soup.find_all('a') 的結果并從每個鏈接中提取 'href' 屬性來查找和打印文檔中的所有超鏈接(錨點標簽)。

from bs4 import BeautifulSoup

# Sample HTML
html_doc = """
<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a  class="sister" id="link1">Elsie</a>,
<a  class="sister" id="link2">Lacie</a> and
<a  class="sister" id="link3">Tillie</a>;
and they lived at the bottom of a well.</p>
<p class="story">...</p>
"""

# Parse the HTML
soup = BeautifulSoup(html_doc, 'html.parser')

# Extract and print the title
print(soup.title.string)

# Extract and print all links
for link in soup.find_all('a'):
    print(link.get('href'))

BeautifulSoup 的最佳實踐

以下是一些最佳實踐:

使用虛擬環境

隔離:它創建了一個虛擬環境,以便不同項目的所有依賴項不會相互沖突。

1. 創建虛擬環境

python -m venv myenv

2. 激活虛擬環境

myenv\Scripts\activate

3. 使用 %pip 魔術命令

特定于 Jupyter:使用 %pip magic 命令確保安裝在 Jupyter 內核環境中。

%pip install beautifulsoup4

4. 文檔依賴關系

requirements.txt:確保將依賴項記錄在 requirements.txt 文件中,以備后用。

pip freeze > requirements.txt

5. 使用 --upgrade 進行更新

定期升級 BeautifulSoup 以能夠使用其任何最新功能和安全補丁。

%pip install --upgrade beautifulsoup4

結論

?
在 Jupyter Notebook 中安裝 BeautifulSoup 非常簡單。使用上述步驟,您可以開始使用 BeautifulSoup 進行任何網絡抓取或數據提取任務。

在本文中,您應該能夠了解如何輕松安裝 BeautifulSoup 包并檢查其安裝。如果您遇到問題,請確保您已安裝最新版本的 Python 和 Jupyter Notebook。

?

常見問題解答:如何在 Jupyter Notebook 中安裝 BeautifulSoup

如何在 Jupyter Notebook 中用 Python 安裝 BeautifulSoup?

無論如何,要在 Jupyter Notebook 中安裝 Beautiful Soup,您需要在 Notebook 的任何單元格中輸入以下命令:

pip 安裝 beautifulsoup4

如何在 Jupyter 筆記本中安裝 Python 包?

使用以下命令:

!pip install package_name

如何在 Jupyter 筆記本中安裝文件?

使用這個:

pip 安裝 /path/to/your_file.whl

?

登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP

1
1