環境(動けば環境は何でもよいかなと):
jupyter-lab
前提としてpythonはインストール済みであることとする。
実装:
import requests
from bs4 import requests
# webスクレイピングするURI
url = "https://news.google.com/home?hl=en-IL&gl=IL&ceid=IL:en"
req = requests.get(url)
beautiful_soup = BeautifulSoup(r.content, "html.parser")
# dixタグの中身の表示をする
print(beautiful_soup.select("div"))
感想:
正直簡単だと思った。適当にコピペするだけである程度のものはできる。
さらに条件を絞るなど行うこと同様に簡単な認識。
補足:
モジュールがないと言われた場合、下記コマンドをたたくことでモジュールエラーを解決できる。
pip install requests
pip install requests