Этот вопрос проверяет понимание концепции извлечения данных с веб-сайтов и её применения в IT.
Скрапинг данных (веб-скрапинг) — это метод автоматического сбора информации с веб-сайтов. Вместо ручного копирования данных, программа-скрапер отправляет HTTP-запросы к целевым страницам, получает HTML-код и извлекает из него нужные элементы (текст, ссылки, изображения). Это широко используется для мониторинга цен, сбора контента, анализа рынка и создания баз данных.
Процесс обычно включает несколько шагов:
import requests
from bs4 import BeautifulSoup
url = 'https://example.com/products'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# Извлекаем названия товаров
products = soup.select('.product-title')
for product in products:
print(product.text.strip())Этот код получает HTML страницы, находит все элементы с классом 'product-title' и выводит их текст.
Важно помнить о юридических аспектах: не все сайты разрешают скрапинг, поэтому нужно проверять robots.txt и условия использования.
Вывод: Скрапинг данных — мощный инструмент для автоматизации сбора информации, но требует осторожности и соблюдения правил сайтов. Он особенно полезен, когда нужно быстро получить большие объёмы структурированных данных из открытых источников.