[Райан Митчелл] Парсинг с помощью Python. Веб-скрапинг в действии. 3-е межд. изд. (2025)

100 

Описание

[Райан Митчелл] Парсинг с помощью Python. Веб-скрапинг в действии. 3-е межд. изд. (2025)

[Райан Митчелл] Парсинг с помощью Python. Веб-скрапинг в действии. 3-е межд. изд. (2025)

Парсинг с помощью Python. Веб-скрапинг в действии Если программирование — магия, то веб-скрапинг — настоящее колдовство. Написав простую автоматизированную программу, можно отправлять запросы веб-серверам, получать ответы с данными, а затем анализировать эти данные и извлекать необходимую информацию.

Это обновленное третье издание книги не только познакомит вас с веб-скрапингом, но и послужит исчерпывающим руководством по сбору практически любых видов данных в современном Интернете. В части I основное внимание уделено механике веб-скрапинга: как с помощью Python отправлять запросы веб-серверам, обрабатывать ответы и автоматизировать взаимодействие с сайтами. В части II исследуются более конкретные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.

Книга покажет, как:

  • анализировать сложные HTML-страницы;
  • разрабатывать веб-сканеры с помощью фреймворка Scrapy;
  • хранить данные, полученные с помощью скрапинга;
  • читать и извлекать данные из документов;
  • очищать и нормализовывать плохо отформатированные данные;
  • читать и записывать информацию на естественных языках;
  • выполнять поиск по формам и страницам входа;
  • выполнять скрапинг JavaScript-кода и работать с API;
  • писать и использовать программы для преобразования изображений в текст;
  • обходить противоскрапинговые ловушки и блокаторы ботов;
  • тестировать свои веб-сайты с помощью скрапинга.

Тема: Бестселлеры O’Reilly
Год: 2025
Страниц: 352
Формат: Скан PDF + Электронная книга (pdf+epub).

Автор курса: Райан Митчелл

У нас Вы можете приобрести всего за 100 руб.

Отзывы

Отзывов пока нет.

Будьте первым, кто оставил отзыв на “[Райан Митчелл] Парсинг с помощью Python. Веб-скрапинг в действии. 3-е межд. изд. (2025)”