Парсинг html данных с сайтов в Excel через CSS селекторы в программе для парсинга Netpeak Spider HD
http://www.azoogle.ru/website-data-parsing/ Первоисточник видео: https://www.youtube.com/watch?v=j3HjpWshwB4 Если у Вас возникли вопросы по этому видео, нужны ссылки на упоминаемые ресурсы, текстовый транскрипт данного видео или совет – перейдите на мой блог по ссылке выше и оставьте комментарий внизу статьи. Я не имею возможности отвечать на все комментарии на YouTube, и вы гораздо быстрее получите ответ на свой вопрос, если оставите его в виде комментария на моем блоге. Плюс можно настроить уведомление на почту об ответе. Если вам необходима помощь в создании, продвижении сайта, увеличении трафика, продаж и росте вашего бизнеса перейдите по ссылке ниже на страницу «Контакты» и оставьте заявку на конфиденциальную консультацию. Мы обсудим, как я могу помочь вашему бизнесу и если мы подходим друг другу, то мы сразу же приступим к работе по увеличению вашего дохода и прибыли. http://www.azoogle.ru/contact/ ================================= Мой Инстаграм: https://www.instagram.com/idamvitrotana/ Мой Фейсбук: http://www.facebook.com/dmtriitatarinov ================================= Текстовый транскрипт видео: В прошлом видео мы разбирали, как делать парсинг данных о товарах с сайта интернет магазина через Xpath. В этом видео мы разберем, как извлекать любые данные с помощью CSS селекторов в Excel таблицы в программе для парсинга «Netpeak Spider». CSS-селектор – это альтернативный метод парсинга данных. С помощью «Netpeak Spider» мы можем извлечь практически любую информацию, которая содержится в HTML-коде страницы. Парсинг данных с помощью CSS селекторов – исходные данные Есть сайт поставщика мебели. Мы хотим спарсить/извлечь из этого сайта информацию по определенным товарам. В данном случае это кровати. Сайт большой, потому что на нем представлены не только кровати, но и мягкая мебель, матрасы, столы, стулья и так далее. Для того чтобы сэкономить время и ресурсы, нет смысла парсить несколько десятков тысяч страниц со всеми товарами. Нас не интересует информация обо всех товарах. Мы хотим взять информацию только одного из разделов и загрузить ее себе на сайт. Потому что у этого поставщика нет выгрузки в Exel-таблице, нет товарного фида, нет фида в формате YML. У них есть только информация, загруженная на сайт. Заходим в карточку товара и смотрим, какие данные мы хотим отсюда извлечь: • данные о названии; • цены товара; • габариты спального места; • доступные цвета и материалы; • картинки; • технические характеристики; • описание товара. В настройках парсинга «Netpeak Spider» необходимо указать те правила, по которым следует парсить данные, после чего запустить «Netpeak Spider». Он автоматически соберет нужные данные, которые можно будет выгрузить, например, в Excel-таблицу. Далее можно дополнить их, отредактировать, загрузить на свой сайт, в итоге потратив 10 минут. Так можно получить всю информацию о товарах с готовой структурой, которая составит новый полноценный раздел по кроватям или дополнит уже существующий раздел. Настройки парсинга
Похожие видео
Показать еще