Сео форум про методы раскрутки сайтов. Как раскрутить сайт и заработать в интернете.

Сео форум про методы раскрутки сайтов. Как раскрутить сайт и заработать в интернете. (http://forum-seo.net/index.php)
-   Поисковые системы (http://forum-seo.net/forumdisplay.php?f=10)
-   -   A-Parser 1.1 - продвинутый парсер поисковых систем, Suggest, PR, DMOZ, Whois, etc (http://forum-seo.net/showthread.php?t=17549)

A-Parser Support 22.07.2019 15:37

Сборник статей #8: ссылки с GET параметрами, скачивание Google документов, очистка очереди через API(https://a-parser.com/threads/5483/)
8-й сборник статей. В нем мы научимся парсить ссылки с GET параметрами, искать в поиске Google и скачивать документы, а также узнаем как очищать очередь заданий через API. Поехали!

Сбор ссылок с GET параметрами
В техническую поддержку часто задают вопрос, как собирать ссылки с GET параметрами для поиска SQL уязвимостей. Поэтому, по ссылке выше мы расскажем как это сделать, используя стандартный парсер Google.
https://files.a-parser.com/img/gagz5_190722113529.png

Поиск и скачивание Google документов
За последнее время уже несколько раз появлялись новости о том, что Google индексирует пользовательские документы, размещенные в их одноименном сервисе и открытые для доступа по ссылке. Соответственно все эти файлы становятся доступны в поиске. И пока Google разбирается с этим, по ссылке выше мы рассказываем как можно искать и скачивать такие документы.
https://files.a-parser.com/img/j8v5t_190720165716.png

Работаем с API, часть 3
Третья и заключительная часть из цикла статей по работе с A-Parser через API. В ней на примере очистки очереди задач будет рассмотрена работа со вспомогательными запросами, которые позволяют работать с очередью заданий. Все детали - по ссылке выше.

https://files.a-parser.com/img/butto...rser_small.png
https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 01.08.2019 15:17

Сборник рецептов #34: оценка трафика, парсинг Ahrefs и информация об IP адресах
 
34-й сборник рецептов, в котором опубликован пресет для оценки количества трафика на сайтах, парсер Ahrefs через API и пресет для парсинга информации об IP адресах. Поехали!

Чек трафика сайта
Пресет для проверка трафика сайта через сервис siteworthtraffic.com. Собираются данные о количестве уникальных постетителей и просмотров, а также о доходе с рекламы. Оценка трафика на сайтах может быть полезна для фильтрации списка сайтов по критерию прибыльности и популярности. Пресет доступен по ссылке выше.
https://files.a-parser.com/img/9syo2_190731155238.png

Парсер Ahrefs на основе Ahrefs API
Парсер для сбора данных из популярного сервиса Ahrefs через их официальное API. Собирается множество данных, которые позволяют оценивать домены по различным характеристикам. Для использования нужен API ключ, который приобретается отдельно.
https://files.a-parser.com/img/g5ykb_190725184610.png

Парсинг подсети и организации по IP
Небольшой пресет для сбора информации об IP адресе, а именно: подсеть, организация, страна и город. Данные собираются из сервиса whoer.net.
https://files.a-parser.com/img/3lgog_190731154735.png

Еще больше различных рецептов в нашем Каталоге (https://a-parser.com/resources/)!
Предлагайте ваши идеи для новых парсеров здесь (https://a-parser.com/threads/3464/), лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube (https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw) - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter (https://twitter.com/a_parser).

https://files.a-parser.com/img/butto..._small_500.png
https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 20.08.2019 19:08

1.2.570 - новые парсеры API::Server::Redis и SE::Startpage, улучшения в существующих парсерах(https://a-parser.com/threads/5523/)
https://files.a-parser.com/img/1.2.570.png
Улучшения
  • Добавлен новый парсер API::Server::Redis (только для лицензий Enterprise)
  • В https://a-parser.com/img/parsers/se-google.pngSE::Google::Modern добавлена возможность определять наличие расширенных сниппетов (rich snippets) в выдаче
  • В связи с изменениями на сервисе-источнике парсер SE::IxQuick был удален, а вместо него добавлен SE::Startpage с почти аналогичным функционалом
  • Улучшена логика работы функции Get full links в SE::Baidu
  • В [URL=https://a-parser.com/wiki/se-google-modern/]SE::Google::Modern[/URL] реализована возможность указывать дополнительные заголовки для запросов
  • Улучшен парсинг меток сайтов в https://a-parser.com/img/parsers/se-yandex.png[URL=https://a-parser.com/wiki/se-yandex/]SE::Yandex[/URL], а также добавлена поддержка новых типов меток
  • Улучшена логика работы функции Get full links в SE::Baidu
  • Оптимизирован алгоритм обработки подзапросов
Исправления в связи с изменениями в выдачеИсправления
  • Исправлена проблема, из-за которой в некоторых случаях при запросе через API возвращался пустой массив страниц
  • Исправлено падение скорости в https://a-parser.com/img/parsers/net-whois.png[URL=https://a-parser.com/wiki/net-whois/]Net::Whois[/URL]
  • Исправлен баг в оптимизации парсеров
  • Исправлено сохранение параметра Report period в https://a-parser.com/img/parsers/se-...-frequency.png[URL=https://a-parser.com/wiki/se-yandex-direct-frequency/]SE::Yandex:: Direct::Frequency[/URL]
  • В https://a-parser.com/img/parsers/html-linkextractor.png[URL=https://a-parser.com/wiki/html-linkextractor/]HTML::LinkExtractor [/URL]исправлен сбор ссылок, если в них есть перенос строки
https://files.a-parser.com/img/butto..._small_550.pnghttps://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 30.08.2019 14:47

[URL=https://a-parser.com/threads/5553/]Видео урок: Поиск страниц контактов[/URL]
В этом видео уроке рассмотрен пример решения задачи по поиску страниц контактов у заданного списка сайтов. Также парсится тайтл и все это сохраняется в CSV файл.

В уроке рассмотрено:
  • парсинг поиска Google для получения ссылки на страницу контактов
  • парсинг главной страницы сайта для получения title
  • использование инструмента $tools.CSVline для форматирования файла результата
  • пример правильного импорта в Excel
Оставляйте комментарии и подписывайтесь на [URL=https://www.youtube.com/c/AParser_channel]наш канал на YouTube[/URL]!

[URL=https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ]https://files.a-parser.com/img/butto..._small_550.png[/URL]

A-Parser Support 09.09.2019 16:46

Сборник рецептов #35: комментарии на Youtube, контакты на сайтах и японский Yahoo(https://a-parser.com/threads/5572/])
35-й сборник результатов, где мы будем собирать комментарии из Youtube, искать контакты (телефоны и почты) на сайтах, а также парсить японскую выдачу Yahoo. Поехали!
[BПарсинг комментариев из Youtube[/B]
Представляем вашему вниманию JS парсер комментариев для видео на Youtube. С его помощью можно собирать тексты комментариев, а также информацию об авторах комментариев индивидуально для каждого видео. Также реализована возможность указывать количество страниц с комментарими, что позволяет при необходимости ограничить их сбор и тем самым увеличить скорость работы.
https://files.a-parser.com/img/mctw5_190909115641.png

Извлекаем телефоны, начинающиеся на 3 с помощью HTML::EmailExtractor
Пресет, в котором показано, как с помощью HTML::EmailExtractor HTML::EmailExtractor собирать контакты со страниц сайтов. Данный пресет предназначен для сбора e-mail и телефонов, начинающихся с 3 (Украина), но при необходимости можно немного изменить регулярные выражения и собирать телефоны других стран.
https://files.a-parser.com/img/80rx0_190909130311.png

SE::Yahoo::JP
JS парсер для парсинга японской выдачи Yahoo. Используется домен search.yahoo.co.jp. Собираются ссылки, анкоры и сниппеты, а также есть возможность задать количество страниц для парсинга.
https://files.a-parser.com/img/dxwci_190909122454.png

https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

seoquick 13.09.2019 08:36

Что такое парсер
 
На сегодняшний день парсеры, это огромные SEO- комбайны, способные помочь SEO специалистам и вебмастерам любого уровня подготовки.
Можно также обратится к специалисту и вам напишут парсер под ваши запросы. Здорово то, что не нужно искать фрилансеров на просторах интернета. Алгоритм работы у таких программ практически одинаков.
В интернете часто встречаются выражения, из которых следует, будто парсер (поисковый робот, бот) путешествует по интернету. Но в принципе эта программа никогда не покидает компьютера, на котором она инсталлирована. То есть парсер в корне отличается от вируса, хотя в чем то, он напоминает троянскую программу. Ведь с помощью парсера можно получить информацию, совершенно не спрашивая о ней у ее владельца.

A-Parser Support 21.09.2019 14:54

1.2.595 - новый парсер Ahrefs, инструмент для создания CSV и много других улучшений

https://files.a-parser.com/img/1.2.595.png

Улучшения
  • Добавлен новый парсер https://a-parser.com/img/parsers/rank-ahrefs.png Rank::Ahrefs
  • Добавлен инструмент $tools.CSVline для простого создания CSV файлов
  • В связи с тестированием Гуглом новой верстки в поисковике, добавлена ее поддержка в https://a-parser.com/img/parsers/se-google.png SE::Google::Modern
  • В https://a-parser.com/img/parsers/se-google.png SE::Google::Modern в массив $serp добавлена переменная $amp, которая показывает, поддерживает ли страница AMP
  • В https://a-parser.com/img/parsers/se-yandex.png SE::Yandex в $serp.$i.label добавлена поддержка Турбо страниц, а также добавлен сбор типов меток сайтов
  • В https://a-parser.com/img/parsers/net-http.png Net::HTTP улучшена работа с редиректами, добавлена опция Follow common redirects
  • Теперь в https://a-parser.com/img/parsers/util-recaptcha2.png Util::ReCaptcha2 можно указать хост для используемого сервиса разгадывания, а также в Provider url можно указывать адреса через запятую (актуально для XEvil и CapMonster), парсер будет использовать каждый из них в случайном порядке
  • Увеличено количество результатов в парсерах https://a-parser.com/img/parsers/ran...ix-keyword.png Rank::Bukvarix::*
  • Добавлена опция ограничения числа логов, с целью оптимизации использования дискового пространства
  • JS парсеры: улучшена пакетная обработка запросов
Исправления в связи с изменениями в выдачеИсправления
https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 01.10.2019 12:43

Видео урок: Парсинг Google Maps для сбора всех организаций в определенной местности

В этом видео уроке рассмотрен способ сбора данных об организациях в указанной местности из Google Maps, используя встроенный парсер Гугл карт. Также показано как определить необходимые координаты на карте и задать их в парсере.



В уроке рассмотрено:
  • Парсинг карт Google с использованием Maps::Google
  • Пример получения координат для использования в макросах подстановок
  • Работа с макросами подстановок при наличии отрицательных чисел
  • Импорт результата в Excel

Полезные ссылки:
  • Готовый пресет в Каталоге
  • Описание парсера Maps::Google
  • Документация по макросам подстановок
Оставляйте комментарии и подписывайтесь на наш канал на YouTube: https://www.youtube.com/c/AParser_channel

megalionzzz 16.10.2019 05:11

Спасибо, много нового узнал. Только вот как проверить качество запросов которые он вытащит.

A-Parser Support 30.10.2019 18:41

Сборник статей #9: анализ страниц сайта, парсинг всех страниц сайта из индекса и проверка запросов

9-й сборник статей. В нем мы разберемся, как делать пресеты для анализа всех страниц сайта, научимся парсить все ссылки сайта из индекса ПС и будем проверять существование запросов. Поехали!

Создание пресета для анализа страниц сайта
Анализ страниц на сайте - это один из самых популярных кейсов использования А-Парсера. При этом можно собирать очень много различных параметров, начиная от проверки доступности и заканчивая поиском определенных слов на странице.
О том, как сделать простой анализатор сайта и пойдет речь в этой статье.
https://files.a-parser.com/img/jawyq_191029121649.png

Парсинг разными способами максимум результатов из индекса поисковых систем
Парсинг из индекса поисковых систем всех страниц сайта - это еще один популярный кейс для A-Parser. ПС ограничивают кол-во результатов по одному запросу, поэтому нужно как-то обходить это ограничение. Как это сделать - описано в нашей статье.
https://files.a-parser.com/img/7gyeh_191029192345.png

Проверка существования запросов
Пресет из этого примера позволяет проверить базу ключевых слов и определить, был ли запрос одноразовым без постоянного спроса или нет. Тем самым появляется возможность отфильтровать семантику и оставить только "хорошие" запросы. Больше деталей, а также готовый пресет - по ссылке выше.
https://files.a-parser.com/img/2672s_191030120713.png


Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - пишите здесь (https://a-parser.com/threads/3464/).

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники статей
  • Сборник статей #1: A-Parser для маркетологов, SEO-специалистов и реальный опыт работы
  • Сборник статей #2: цикл статей-уроков по созданию JS парсеров
  • Сборник статей #3: пагинация, переменные и БД SQLite
  • Сборник статей #4: добавление товаров в OpenCart и парсинг JSON
  • Сборник статей #5: собственный канал в Telegram и массовое добавление товаров в OpenCart
  • Сборник статей #6: работа с API, сохранение в YML и мануал по подключению Node.js модулей
  • Сборник статей #7: сохранение в xlsx, работа с API и обзор методов автоматизации
  • Сборник статей #8: ссылки с GET параметрами, скачивание Google документов, очистка очереди через API

https://files.a-parser.com/img/butto..._small_750.png
Присоединяйтесь к нашему Telegram каналу, нас уже 750+ - https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 11.11.2019 14:02

1.2.678 - оптимизация работы с прокси, улучшения во встроенных парсерах, исправления ошибок

https://files.a-parser.com/img/1.2.678..png

УлучшенияИсправления в связи с изменениями в выдачеИсправления
  • Исправлена проблема с рандомизацией прокси на Windows 10
  • Исправлено зависание при использовании Check::BackLink
  • Исправлена проблема, при которой не применялся Content-Type в Net::HTTP
  • Исправлена редкая проблема с выбором файла запросов
  • Исправлена обработка редиректов при нестандартном порте
  • Исправлен вывод многострочных данных в tools.CSVline
  • JS парсеры: исправлена проблема с интерфейсом при отсутствии необходимых Node.js модулей
  • JS парсеры: исправлена проблема с подключением модуля jimp

https://files.a-parser.com/img/butto..._small_800.png
telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 21.11.2019 20:02

Видео урок: Парсинг сайта в глубину на основе парсера HTML::LinkExtractor


В этом видео уроке рассмотрен способ создания пресета для анализа сайта в глубину.



В уроке рассмотрено:
  • Парсинг в глубину (уровень) сайта относительно страницы запроса при помощи функции "Парсить до уровня"
  • Получение title (с очисткой от HTML сущностей)
  • Получение таких параметров как:
    • кол-во предыдущих редиректов
    • код ответа сервера
    • кол-во внешних ссылок
Полезные ссылки:
  • https://a-parser.com/resources/357/ - готовый пресет в Каталоге
  • https://a-parser.com/resources/356/ - подробное описание по созданию настроек для парсинга в глубину сайта
  • https://a-parser.com/wiki/advanced-options/#parse-all-results- документация по функции "Парсить до уровня"

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
https://www.youtube.com/c/AParser_channel


https://files.a-parser.com/img/butto..._small_800.png
telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 04.12.2019 17:52

Сборник рецептов #36: уникальность текста, парсер GitHub, посещаемость сайтов, результаты розыгрыша

36-й сборник рецептов, в котором опубликованы парсер для проверки текстов на уникальность, парсер GitHub и парсер для получения информации о посещаемости сайтов. А также список обновленных пресетов из нашего Каталога.

Но, в первую очередь хотим поделиться результатами розыгрыша, который был проведен в связи с Черной пятницей. Мы разыграли 5 лицензий на А-Парсер среди всех новых участников нашего telegram чата, которые присоединились к нему в период проведения акции. Результаты розыгрыша в видео:



А теперь перейдем непосредственно к сборнику.

Проверка текста на уникальность
Задача проверки текстов на уникальность является одной из самых частых для копирайтеров. Возможность осуществлять такую проверку предоставляют много ресурсов. И парсер для одного из таких сервисов опубликован по ссылке выше.
https://files.a-parser.com/img/7w2s9_191128181818.png

Парсер Github
Согласно Википедии, GitHub - это крупнейший веб-сервис для хостинга IT-проектов и их совместной разработки. Поэтому мы не могли обойти его стороной и публикуем парсер данных о репозиториях при поиске по ключевому слову на данном ресурсе.
https://files.a-parser.com/img/7k62o_191128123550.png

Парсинг количества трафика на сайтах
Этот парсер позволяет получать информацию о просмотрах и посещениях страниц за день, месяц и год. В качестве источника данных используется один из известных сервисов.
https://files.a-parser.com/img/npth3_191202155600.png

Кроме этого были обновлены:
  • https://a-parser.com/resources/47 Парсинг базы телефонов из olx.ua
  • https://a-parser.com/resources/21 Парсинг Авито
  • https://a-parser.com/resources/334 Парсинг телефонов и email фрилансеров fl.ru
  • https://a-parser.com/resources/286 Проверка блокировки РосКомНадзора через GitHub
  • https://a-parser.com/resources/144 JS::MailValidator

Еще больше различных рецептов в нашем https://a-parser.com/resources Каталоге
Предлагайте ваши идеи для новых парсеров https://a-parser.com/threads/3464 здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в https://twitter.com/a_parser Twitter.

Все сборники рецептов

https://files.a-parser.com/img/butto...small_1200.png

https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 12.12.2019 16:48

1.2.713 - новые парсеры: Telegram и eBay, оптимизации во встроенных парсерах, новые инструменты

https://files.a-parser.com/img/1.2.713.png

Улучшения
  • Добавлен новый парсер https://a-parser.com/img/parsers/tel...oupscraper.png Telegram::GroupScraper, который собирает из публичных групп в Telegram данные о сообщениях: текст, дата, автор, ссылки на фото и видео
  • Добавлен новый парсер https://a-parser.com/img/parsers/shop-ebay.png Shop::eBay, который позволяет парсить поисковую выдачу на ebay.com
  • Изменения в парсерах Google:
    • Добавлена переменная $detected_geo, в которой содержится информация о геолокации
    • В связи с неактуальностью удалены опции:
      • Old desktop computer (IE6) в Device
      • Util::AntiGate preset
      • Use digit captcha
  • В https://a-parser.com/img/parsers/se-yandex.png SE::Yandex увеличено максимальное значение Pages count до 25
  • В https://a-parser.com/img/parsers/se-google-images.png SE::Google::Images добавлена поддержка новой верстки
  • В https://a-parser.com/img/parsers/util-recaptcha2.png Util::ReCaptcha2 добавлена поддержка capmonster.cloud
  • Парсер https://a-parser.com/img/parsers/se-mailru.png SE::MailRu полностью переписан, добавлена поддержка каптч и сессий и добавлен сбор ссылок на кешированные страницы
  • Парсер https://a-parser.com/img/parsers/se-yandex-direct.png SE::Yandex::Direct полностью переписан, добавлен сбор тегов и дополнительных ссылок с анкорами
  • Добавлен новый инструмент шаблонизатора tools.task, на данный момент он умеет возвращать id задания и число потоков
  • JS парсеры: this.query.add теперь поддерживает передачу дополнительных параметров
Исправления в связи с изменениями в выдаче
  • Множество исправлений в https://a-parser.com/img/parsers/se-google.png SE::Google, он теперь полностью дублирует https://a-parser.com/img/parsers/se-google.png SE::Google::Modern
  • Исправлен парсинг $indexed в Rank::MajesticSEO
  • В Net::Whois исправлена работа с доменной зоной .sex
  • Исправлен парсинг $title в Shop::Yandex::Market
  • Shop::Amazon, SE::Dogpile, Rank::Ahrefs, SE::Bing, Rank::SEMrush, SE::DuckDuckGo, SE::DuckDuckGo::Images, SE::Baidu
Исправления
  • В парсерах Google исправлена ошибка, при которой собираемые ссылки были с переводчиком
  • Исправлены проблемы с рандомизацией в некоторых случаях
  • Исправлена ошибка в Social::Instagram::post при парсинге только массивов данных
  • Исправлена проблема с проходом по пагинации, которая возникла в одной из предыдущих версий
  • JS парсеры: исправлена работа с Node.js модулем socks

https://files.a-parser.com/img/butto...small_1100.png
telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 23.12.2019 19:02

Сборник рецептов #37: парсинг Twitter, поиск и скачивание картинок, парсинг групп в Telegram

37-й сборник рецептов. В него вошли: парсер Twitter, который умеет собирать сообщения, их авторов и т.п.; JS парсер, в котором объединены поиск и скачивание картинок; а также 2 пресета для парсинга Telegram, которые демонстрируют возможности по сбору данных из публичных групп.

Парсер постов из Twitter
Публикуем парсер, который по ключевому слову парсит данные из сообщений в Twitter. Собираются имя и логин автора, текст сообщения, дата публикация, количество лайков, ответов и ретвитов. Есть возможность указать количество страниц для парсинга.
https://files.a-parser.com/img/j3ox3_191221193628.png

JS::ImagesFromSE
Ранее мы уже публиковали JavaScript парсер, в котором объединены парсинг выдачи ПС и парсинг текста со страниц. Теперь представляем вашему вниманию JS парсер, в котором объединены поиск и скачивание картинок.
https://files.a-parser.com/img/jah8t_191223125310.png

Пресеты для парсинга публичных групп в Telegram
Начиная с версии 1.2.709 в А-Парсер был добавлен https://a-parser.com/img/parsers/tel...oupscraper.png Telegram::GroupScraper. Для демонстрации его возможностей мы опубликовали в Каталоге 2 пресета:
  • Парсинг пользователей публичных групп в Telegram
  • Парсинг всех сообщений из публичных групп в Telegram

Еще больше различных рецептов в нашем Каталоге
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Все сборники рецептов

https://files.a-parser.com/img/butto...small_1100.png

A-Parser Support 03.01.2020 15:58

Сборник статей #10: отслеживание цен с уведомлением, парсинг характеристик товаров, редиректы

10-й сборник статей, в котором будет показано, как с помощью А-Парсера получать уведомления в Телеграм об изменении цен на товары, как парсить характеристики товаров и выводить их в виде удобной таблицы, а также подробно описана работа с редиректами.

Периодический мониторинг цен с уведомлением в Telegram
В этой статье пошагово описан процесс создания парсера, с помощью которого можно отслеживать изменение цен товаров. При этом парсер будет присылать уведомление в Телеграм, а также можно легко добавить поддержку других сайтов.
https://files.a-parser.com/img/wud8v_191230180827.png

Сбор характеристик товара
Одной из частых задач для А-Парсера является сбор характеристик товаров в интернет-магазинах. И если сам парсинг совсем не проблема, то формирование итоговой таблицы, при условии, что характеристики должны быть распределены по отдельным столбцам, вызывает вопросы. Поэтому, в данной статье будет описан способ такого парсинга.
https://files.a-parser.com/img/sstoc_200103092306.png

Всё о редиректах
Большая справочная статья, посвященная тематике редиректов.
https://files.a-parser.com/img/pii2f_200103134519.png

Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники статей
  • Сборник статей #1: A-Parser для маркетологов, SEO-специалистов и реальный опыт работы
  • Сборник статей #2: цикл статей-уроков по созданию JS парсеров
  • Сборник статей #3: пагинация, переменные и БД SQLite
  • Сборник статей #4: добавление товаров в OpenCart и парсинг JSON
  • Сборник статей #5: собственный канал в Telegram и массовое добавление товаров в OpenCart
  • Сборник статей #6: работа с API, сохранение в YML и мануал по подключению Node.js модулей
  • Сборник статей #7: сохранение в xlsx, работа с API и обзор методов автоматизации
  • Сборник статей #8: ссылки с GET параметрами, скачивание Google документов, очистка очереди через API
  • Сборник статей #9: анализ страниц сайта, парсинг всех страниц сайта из индекса и проверка запросов

https://files.a-parser.com/img/butto...small_1100.png

A-Parser Support 16.01.2020 20:38

Видео урок: Парсинг тематических доменов из Google и получение различных параметров по доменам

В этом видео уроке рассмотрен способ создания пресета для парсинга тематических доменов по ключевой фразе из поисковой выдачи Google, и получение для доменов различных параметров.



В уроке рассмотрено:
  • Парсинг поисковой выдачи Google
  • Вывод уникальных результатов в качестве главных доменов
  • Получение таких параметров как:
    • зарегистрирован домен или нет
    • дата регистрации и дата окончания регистрации домена
    • язык сайта
    • title и description
    • индекс качества сайта
    • позицию в глобальном рейтинге Alexa
    • cтрану с наибольшим числом трафика по Alexa
    • позицию в рейтинге этой страны по Alexa
Полезные ссылки:
  • https://a-parser.com/wiki/net-whois/ - парсер Net::Whois
  • https://a-parser.com/wiki/html-textextractor-langdetect/ - парсер HTML::TextExtractor::LangDetect
  • https://a-parser.com/wiki/se-yandex-sqi/ - парсер SE::Yandex::SQI
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

https://files.a-parser.com/img/butto...small_1200.png

A-Parser Support 27.01.2020 14:28

1.2.752 - полноценная поддержка Node.js, функция Memory Saver, оптимизация производительности

https://files.a-parser.com/img/1.2.752.png

Улучшения
  • Полноценная поддержка NodeJS 12.13.х, включая нативные модули, подробнее: [URL]https://a-parser.com/threads/5807/[/URL]
  • Новая опция Memory Saver, которая позволяет регулировать потребление памяти парсером
  • Улучшена производительность https://a-parser.com/img/parsers/se-yandex.pngSE::Yandex
  • В https://a-parser.com/img/parsers/shop-amazon.pngShop::Amazon добавлена возможность подключать антигейт, а также поддержка сессий
  • В https://a-parser.com/img/parsers/se-google-byimage.pngSE::Google::ByImage добавлена возможность выбирать язык интерфейса, язык результатов и страну
  • Уменьшено потребление памяти, при использовании нескольких парсеров в задании, разница может достигать 100%
Исправления в связи с изменениями в выдачеИсправления
  • Исправлена работа Bypass Cloudflare в некоторых случаях
  • Исправлена работа при малом числе прокси
  • Исправлена проблема при редактировании дополнительных форматов результатов

https://files.a-parser.com/img/butto...small_1200.png

A-Parser Support 06.02.2020 15:45

Сборник рецептов #38: парсер Яндекс.Кью, парсер сайтов из Яндекс.Радар и определение типов сайтов

38-й сборник рецептов. В нем опубликованы: парсер сервиса вопросов-ответов Яндекс.Кью, парсер для сбора сайтов из Яндекс.Радара, а также парсер для определения типа сайта.

Парсер Яндекс Кью
Яндекс.Кью - это сервис вопросов-ответов, запущенный в конце 2019 года. Он объединил в себе несколько других сервисов, поэтому уже на момент запуска обладал большой базой информации. Мы не могли оставить это просто так и публикуем парсер для сбора данных из этого сервиса.
https://files.a-parser.com/img/bvd7vsvdbs848sj.png

Парсинг сайтов из Яндекс.Радар
Яндекс.Радар - это сравнительно новый сервис Яндекса, который в отчасти заменил ранее популярный Яндекс.Каталог. Это большой каталог популярных в рунете сайтов с данными о их посещаемости и некоторой информацией о посетителях. Мы подготовили парсер, с помощью которого можно собрать список сайтов с необходимыми фильтрами.
https://files.a-parser.com/img/6j5q6_200204160703.png

Определение типа сайта по Яндекс Радару
И еще один парсер для Яндекс.Радар от нашего пользователя. С его помощью можно определять типы сайтов, если они есть в базе Яндекс.Радара.
https://files.a-parser.com/img/925f798dbf.jpg

Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Все сборники рецептов

https://files.a-parser.com/img/butto...small_1200.png

A-Parser Support 19.02.2020 10:37

Сборник статей #11: анализ содержимого картинок, добавление ссылок в индекс Google и поиск RSS лент

11-й сборник статей, в котором рассказано, как в А-Парсере анализировать содержимое картинок, добавлять страницы своих сайтов в индекс Google и искать RSS ленты необходимой тематики.

Фильтрация картинок по их содержимому
В этой статье на примере поиска картинок с определенным содержимым, показана работа с Google Vision. С помощью "компьютерного зрения" для каждого изображения присваивается набор меток, который описывает содержимое.
https://files.a-parser.com/img/bvh74g37fa.png

Инструкция по использованию Google Indexing API
В данной статье рассмотрена работа с Google Indexing API, который позволяет владельцам сайтов напрямую уведомлять Google о добавлении или удалении страниц. Таким образом ваш сайт будет быстрее просканирован Google, что способствует повышению качества трафика.
https://files.a-parser.com/img/3p4a3_200214180729.png

Поиск и сбор rss лент
В этой статье рассмотрен простой пример поиска ссылок на rss ленты по заданной тематике. Решение состоит из 3-х пресетов, каждый из которых отвечает за определенный этап работы.
https://files.a-parser.com/img/cbyuefeteg.png

Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Все сборники статей

https://files.a-parser.com/img/site/tg_chat_btn.png

A-Parser Support 02.03.2020 18:29

1.2.799 - новый парсер для поиска картинок, улучшения в существующих парсерах

https://files.a-parser.com/img/1.2.799.png

УлучшенияИсправления в связи с изменениями в выдачеИсправления
  • Исправлен выбор страны в SE::Yahoo
  • Исправлен баг с декодированием ссылок в SE::Google::Images
  • В режиме -newnode исправлены проблемы с кодировкой и оптимизировано потребление памяти

https://files.a-parser.com/img/site/tg_chat_btn.png

A-Parser Support 16.03.2020 14:28

Парсинг booking.com с помощью A-Parser

В этом видео уроке рассмотрен парсинг ресурса booking.com, получение результатов поиска квартир и отелей на сайте. Подробную информацию о них будем получать при помощи парсера https://a-parser.com/img/parsers/net-http.png Net::HTTP



В видео рассмотрено
  • Пользование разделом тестового парсинга
  • Переход по страницам пагинации
  • Проверка наличия определенного контента на странице сайта
  • Использование регулярных выражений
  • Применение конструктора результатов (декодирование HTML сущностей)
  • Применение шаблонизатора Template Toolkit в формате результата:
    • Использование инструмента $tools.CSVline
    • Циклическая обработка директивой FOREACH
    • Виртуальный метод .match
    • Фильтры: .remove, .collapse, .replace

Полезные ссылки
  • Net::HTTP -https://a-parser.com/wiki/net-http/
  • Тестовый парсинг - https://a-parser.com/wiki/test-parsing/
  • Template Toolkit - https://a-parser.com/wiki/template-toolkit/
  • tools.CSVline - https://a-parser.com/wiki/template-tools/#tools-csvline-%D0%BF%D1%80%D0%BE%D1%81%D1%82%D0%BE%D0%B5-%D1%81%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5-csv-%D1%84%D0%B0%D0%B9%D0%BB%D0%BE%D0%B2']https://a-parser.com/wiki/template-tools/#tools-csvline-простое-создание-csv-файлов
  • Готовый пресет: https://a-parser.com/resources/383/

Оставляйте комментарии и https://www.youtube.com/c/AParser_channel подписывайтесь на наш канал на YouTube!
https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ
https://files.a-parser.com/img/butto...small_1400.png

A-Parser Support 26.03.2020 11:59

Сборник рецептов #39: бот-опросник, парсер hotline.ua и copart.com

Представляем вашему вниманию 39-й сборник рецептов, в который вошли:
  • телеграмм бот опросник
  • парсер агрегатора цен hotline.ua
  • парсер аукционов транспортных средств copart.com

Телеграмм бот опросник
Данный бот позволяет организовать ежедневный опрос сотрудников, при этом список вопросов можно гибко менять. Все настройки берутся из Google таблицы, а также туда пишутся ответы по каждому сотруднику.
Также, этот пример демонстрирует возможность создания телеграмм бота на базе A-Parser и работу с Google таблицами.
www.youtube.com/watch?v=ypgj2T1axi0[/video]

Парсер hotline.ua
hotline.ua - это самый большой агрегатор цен в Украине. С его помощью можно мониторить и анализировать цены на товары у конкурентов или искать наиболее выгодные предложения среди большого количества интернет-магазинов.
https://files.a-parser.com/img/3my28_200325142307.png

Парсер copart.com
Copart является одним из крупнейших интернет аукционов, специализирующихся на продаже новых и б/у автомобилей. По официальной информации каждый день на аукционе выставляется на продажу более 150 000 транспортных средств.
https://files.a-parser.com/img/ehamm_200325190721.png

Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Все сборники рецептов

https://files.a-parser.com/img/butto...small_1400.png

A-Parser Support 07.04.2020 14:39

Видео урок: Именование файлов результатов

Мы начинаем публикацию серии коротких видеоуроков, каждый из которых будет посвящен какому-то одному функционалу.
И в этом уроке будут рассмотрены варианты формирования имени файла результата.



В видео рассмотрено:
  • Нумерация файла результата в соответствии с запросами
  • Нумерация файла результата + часть имени запроса
  • Именование файла результата по запросу, если запрос линк

Полезные ссылки:
  • Формат результата - https://a-parser.com/wiki/tips-v1-1-0/#Формат-результата
  • Шаблонизатор Template Toolkit - https://a-parser.com/wiki/template-toolkit
  • Метод replace - http://template-toolkit.ru/Manual/VMethods.html

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
https://files.a-parser.com/img/butto...small_1400.png

A-Parser Support 17.04.2020 12:27

1.2.852 - новый парсер для Google Keyword Planner, Native NodeJS, множество исправлений и улучшений

https://files.a-parser.com/img/1.2.852.png

Улучшения
● Добавлен парсер https://a-parser.com/img/parsers/se-...ordplanner.png SE::Google::KeywordPlanner
◦ собираются списки подсказок и варианты ключевых слов
◦ для каждого варианта парсится среднее кол-во запросов в месяц, конкуренция, объемы поиска, а также минимальная и максимальная ставки
◦ присутствует возможность указывать несколько ключевых слов в запросе
● В https://a-parser.com/img/parsers/se-yandex-byimage.png SE::Yandex::ByImage добавлена функция Get full links to page, которая позволяет получать реальные ссылки на страницы
● В https://a-parser.com/img/parsers/se-yandex-sqi.png SE::Yandex::SQI добавлены переменные сбор количества отзывов и оценок, а также рейтинга
● Улучшена проверка правильности разгадывания каптчи в парсерах Яндекса
● Автоматическое увеличение лимитов на ОС Linux
● Улучшена работа с регулярными выражениями
● При бане прокси в лог задания теперь выводится более детальная информация
● Native NodeJS переведена из стадии альфы в бету, проведено множество оптимизаций, за счет чего в большинстве сценариев это дает повышение максимальной скорости в 1.5-2 раза, а также уменьшение потребление памяти в 2-4 раза
◦ Начиная с 1.2.822 все бета версии имеют включенный Native NodeJS, стабильные версии выходят с включенным oldnode
● Native NodeJS: добавлена экспериментальная поддержка HTTP/2
● Native NodeJS: обновление Node.js до актуальной версии
● JS парсеры: добавлена опция allow_dangerous_node_modules, подробнее тут
Исправления в связи с изменениями в выдаче
● Исправлено скачивание каптчи в https://a-parser.com/img/parsers/se-yandex.png SE::Yandex
● Исправлен https://a-parser.com/img/parsers/rank-ahrefs.png Rank::Ahrefs: в $anchors переменная $bl заменена на $domains
● В https://a-parser.com/img/parsers/se-google.png SE::Google исправлены:
◦ парсинг mobile news
◦ баг с дублированием ссылок в выдаче
◦ парсинг анкоров в рекламе, связанных ключевых слов, а также первый результат в выдаче не всегда попадал в serp
● В https://a-parser.com/img/parsers/se-google-images.png SE::Google::Images исправлен парсинг gif
● Исправлен https://a-parser.com/img/parsers/se-yandex-byimage.png SE::Yandex::ByImage, убраны flat переменные $height и $width
https://a-parser.com/img/parsers/se-yandex.png SE::Yandex, SE::Google::ByImage, SE:: DuckDuckGo, Social::Instagram::Post, Rank::Ahrefs, Rank::Bukvarix:: Domain, SE::MailRu, SE::Yandex::Suggest
Исправления
● Исправлена работа https://a-parser.com/img/parsers/net-whois.png Net::Whois с доменами 3го уровня, а также улучшена проверка получаемого ответа
● Исправлена работа Extra query string в SE::Bing
● Исправлена работа Rank::SEMrush и Rank::SerpStat::Keyword при получении ответа без данных
● Исправлен баг с типами переменных
● Исправлена ошибка, при которой запросы ошибочно считались неудачными при постановке задания на паузу
● Исправлена работа Bypass Cloudflare
● Исправлен динамический лимит потоков
● Исправлена ошибка при использовании Request delay
● Исправлено предупреждение о превышении лимита в Поле запросов
● Исправлена работа $tools.task.id в имени файла результата
● JS парсеры: исправлены получение сессий и работа http2 (баг появился в одной из предыдущих версий)
● JS парсеры: исправлено определение кодировки страницы
● Native NodeJS: исправлено поведение при некоторых ошибках
● Native NodeJS: исправлена проблема при обновлении A-Parser на OS Windows
● Native NodeJS: исправлена работа save_to_file, а также еще ряд ошибок
● Native NodeJS: исправлена работа SOCKS5 с авторизацией
● Native NodeJS: исправлена подстановка данных после Конструктора запросов

https://files.a-parser.com/img/site/tg_chat_btn.png

A-Parser Support 27.04.2020 14:33

Сборник рецептов #40: посещаемость организаций, SSL сертификаты, ikea и анализ доменов

Представляем вашему вниманию 40-й сборник рецептов, в который вошли:
  • парсер данных о посещаемости организаций
  • парсер данных о SSL сертификатах
  • парсер товаров на ikea.com
  • комплексный пресет для анализа доменов по ряду характеристик
  • способ извлечения доменов из ссылок без фактического захода на страницу
Посещаемость в Google Maps
https://a-parser.com/resources/393/

В поисковой выдаче Google для определенных запросов отображается расширенный сниппет с информацией об организации из Google карт. В частности, обычно отображается информация о посещаемости в разрезе дней недели.
Представляем парсер, который собирает данные о посещаемости.
https://files.a-parser.com/img/4758fg8bfg84.png

Данные по SSL сертификату
https://a-parser.com/resources/391/

Данный парсер собирает информацию о SSL сертификате сайта. В качестве источника данных используется сторонний ресурс.
https://files.a-parser.com/img/dnr3e_200427125510.png

Парсер ikea.com
https://a-parser.com/resources/388/

Парсер данных из ikea.com, который позволяет собирать различную информацию о товарах. Согласно данным из Википедии, ikea - это одна из крупнейших в мире торговых сетей по продаже мебели и товаров для дома.
https://files.a-parser.com/img/fwrq2_200427130816.png

Кроме этого:
  • Получение доменов из ссылок без захода на страницу (https://a-parser.com/resources/390/)
  • Информация о сайте (домене) (https://a-parser.com/resources/392/)

Еще больше различных рецептов в нашем Каталоге!
https://a-parser.com/resources/

Предлагайте ваши идеи для новых парсеров здесь (https://a-parser.com/threads/3464/), лучшие будут реализованы и опубликованы.
Подписывайтесь на наш канал на Youtube (https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw) - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter (https://twitter.com/a_parser).

Все сборники рецептов
https://a-parser.com/search/39393729/?q=%D0%A1%D0%B1%D0%BE%D1%80%D0%BD%D0%B8%D0%BA+%D1% 80%D0%B5%D1%86%D0%B5%D0%BF%D1%82%D0%BE%D0%B2

https://files.a-parser.com/img/butto...small_1500.png
https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 08.05.2020 21:38

Видео урок: Сохранение результатов в несколько файлов используя переменные, массивы и условия - https://a-parser.com/threads/6139/

В этом видео уроке рассмотрены способы сохранения результатов в несколько файлов, используя переменные и массив, при определенных условиях.



В видео рассмотрено:
  • Вывод результатов в разные файлы с разными именами используя переменные
  • Вывод результатов для каждого файла отдельно по определенному условию
  • Вывод результатов для двух файлов с условием, используя массив
Полезные ссылки:
  • https://a-parser.com/wiki/template-toolkit/ - Шаблонизатор Template Toolkit
  • http://template-toolkit.ru/Manual/Directives.html#Uslovnaya_obrabotka - условная обработка (IF, UNLESS, ELSIF, ELSE)
  • http://template-toolkit.ru/Manual/Directives.html#Ciklicheskaya_obrabotka - циклическая обработка FOREACH
  • https://a-parser.com/wiki/task-tester/ - тестировщик заданий
Оставляйте комментарии и подписывайтесь на наш канал на YouTube! - https://www.youtube.com/c/AParser_channel

https://files.a-parser.com/img/butto...small_1500.png - https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 19.05.2020 00:47

Сборник рецептов #41: Google таблицы, отправка писем и авторизация с помощью puppeteer (https://a-parser.com/threads/6168/)

Представляем 41-й сборник рецептов, который полностью посвящен использованию различных Node.js модулей в A-Parser.
  • Работа с Google таблицами
  • Отправка писем из А-Парсера
  • Авторизация с помощью puppeteer
Сохранение результатов в Google SpreadSheets (https://a-parser.com/resources/397/)

Один из часто задаваемых вопросов в поддержке, это вопрос о возможности писать результаты прямо в Google Таблицы. Поэтому мы подготовили небольшой пример парсера, который демонстрирует такую возможность.

https://files.a-parser.com/img/bsdf6...34vfdatf54.png

Отправка почтовых писем (https://a-parser.com/resources/395/)

Еще одна возможность, о которой часто спрашивают наши пользователи - отправка писем. Такой функционал может быть использован для уведомлений о различных событиях в заданиях, в том числе о завершении их работы. Поэтому мы также подготовили пример, демонстрирующий отправку писем прямиком из А-Парсера.

https://files.a-parser.com/img/swlv0_200518110130.png

Авторизация на GitHub с использованием puppeteer (https://a-parser.com/resources/396/)

Еще один пример по заявкам наших пользователей, демонстрирующий загрузку страницы, авторизацию на ресурсе и простую навигацию.

https://files.a-parser.com/img/dasdt56567asd56s.png


Еще больше различных рецептов в нашем Каталоге (https://a-parser.com/resources/)!

Предлагайте ваши идеи для новых парсеров здесь (https://a-parser.com/threads/3464/), лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube (https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw) - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter (https://twitter.com/a_parser).

Все сборники рецептов (https://a-parser.com/search/22332632/?q=%D0%A1%D0%B1%D0%BE%D1%80%D0%BD%D0%B8%D0%BA+%D1% 80%D0%B5%D1%86%D0%B5%D0%BF%D1%82%D0%BE%D0%B2)

https://files.a-parser.com/img/butto...small_1500.png – https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 13.06.2020 06:46

1.2.912 - обновление NodeJS, повышение производительности, адаптация к изменениям в рекаптчах(https://a-parser.com/threads/6231/)

https://files.a-parser.com/img/1.2.912.png

Мы завершили переход на NodeJS в качестве основного движка для парсеров и представляем новую стабильную версию 1.2.912 с поддержкой NodeJS 14.2.0. Данное обновление сочетает в себе множество улучшений, включая повышение производительности, уменьшение потребления памяти, полностью новый сетевой стек, а также поддержку нативных NodeJS модулей, позволяющую использовать всю мощь каталога npmjs в A-Parser'е

Также в данное обновление включены изменения по работе с ReCaptcha2 в парсере Google, наша команда одна из первых нашла решение по обходу новой версии рекаптчи и протестировала его совместно с сервисом RuCaptcha, за что им отдельный респект. На данный момент корректный обход каптчи протестирован с RuCaptcha, Anti-Captcha, XEvil и CapMonster.

Помимо этого было произведено множество оптимизаций в ядре A-Parser'а, значительно увеличилась производительность при использовании большого числа заданий или больших списков прокси. Парсер https://a-parser.com/img/parsers/rank-cms.png Rank::CMS (https://a-parser.com/wiki/rank-cms/) был полностью переписан и стабилизирован, добавлена поддержка нового формата apps.json и поддержка пользовательских правил.

Улучшения
  • NodeJS обновлен до v14.2.0, v8 до 8.1
  • Добавлена поддержка параметра data-s в рекаптчах для https://a-parser.com/img/parsers/se-google.png SE::Google (https://a-parser.com/wiki/se-google/), также добавлена опция ReCaptcha2 pass proxy
  • Увеличен лимит потоков до 10000 для OS Windows
  • Значительно улучшена производительность при большом числе активных прокси и/или заданий, полностью переписан стек по работе с прокси, оптимизирована работа с большими списками
  • Добавлен новый парсер https://a-parser.com/img/parsers/rank-keysso.png Rank::KeysSo (https://a-parser.com/wiki/rank-keysso/)
  • Полностью переписаны на JS https://a-parser.com/img/parsers/se-yahoo-suggest.png SE::Yahoo::Suggest (https://a-parser.com/wiki/se-yahoo-suggest/), https://a-parser.com/img/parsers/rank-alexa-api.png Rank::Alexa::API (https://a-parser.com/wiki/rank-alexa-api/) и https://a-parser.com/img/parsers/rank-archive.png Rank::Archive (https://a-parser.com/wiki/rank-archive/)
  • Улучшена производительность при использовании регулярных выражений, а также улучшена совместимость
  • В https://a-parser.com/img/parsers/se-...ordplanner.png SE::Google::KeywordPlanner (https://a-parser.com/wiki/se-google-keywordplanner/) добавлено автоматическое получение токена
  • В https://a-parser.com/img/parsers/se-bing.png SE::Bing (https://a-parser.com/wiki/se-bing/) добавлена возможность парсить ссылки на кэшированные страницы, а также добавлена возможность парсить мобильную выдачу
  • В парсере https://a-parser.com/img/parsers/util-recaptcha2.png Util::ReCaptcha2 (https://a-parser.com/wiki/util-recaptcha2/) при выборе провайдера Capmonster или Xevil теперь необязательно указывать Provider url
  • В https://a-parser.com/img/parsers/se-google-trends.png SE::Google::Trends (https://a-parser.com/wiki/se-google-trends/) добавлена возможность указывать произвольный диапазон дат
  • В https://a-parser.com/img/parsers/rank-cms.png Rank::CMS (https://a-parser.com/wiki/rank-cms/) добавлен выбор движка регулярок и поддержка собственного файла с признаками
  • В https://a-parser.com/img/parsers/se-yandex-byimage.png SE::Yandex::ByImage (https://a-parser.com/wiki/se-yandex-byimage/) добавлена опция Don't scrape if no other sizes, которая позволяет отключить сбор результатов, если искомой картинки нет в других размерах
  • [NodeJS] Добавлена защита от бесконечных циклов и долгих регулярок
  • [NodeJS] Исправлена работа this.cookies.getAll()
  • [JS парсеры] Добавлена опция follow_meta_refresh для this.request
  • [JS парсеры] Добавлена опция bypass_cloudflare для this.request
  • [JS парсеры] Underscore заменен на Lodash
  • [JS парсеры] В логе добавлена пометка при вызове других парсеров
  • [JS парсеры] Использование предыдущего прокси после запроса к другому парсеру
  • [JS парсеры] Добавлен метод destroy()
Исправления в связи с изменениями в выдаче
  • Множество исправлений в https://a-parser.com/img/parsers/se-google.png SE::Google (https://a-parser.com/wiki/se-google/)
  • Исправлен https://a-parser.com/img/parsers/se-youtube.png SE::Youtube (https://a-parser.com/wiki/se-youtube/), в т.ч. парсинг по тегам
  • Исправлен сбор ссылок в Shop::eBay (https://a-parser.com/wiki/shop-ebay/)
  • Исправлен парсинг телефонов в Maps::Google (https://a-parser.com/wiki/maps-google/)
  • Исправлена работа с каптчами в SE::Yandex::ByImage (https://a-parser.com/wiki/se-yandex-byimage/)
  • В Rank::Social::Signal (https://a-parser.com/wiki/rank-social-signal/) удалена переменная $facebook_comment в связи с неактуальностью
  • SE::Startpage (https://a-parser.com/wiki/se-startpage/), Rank::Linkpad (https://a-parser.com/wiki/rank-linkpad/), Social::Instagram::post (https://a-parser.com/wiki/social-instagram-post/), SE::Yandex::Translate (https://a-parser.com/wiki/se-yandex-translate/)
Исправления
  • Исправлен баг, из-за которого игнорировался выбранный проксичекер
  • Исправлена работа функций Decode HTML entities и Extract domain в Конструкторе результатов
  • Исправлена проблема с определением кодировки
  • Исправлена ошибка использования $tools.query
  • Исправлен баг в Rank::MajesticSEO (https://a-parser.com/wiki/rank-majesticseo/) при котором использовались все попытки при отсутствии результатов
  • Исправлена работа http2
  • Исправлена ошибка, когда парсер падает из-за невозможности писать в alive.txt
  • Исправлено разгадывание каптч в SE::Yandex::Register (https://a-parser.com/wiki/se-yandex-register/) и Check::RosKomNadzor (https://a-parser.com/wiki/check-roskomnadzor/)
  • Исправлена разница в запросах, отправляемых через Net::HTTP (https://a-parser.com/wiki/net-http/) и JS
  • Исправлен баг в SE::Yahoo (https://a-parser.com/wiki/se-yahoo/)
  • Исправлены ошибки в Rank::CMS (https://a-parser.com/wiki/rank-cms/) при выборе приложения без категории
  • [NodeJS] Исправлен подсчет времени исполнения кода парсера
  • [JS парсеры] При пустом body не передавался заголовок content-length при post запросе
  • [JS парсеры] Исправлена работа CloudFlare bypass
  • [JS парсеры] Исправлена работа с сессиями
  • [JS парсеры] Исправлена работа с overrides для this.parser.request
  • [JS парсеры] Исправлена ошибка определения кодировки в JS парсерах

https://files.a-parser.com/img/site/tg_chat_btn.png – https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 24.06.2020 09:15

Сборник рецептов #42: поиск битых ссылок, сервисы статистики и коммерциализация запросов(https://a-parser.com/threads/6261/)

Представляем 42-й сборник рецептов, в котором собраны парсеры для определения наличия на сайте битых ссылок, сбора данных об используемых сервисах статистики и определения коммерциализации ключевых слов.

Парсер Ahrefs::BrokenLink (https://a-parser.com/resources/400/)
Ahrefs Broken Link Checker - это сервис, позволяющий определить наличие битых ссылок на сайте, а также некоторую другую полезную информацию.

https://files.a-parser.com/img/5xjrw_200622121851.png

Парсер builtwith.com (https://a-parser.com/resources/401/)
Этот парсер собирает данные об используемых на сайтах сервисах статистики с ресурса BuiltWith. С его помощью можно получить список id используемых сервисов статистики, а также список других сайтов, на которых используются эти же id.

https://files.a-parser.com/img/a-par...2_10.37.34.png

Определение коммерциализации запроса (https://a-parser.com/resources/399/)
Способ определения степени коммерциализации ключевых слов, основанный на анализе поисковой выдачи Яндекса. Оценивается количество вхождений определенного списка слов в анкорах и сниппетах ТОП10 выдачи.

https://files.a-parser.com/img/ZrJ0RK5UMpNLj2.png
Кроме этого:
  • Определение локации по координатам (https://a-parser.com/resources/398/)
Еще больше различных рецептов в нашем Каталоге (https://a-parser.com/resources/)!
Предлагайте ваши идеи для новых парсеров здесь (https://a-parser.com/threads/3464/), лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube (https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw) - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter (https://twitter.com/a_parser).

https://files.a-parser.com/img/site/tg_chat_btn.png – https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 08.07.2020 03:09

Видео урок: где смотреть переменные, скрытые переменные и какой результат они выводят (примеры)(https://a-parser.com/threads/6288/)

В этом видео рассмотрели где смотреть переменные, какие бывают скрытые переменные и какой результат они выводят на примерах.



Содержание видео:
00:20 - 1. Где смотреть какие у парсера есть переменные?
1:16 - 2. Какие бывают скрытые переменные ($query.*, $root и т.п.)?
1:22 - переменная root
2:08 - переменная root объект
3:14 - переменная query.orig
4:04 - переменная query.first
5:24 - переменная query.lvl
5:50 - переменная query.prev
6:20 - переменная query.num

Все возможные методы TT для работы с обьектами (http://www.template-toolkit.org/docs/manual/VMethods.html#section_Hash_Virtual_Methods)
Форматирование запросов (шаблоны) (https://a-parser.com/wiki/query-format/)

Оставляйте комментарии и подписывайтесь на наш канал на YouTube! (https://www.youtube.com/c/AParser_channel)

https://files.a-parser.com/img/site/tg_chat_btn.png – https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 17.07.2020 22:00

1.2.948 - новые парсеры SecurityTrails IP и Domain, поддержка доменных прокси, множество исправлений(https://a-parser.com/threads/6312/)

https://files.a-parser.com/img/fvvik_200716143725.png

Улучшения
  • Добавлен парсер https://a-parser.com/img/parsers/rank-moz.png Rank::MOZ (https://a-parser.com/wiki/rank-moz/).
    Собираемые данные: вся информация, содержащаяся на странице.
  • Добавлены парсеры https://a-parser.com/img/parsers/sec...ils-domain.png SecurityTrails::Domain (https://a-parser.com/wiki/securitytrails-domain/) и https://a-parser.com/img/parsers/securitytrails-ip.png SecurityTrails::IP (https://a-parser.com/wiki/securitytrails-ip/).
    Для работы парсеров необходимо указать пресет https://a-parser.com/img/parsers/util-recaptcha2.png Util::ReCaptcha2 (https://a-parser.com/wiki/util-recaptcha2/).
    • https://a-parser.com/img/parsers/securitytrails-ip.png SecurityTrails::IP (https://a-parser.com/wiki/securitytrails-ip/)
      В качестве запроса следует указывать ipv4 адрес.
      Собирает домены по IP и информацию о них.
    • https://a-parser.com/img/parsers/sec...ils-domain.png SecurityTrails::Domain (https://a-parser.com/wiki/securitytrails-domain/)
      В качестве запроса следует указывать домен, например a-parser.com.
      Собираемые данные:
      • Данные по DNS
      • Список технологий, используемых на сайте (движки и проч.)
      • Список открытых портов
      • Alexa rank
      • Страна
      • Хостер
      • Даты начала и окончания регистрации
      • Whois статус
      • Регистратор
      • Список исторических данных по DNS
      • Список субдоменов
  • Добавлена возможность отключать валидацию TLS сертификатов.
  • Добавлена поддержка доменных прокси.
Исправления в связи с изменениями в выдачеИсправления
  • Исправлена ошибка в алгоритме автовыбора домена в SE::Yandex (https://a-parser.com/wiki/se-yandex/).
  • Исправлена работа Rank::MajesticSEO (https://a-parser.com/wiki/rank-majesticseo/), SE::Bing::Translator (https://a-parser.com/wiki/se-bing-translator/).
  • Исправлена ошибка, если файл config.txt был сохранен в кодировке utf-8 с BOM (парсер некорректно читал файл).
  • Решена проблема с переопределениями опций в парсере HTML::LinkExtractor (https://a-parser.com/wiki/html-linkextractor/).
  • NodeJS: новые установленные модули теперь доступны до перезагрузки A-Parser'a.
  • Исправлено падение парсера при вызове метода getProxies.

https://files.a-parser.com/img/site/tg_chat_btn.png – https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

Accs4biz 03.08.2020 12:48

Подскажите, пожалуйста, есть ли возможность взять парсер на тест?

A-Parser Support 25.08.2020 18:29

Цитата:

Сообщение от Accs4biz (Сообщение 149180)
Подскажите, пожалуйста, есть ли возможность взять парсер на тест?

Есть демо версия - https://a-parser.com/pages/demo/

A-Parser Support 25.08.2020 18:31

Сборник статей #12: скорость работы парсеров, debug режим и работа с куками(https://a-parser.com/threads/6371/)

В 12-м сборнике статей рассказывается о принципах работы парсеров и факторах, влияющих на их скорость, показаны возможности debug режима в Тестовом парсинге по отладке запросов, а также на реальном примере разбирается работа с куками.

Скорость и принцип работы парсеров (https://a-parser.com/resources/404/)
В этой статье подробно рассказано об основном принципе работы парсеров и скорости их работы, а также рассмотрены основные факторы, влияющие на скорость парсинга.

https://files.a-parser.com/img/Staty...2_12.20.14.png

Использование Debug режима (https://a-parser.com/resources/405/)
В этой статье рассказывается об одном из методов отладки парсеров, а также об анализе получаемых данных - debug режиме в Тестовом парсинге. С его помощью можно прямо в парсере анализировать и экспериментировать с заголовками и изучать приходящие в ответ данные.

https://files.a-parser.com/img/A-Par...0_11.55.06.png

Работа с куками и заголовками на примере соглашения с правилами сайта auto.ru (https://a-parser.com/resources/406/)
А в этой статье на реальном примере показана работа с куками сайта: рассказано как определять необходимость передавать куки и как искать только необходимые для запроса куки. При этом показаны два варианта: простые запросы средствами А-Парсера и использование NodeJS модуля puppeteer.

https://files.a-parser.com/img/Fotog...5_12.07.40.png

Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки [img]styles/default/xenforo/clear.png[/img] ) - отписывайтесь здесь (https://a-parser.com/threads/3464/).

Подписывайтесь на наш канал на Youtube (http://www.youtube.com/c/AParser_channel) - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter (https://twitter.com/a_parser).

https://files.a-parser.com/img/site/tg_chat_btn.png – https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 13.09.2020 10:05

Видео урок: просмотр результатов парсинга, настройка прокси с авторизацией, опция Extra query string(https://a-parser.com/threads/6402/)

В этом видео уроке рассмотрены ответы на 3 часто задаваемых вопроса от новых пользователей А-Парсера


  • Где и как можно посмотреть результаты парсинга?
  • Как подключить прокси с авторизацией?
  • Extra query string, что это такое и как применять эту опцию?
В уроке рассмотрено:
  • Просмотр результатов парсинга 3-мя способами:
    • Способ первый. "Из очереди заданий, если задание на паузе".
    • Способ второй. "Из очереди заданий, если задание завершено".
    • Способ третий. "Забираем результат из папки results".
  • Подключение прокси с авторизацией.
  • Примеры использования опции Extra query string.
Полезные ссылки:
  • https://a-parser.com/resources/categories/14/ - сохранение результатов (каталог)
  • https://a-parser.com/resources/77/ - Сохранение результатов нескольких парсеров в разные папки
  • https://a-parser.com/resources/394/ - Сохранение результатов в несколько файлов используя переменные, массивы и условия (видео)
  • https://a-parser.com/resources/397/ - Сохранение результатов в Google SpreadSheets
  • https://a-parser.com/wiki/proxy/ - Настройка прокси
  • https://a-parser.com/wiki/settings-and-presets/ - Общие настройки для парсеров
Оставляйте комментарии и подписывайтесь на наш канал на YouTube! (https://www.youtube.com/c/AParser_channel)

https://files.a-parser.com/img/site/tg_chat_btn.png – https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 23.09.2020 09:35

Сборник рецептов #43: освобождающиеся домены, категории сайтов и парсинг PDF(https://a-parser.com/threads/6418/)

43-й сборник рецептов, в который вошли пресет для парсинга освобождающихся доменов, парсер категорий сайтов и пример сбора данных из PDF документов.

Аукцион доменов REG.RU (https://a-parser.com/resources/403/)

Пресет, позволяющий парсить домены с аукциона Reg.ru. В пресете реализована возможность указывать количество страниц пагинации и использовать фильтр по ключевому слову.

https://files.a-parser.com/img/A-Par...4_14.28.19.png

Определение категорий сайта (https://a-parser.com/resources/409/)

Парсер, собирающий категории сайтов из MegaIndex.

https://files.a-parser.com/img/ykthu_200922132737.png

Парсинг PDF (https://a-parser.com/resources/407/)

Пример парсинга данных из документов в формате PDF. Для работы используется Node.js модуль pdf-parse.

https://files.a-parser.com/img/PDF2Textcfsdfa.png

Кроме этого:
  • Парсер ссылок локаций для Social::Instagram::Geo (https://a-parser.com/resources/402/) - сбор ссылок на локации в Instagram
Еще больше различных рецептов в нашем Каталоге (https://a-parser.com/resources/)!

Предлагайте ваши идеи для новых парсеров здесь (https://a-parser.com/threads/3464/), лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube (https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw) - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

https://files.a-parser.com/img/site/tg_chat_btn.png – https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

A-Parser Support 24.10.2020 01:54

Сборник рецептов #44: категории сайтов от Cloudflare Radar, парсер Rozetka и kufar.by(https://a-parser.com/threads/6471/)

44-й сборник рецептов, в который вошли парсер, определяющий категории сайтов (используя сервис Cloudflare Radar), парсер Rozetka через API и парсер интернет-магазина kufar.by с проходом по списку результатов.

Парсер Cloudflare Radar (https://a-parser.com/resources/411/)

Парсер для сбора категорий сайтов из Cloudflare Radar

https://files.a-parser.com/img/g5spg_201021200450.png

Rozetka - получение данных по API (https://a-parser.com/resources/412/)

Парсер, собирающий данные о товарах на торговой площадке Rozetka через API.

https://files.a-parser.com/img/rozetkasd.jpg

Парсинг объявлений kufar.by (https://a-parser.com/resources/410/)

Парсер объявлений на сайте kufar.by с проходом по списку результатов. Собираются заголовки объявлений, цены, имена и телефоны авторов.

https://files.a-parser.com/img/A-Par...1_19.39.43.png

А также, обновлены следующие ресурсы:
  • Парсинг комментариев из Youtube (https://a-parser.com/resources/352/)
  • Парсер собирающий вопросы и ответы из выдачи Google (https://a-parser.com/resources/337/)
Еще больше различных рецептов в нашем Каталоге (https://a-parser.com/resources/)!
Предлагайте ваши идеи для новых парсеров здесь (https://a-parser.com/threads/3464/), лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube (https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw) - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter (https://twitter.com/a_parser).


https://files.a-parser.com/img/site/tg_chat_btn.png – https://telegram.me/joinchat/B52bKz_xVDH2GDiEU1MPsQ

EnotSka 13.11.2020 01:27

Очень годно, хотелось бы попробовать в деле:)

immediately 20.11.2020 23:34

Отличный парсер, советую всё супер. Так что можете смело покупать


Часовой пояс GMT +3, время: 01:44.

Powered by vBulletin® Version 3.8.6
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. Перевод: zCarot