Datacol 5.54 [Nulled/Cracked] + плагины - универсальный парсер (100% рабочий)

biozz

Member
Joined
Jan 18, 2018
Messages
2,600
Reaction score
410
Age
40
1420531175_datacol.png


Datacol – это универсальный парсер для сбора различных данных в интернете. Datacol написан на C#. Программа может экспортировать данные в различные форматы: Excel, CSV и WordPress . .

Очень тонкая настройка различных опций в Datacol:
• Парсер контента по списку URL;
• Парсер выдачи поисковиков;
• Парсер SEO параметров сайтов с различных сервисов для их проверки;
• Парсер Яндекс Маркета;
• Парсер email;
• Чекер индексации сайтов;
• Парсер объявлений;
• Парсер интернет магазинов;
• Парсер внешних и/или внутренних ссылок с сайта;
• Парсер прокси адресов;
• Парсер, позволяющий проверять позицию сайта по определенным запросам в поисковике;
• Парсер музыки, парсер картинок и других всевозможных файлов;
• Парсер форумов на любых движках;
• Парсер результатов работы javascript.
• И МНОГОЕ ДРУГОЕ!!!
spoiler-plus.gif
Плагины Datacol:
Зачастую нашим покупателям не хватает базового функционала программы Datacol. В таких случаях для расширения возможностей программы на разных этапах работы можно прибегать к использованию плагинов. Плагин - это DLL файл, переопределяющий (или дополняющий) ту или иную функцию программы. Кроме основного DLL файла плагин обычно включает дополнительные DLL, папки с дополнительными файлами, а также конфигурационные файлы (обычно в формате TXT). Импорт плагинов в программу описан здесь.
Datacol5 поддерживает следующие типы плагинов парсинга:
- плагин обработки начальных URL;
- плагин загрузки страницы;
- плагин сбора диапазонов с данными;
- плагин сбора данных (или плагин обработки собранных данных);
- плагин загрузки файлов;
- плагин сбора ссылок;
- плагин обработки данных перед экспортом;
- плагин экспорта.
- плагин окончания процесса.

Datacol5 поддерживает следующие типы плагинов проксичекера:
- плагин загрузки источника;
- плагин парсинга прокси;
- плагин проверки прокси;
- плагин окончания процесса.

spoiler-plus.gif
Алгоритм работы программы:
При запуске кампании парсинга Очередь заполняется в соответствии с настройками, указанными на вкладке Стартовые URL. Также Очередь может заполняться URL из дампа Очереди, сохраненного при предыдущем парсинге. Что касается Истории, то она также может заполняться URL из дампа Истории, сохраненного при предыдущем парсинге. Далее потоки парсера начинают в параллельном режиме доставать URL из Очереди. В момент удаления URL из очереди (и соответственно поступления в обработку) происходит добавление этого URL в историю обработанных. Каждый URL обрабатывается по нижеописанному плану.
1. Проверка, подходит ли URL для сбора данных или для сбора ссылок. Проверка осуществляется в соответствии с настройками, заданными в блоке Сбор данных и Навигация.
2. Загрузка страницы URL, в результате чего мы получаем исходный код страницы.
3. Проверка, подходит ли код загруженной страницы для сбора данных или для сбора ссылок. Проверка осуществляется в соответствии с настройками, заданными в блоке Сбор данных и Навигация.
4. Если страница подходит для сбора данных (это проверялось ранее по ее URL и коду страницы), то на ней производится сбор данных в соответствии с настройками указанными в блоке Сбор данных.
5. Если страница подходит для сбора ссылок (это проверялось ранее по ее URL и коду страницы), то на ней производится сбор ссылок в соответствии с настройками указанными на вкладке Навигация -> Сбор ссылок. Собранные ссылки добавляются в Очередь. При этом игнорируются:
- ссылки, URL которых не соответствует НИ настройкам соответствия URL для сбора данных, НИ настройкам соотвтествия URL для сбора ссылок.
- ссылки, которые уже присутствют в Истории парсера.
6. Экспорт результатов сбора данных. В зависимости от настроек экспорта, результаты могут сохраняться в произвольный формат (обычно это CSV или TXT файл), Excel, Mysql, Wordpress или с помощью плагина экспорта.

1420537920_bezymyannyy.png


Datacol 5.54 + Плагины
 
Top