Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[3.145.15.205] |
|
Сообщ.
#1
,
|
|
|
Задача:
1. Написать скрипт, который будет парсить страницы Яндекс.Маркета и выдавать на выходе текстовый документ и csv файл с необходимыми данными. 2. Периодически изменять что-то в скрипте, чтобы он работал. (этот пункт связан с тем, что Яндекс периодически меняет структуру страниц или название стилей и скрипт будет ломаться. Ну это наверное будет за какую то дополнительную плату чиниться). Более конкретно: 1. В скрипт в поле ввода я вставляю урлы первых страниц различных производителей на Яндекс.Маркете. Например: http://market.yandex.ru/guru.xml?CMD=-RR=9,0,0,0-PF=1801946%2BEQ%2Bsel%2B1870359-VIS=20160-CAT_ID=107500-EXC=1-PG=10&hid=90594 http://market.yandex.ru/guru.xml?CMD=-RR=9,0,0,0-PF=1801946%2BEQ%2Bsel%2B1870439-VIS=20160-CAT_ID=107500-EXC=1-PG=10&hid=90594 http://market.yandex.ru/guru.xml?CMD=-RR=9,0,0,0-PF=1801946%2BEQ%2Bsel%2B15967872-VIS=20160-CAT_ID=107500-EXC=1-PG=10&hid=90594 http://market.yandex.ru/guru.xml?CMD=-RR=9,0,0,0-PF=1801946%2BEQ%2Bsel%2B1870803-VIS=20160-CAT_ID=107500-EXC=1-PG=10&hid=90594 2. Скрипт ходит по всем страницам производителей (от 1 и до последней для каждого производителя) и собирает данные по товарам. 3. На выходе я получаю: а) Текстовый файл с названием товаров. В виде: AEG AEG SN 81840 5I AEG SC 91840 6I BEKO BEKO MBC 51 BEKO CSK 25050 и т.д. б) CSV файл в котором будет название товара, минимальная цена, максимальная цена, описание AEG AEG SN 81840 5I; 24800; 35320; холодильник с морозильником, встраиваемый, общий объем 265 л, 2-камерный, электронное управление, габариты (ШxГxВ): 54x54.7x177.2 см, цвет: белый AEG SC 91840 6I; 27420; 35580; холодильник с морозильником, встраиваемый, общий объем 275 л, 2-камерный, количество компрессоров: 1, электронное управление, габариты (ШxГxВ): 54.9x54x176.9 см BEKO и т.д. Возможные сложности: 1. Яндекс очень не любит, когда его парсят и там может быть стоит защита (в том числе и джаваскриптовая, проверяющая поведенческие характеристики какие-то) Стоимость работы не знаю. Хотелось бы услышать от вас. Оплата - WMR, либо наличные в Москве. |