Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[18.117.165.66] |
|
Сообщ.
#1
,
|
|
|
Где можно найти нормальный html парсер, весь инет перерыл, нечего не нашол, mshtml не предлагать.
|
Сообщ.
#2
,
|
|
|
Как насчет TidyLib?
|
Сообщ.
#3
,
|
|
|
Цитата B.V. @ Как насчет TidyLib? Набрал в поисковике толково так и непонял где скачать, имеет ли исходный код он ? Мне нужен сам исходный код парсера, и желательно чтоб он хотябы имел парсить три элемента это ссылки <a href=>Имя</a>, картинки <img src=>, текст и его атрибуты цвет, шрифт текст<font сolor= size= name=>содержимое</font>. |
Сообщ.
#4
,
|
|
|
Цитата Transformer-V @ Набрал в поисковике толково так и непонял где скачать, имеет ли исходный код он ? ОМГ. Первая же ссылка: http://tidy.sourceforge.net/ тянуть с репозитория клиентом CVS (только не говори, что ты не знаешь, что такое система контроля версий) |
Сообщ.
#5
,
|
|
|
Цитата B.V. @ Цитата Transformer-V @ Набрал в поисковике толково так и непонял где скачать, имеет ли исходный код он ? ОМГ. Первая же ссылка: http://tidy.sourceforge.net/ тянуть с репозитория клиентом CVS (только не говори, что ты не знаешь, что такое система контроля версий) Спасибо конечно, но слишком тяжелый для разбора, есть по попроще ? |
Сообщ.
#6
,
|
|
|
Чем это он тяжел?! И "попроще" несовместимо с "нормальный". Ты определись, что тебе нужно
|
Сообщ.
#7
,
|
|
|
Цитата B.V. @ Чем это он тяжел?! И "попроще" несовместимо с "нормальный". Ты определись, что тебе нужно Я уже написал что мне нужно выше, но 15951 строчек кода это слишком много ради трех элементов да и сил потратить чтоб код разобрать чё к чему. |
Сообщ.
#8
,
|
|
|
Цитата Transformer-V @ Я уже написал что мне нужно выше, но 15951 строчек кода это слишком много ради трех элементов да и сил потратить чтоб код разобрать чё к чему. а ты думал, что кто-то уже написал небольшой нормальный парсер специально под твои цели? |
Сообщ.
#9
,
|
|
|
хм...в какой вид должен привести html парсер? могу набросать
|
Сообщ.
#10
,
|
|
|
Цитата Transformer-V @ Я уже написал что мне нужно выше, но 15951 строчек кода это слишком много ради трех элементов да и сил потратить чтоб код разобрать чё к чему. Для такой фигни можно обойтись регулярными выражениями: просто выдрать интересующие куски и все. |