На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
  
    > HTML парсинг
      Где можно найти нормальный html парсер, весь инет перерыл, нечего не нашол, mshtml не предлагать.
        Как насчет TidyLib?
          Цитата B.V. @
          Как насчет TidyLib?

          Набрал в поисковике толково так и непонял где скачать, имеет ли исходный код он ?

          Мне нужен сам исходный код парсера, и желательно чтоб он хотябы имел парсить три элемента это ссылки <a href=>Имя</a>, картинки <img src=>, текст и его атрибуты цвет, шрифт текст<font сolor= size= name=>содержимое</font>.
          Сообщение отредактировано: Transformer-V -
            Цитата Transformer-V @
            Набрал в поисковике толково так и непонял где скачать, имеет ли исходный код он ?

            ОМГ.
            Первая же ссылка: http://tidy.sourceforge.net/ тянуть с репозитория клиентом CVS (только не говори, что ты не знаешь, что такое система контроля версий)
              Цитата B.V. @
              Цитата Transformer-V @
              Набрал в поисковике толково так и непонял где скачать, имеет ли исходный код он ?

              ОМГ.
              Первая же ссылка: http://tidy.sourceforge.net/ тянуть с репозитория клиентом CVS (только не говори, что ты не знаешь, что такое система контроля версий)

              Спасибо конечно, но слишком тяжелый для разбора, есть по попроще ?
                Чем это он тяжел?! И "попроще" несовместимо с "нормальный". Ты определись, что тебе нужно
                  Цитата B.V. @
                  Чем это он тяжел?! И "попроще" несовместимо с "нормальный". Ты определись, что тебе нужно

                  Я уже написал что мне нужно выше, но 15951 строчек кода это слишком много ради трех элементов да и сил потратить чтоб код разобрать чё к чему.
                  Сообщение отредактировано: Transformer-V -
                    Цитата Transformer-V @
                    Я уже написал что мне нужно выше, но 15951 строчек кода это слишком много ради трех элементов да и сил потратить чтоб код разобрать чё к чему.

                    а ты думал, что кто-то уже написал небольшой нормальный парсер специально под твои цели?
                      хм...в какой вид должен привести html парсер? могу набросать
                        Цитата Transformer-V @
                        Я уже написал что мне нужно выше, но 15951 строчек кода это слишком много ради трех элементов да и сил потратить чтоб код разобрать чё к чему.

                        Для такой фигни можно обойтись регулярными выражениями: просто выдрать интересующие куски и все.
                        0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                        0 пользователей:


                        Рейтинг@Mail.ru
                        [ Script execution time: 0,0257 ]   [ 16 queries used ]   [ Generated: 27.04.24, 21:47 GMT ]