На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: ALXR
  
    > Универсальное регулярное выражение для поиска URL на странице
      Всем привет!

      Пишу свой поисковый робот. Столкнулся с такой проблемой: нужно достать всевозможные url-ы bp html. Решил делать регулярками. Почитал разобрался. Пока сделал так: ((https?|file|ftp)://)?(\w+.\w{0,4})?(:\d{0,5})?(/[\w/]+)?/?([\w.]+)?(\?[\w&=]+)? Оно работает, но иногда определяет неправильные урлы. Проблема в том, что регулярка вида (a)?|(b)?|©? кроме ab bc c b находит ac что нежелательно.

      Вопрос: есть ли универсальная регулярка для поиска URL в html, которая РАБОТАЕТ ВСЕГДА ПРАВИЛЬНО?
      Поиск в гугл ничего не дал.

      Заранее благодарен.
        Сам все сделал.
        0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
        0 пользователей:


        Рейтинг@Mail.ru
        [ Script execution time: 0,0143 ]   [ 15 queries used ]   [ Generated: 27.04.24, 14:25 GMT ]