Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[3.133.86.172] |
|
Сообщ.
#1
,
|
|
|
Всем привет!
Пишу свой поисковый робот. Столкнулся с такой проблемой: нужно достать всевозможные url-ы bp html. Решил делать регулярками. Почитал разобрался. Пока сделал так: ((https?|file|ftp)://)?(\w+.\w{0,4})?(:\d{0,5})?(/[\w/]+)?/?([\w.]+)?(\?[\w&=]+)? Оно работает, но иногда определяет неправильные урлы. Проблема в том, что регулярка вида (a)?|(b)?|©? кроме ab bc c b находит ac что нежелательно. Вопрос: есть ли универсальная регулярка для поиска URL в html, которая РАБОТАЕТ ВСЕГДА ПРАВИЛЬНО? Поиск в гугл ничего не дал. Заранее благодарен. |
Сообщ.
#2
,
|
|
|
Сам все сделал.
|