Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[3.133.147.252] |
|
Сообщ.
#1
,
|
|
|
Приветствую.
Есть текст типа: Цитата Email 110 000 у.е. 2-комн/ 2-к квартира, низ пр. Кирова, новый дом, сдан в эксплуатацию в 2010, 12 этаж 25 этажного панельного дома, панорамные окна с видом на стадион, скоростные лифты, консьерж, ОСМД, выполнен дорогой ремонт по эксклюзивному проекту дизайнеров студии "Belle", общая площадь 68 м.кв., кухня 9 м.кв., спальня 14 м.кв., имеется отдельное меблированое помещение под гардероб, комната для стирки и сушки белья, МПО, итальянский кафель, встроенная кухня с техникой "Samsung", сплит-система "LG", мебель по индивидуальному проекту, мягкая мебель, телевизор "Samsung", холодильник "Samsung", стиральная машина, бойлер. Право собственности. Полностью готова к проживанию. Цена эквивалент 110 000 дол. США. Мебель и техника в стоимости! Тел: Не получается найти три числа, обозначенные красным. Очень хочется, чтобы получить три substring. Цитата \w+ (\d+) м\.кв\., \w+ (\d+) м\.кв\., \w+ (\d+) м\.кв\., мне не совсем понятно, \w - это 1 символ или 1 слово? здесь написано, что \w - это слово http://regexpr.ru/cheatsheet/ а здесь, что \w - это символ http://ru.wikipedia.org/wiki/%D0%A0%D0%B5%...%BD%D0%B8%D1%8F Это какие-то разные стандарты? Вот выражение: Цитата , почему-то даже не находит площадь 68 м.кв., \w+ (\d+) м\.кв\., Добавлено Я их по отдельности нашёл Цитата [А-я\w+,] общ(?:ая|ей) (?:[А-я]+)? (\d+) [А-я.]+ [\w+,] (?:спальн[ия]|жилая) ?(?:[А-я ]+)?(\d+) [А-я.]+ [\w+,] кухн[ия] ?(?:[А-я ]+)?(\d+) [А-я.]+ непонятно, почему [А-я]+ приходится использовать \w+ |
Сообщ.
#2
,
|
|
|
\w это символ, который может использоваться внутри слова (или идентификатора, не помню).
|
Сообщ.
#3
,
|
|
|
\w тоже самое что и A-Za-z
\d тоже самое что и 0-9 \s тоже самое что и пробелы/табуляторы Добавлено \d+\s+м\.кв\. |
Сообщ.
#4
,
|
|
|
проблема была в том, что нужно было поставить use utf8
|
Сообщ.
#5
,
|
|
|
Цитата Sunny @ \w тоже самое что и A-Za-z Точнее будет [A-Za-z0-9_] все символы, применяемые в идентификаторах в большинстве языков. |