На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: ALXR
  
    > Найти площадь квартиры
      Приветствую.

      Есть текст типа:
      Цитата
      Email 110 000 у.е. 2-комн/ 2-к квартира, низ пр. Кирова, новый дом, сдан в эксплуатацию в 2010, 12 этаж 25 этажного панельного дома, панорамные окна с видом на стадион, скоростные лифты, консьерж, ОСМД, выполнен дорогой ремонт по эксклюзивному проекту дизайнеров студии "Belle", общая площадь 68 м.кв., кухня 9 м.кв., спальня 14 м.кв., имеется отдельное меблированое помещение под гардероб, комната для стирки и сушки белья, МПО, итальянский кафель, встроенная кухня с техникой "Samsung", сплит-система "LG", мебель по индивидуальному проекту, мягкая мебель, телевизор "Samsung", холодильник "Samsung", стиральная машина, бойлер. Право собственности. Полностью готова к проживанию. Цена эквивалент 110 000 дол. США. Мебель и техника в стоимости! Тел:


      Не получается найти три числа, обозначенные красным.
      Очень хочется, чтобы получить три substring.

      Цитата
      \w+ (\d+) м\.кв\., \w+ (\d+) м\.кв\., \w+ (\d+) м\.кв\.,


      мне не совсем понятно, \w - это 1 символ или 1 слово?

      здесь написано, что \w - это слово
      http://regexpr.ru/cheatsheet/

      а здесь, что \w - это символ
      http://ru.wikipedia.org/wiki/%D0%A0%D0%B5%...%BD%D0%B8%D1%8F

      Это какие-то разные стандарты?


      Вот выражение:
      Цитата
      \w+ (\d+) м\.кв\.,
      , почему-то даже не находит площадь 68 м.кв.,

      Добавлено
      Я их по отдельности нашёл
      Цитата

      [А-я\w+,] общ(?:ая|ей) (?:[А-я]+)? (\d+) [А-я.]+
      [\w+,] (?:спальн[ия]|жилая) ?(?:[А-я ]+)?(\d+) [А-я.]+
      [\w+,] кухн[ия] ?(?:[А-я ]+)?(\d+) [А-я.]+


      непонятно, почему [А-я]+ приходится использовать \w+
        \w это символ, который может использоваться внутри слова (или идентификатора, не помню).
          \w тоже самое что и A-Za-z
          \d тоже самое что и 0-9
          \s тоже самое что и пробелы/табуляторы

          Добавлено
          ExpandedWrap disabled
            \d+\s+м\.кв\.
            проблема была в том, что нужно было поставить use utf8

            user posted image
              Цитата Sunny @
              \w тоже самое что и A-Za-z

              Точнее будет [A-Za-z0-9_] все символы, применяемые в идентификаторах в большинстве языков.
              0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
              0 пользователей:


              Рейтинг@Mail.ru
              [ Script execution time: 0,0216 ]   [ 15 queries used ]   [ Generated: 27.04.24, 20:25 GMT ]