Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[98.82.140.17] |
|
Сообщ.
#1
,
|
|
|
Уважаемый форум,
Существует такой ресурс: http://techlibrary.ru/ Там есть общий список публикаций. Задача: строчку разделить на подстроки: автор, название, год и т.д. Год выпуска я выделил: sed -r "s/([0-9]{4}\.djvu)/;\1;/g" blst.csv > glst.csv Хотелось бы выделить имена авторов и название книги. Или это совсем нетривиальная задача? Хотя бы намекните, в какую сторону копать. Анатолий |
Сообщ.
#2
,
|
|
|
Приведите, если не сложно, примеры строк для разбора.
|
Сообщ.
#3
,
|
|
|
Цитата Славян @ Приведите, если не сложно, примеры строк для разбора. Изначально: Абаимов С.Г. Статистическая физика сложных систем. От фракталов до скейлинг-поведения. 2012.djvu - 2477345 байт Абакумов В.Н., Перель В.И., Яссиевич И.Н. Безызлучательная рекомбинация в полупроводниках. 1997.djvu - 3211005 байт Абалакин В.К. Основы эфемеридной астрономии. 1979.djvu - 4946267 байт После применения sed -r "s/([0-9]{4}\.djvu)/;\1;/g" blst.csv > glst.csv Абаимов С.Г. Статистическая физика сложных систем. От фракталов до скейлинг-поведения. ;2012.djvu; - 2477345 байт Абакумов В.Н., Перель В.И., Яссиевич И.Н. Безызлучательная рекомбинация в полупроводниках. ;1997.djvu; - 3211005 байт Абалакин В.К. Основы эфемеридной астрономии. ;1979.djvu; - 4946267 байт Я попробовал sed -r "s/((^[А-Я][а-я]+\s([А-Я]\.){1,2})/\1;/g" plst.csv >qlst.csv C:\USERS>sed -r "s/((^[А-Я][а-я]+\s([А-Я]\.){1,2})/\1;/g" plst.csv 1>qlst.csv sed: -e expression #1, char 39: Unmatched ( or \( Да, у меня C:\USERS>sed --version GNU sed version 4.2 Copyright (C) 2003 Free Software Foundation, Inc. This is free software; see the source for copying conditions. There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE, to the extent permitted by law. |
Сообщ.
#4
,
|
|
|
Я не sed'ом пользовался, но вот такой поиск использовал:
([А-Яа-я]+)\s([А-Я][\.]\s|[А-Я][\.][А-Я][\.]\s)([А-Яа-я]+) \1 \2;\3 Абаимов Ш.Г. Статистическая физика сложных систем. От фракталов до скейлинг-поведения. 2012.djvu - 2477345 байт Абакумов П.Ц., Перель В.И., Яссиевич И.Н. Безызлучательная рекомбинация в полупроводниках. 1997.djvu - 3211005 байт Абалакин П.Д. Основы эфемеридной астрономии. 1979.djvu - 4946267 байт Кант И. Что-то про чистый разум. 1813.djvu - 2477345 байт Абаимов Ш.Г. ;Статистическая физика сложных систем. От фракталов до скейлинг-поведения. 2012.djvu - 2477345 байт Абакумов П.Ц., Перель В.И., Яссиевич И.Н. ;Безызлучательная рекомбинация в полупроводниках. 1997.djvu - 3211005 байт Абалакин П.Д. ;Основы эфемеридной астрономии. 1979.djvu - 4946267 байт Кант И. ;Что-то про чистый разум. 1813.djvu - 2477345 байт Надеюсь, переведёте к деталям своей системы?.. |
Сообщ.
#5
,
|
|
|
если "в лоб" можно попробовать так:
^((.+?)[А-Я]{1}[.])\s(.+?)\s(((19|20)[0-9]{2})\D+)\s-\s((\d+)\s\S+)$ |
Сообщ.
#6
,
|
|
|
Цитата Славян @ , спасибо, за помощь |
Сообщ.
#7
,
|
|
|
Цитата askrotov @ Пожалуйста. И вам спасибо, - я хоть что-то по регуляркам в голове своей освежил... спасибо, за помощь |