Обработка больших файлов -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [3.137.221.163]

Правила трёх "С"

Пожалуйста,
1. Соблюдайте правила Форума.
2. Слушайте советы Модераторов.
(например, http://forum.sources.ru/index.php?act=ST&f=7&t=80382 )
3. Сверяйтесь с учебником по Великому и Могучему

Новое голосование

Обработка больших файлов

JoeUser

Сообщ. #1 , 23.05.02, 08:49

Unregistered

Уважаемые господа!

Может быть кто подскажет как работать с большими файлами (порядка 20Gb). Обычные файловые функции не работают или работают но не так.

Меня устроит и С/C++, и Free Pascal, и Perl. Обработка файлов нужна под Линакс (ext3)

Пожалуйста, помогите!

P.S. В форуме C/C++ спрашивал - пока никто не ответил

bin

Сообщ. #2 , 20.06.02, 08:31

Profi

Профиль · PM

Рейтинг (т): 1

если включить
#define _LARGEFILE64_SOURCE 1
то loff_t должен стать 64 битным (т.е. long long), это даст возможность делать lseek64 за пределы 2G, это все справедливо для block devices, на простых файлах не пробовал.
Но это легко проверить до написания прог, надо глянуть драйверы ext3, и проверить размерность loff_t в реализации seek.

JoeUser

Сообщ. #3 , 20.06.02, 10:39

Unregistered

Цитата bin, 20.06.02, 12:31:34

Извиняюсь. Я уже нашел это и отписАл в форуме по Ц++

===

#define __USE_FILE_OFFSET64
#define __USE_LARGEFILE
#define __USE_LARGEFILE64

для хранения размеров, смещений и прчего использовать off_t

===

Все заработало. Теперь бэкапы скручиваются "на ура" в файл 23G

Tar так не может!

... или может?

lamo

Сообщ. #4 , 20.06.02, 12:24

Unregistered

лехко.

#!/usr/bin/perl

if ((scalar @ARGV) != 1)
{
print "use: mlogpars.pl file_mail_logs\n";
exit 1;
}

my $c_fn_mlog = $ARGV[0];
my @a_mlog;

open(F_ML, "$c_fn_mlog");
@a_mlog = <F_ML>;
close(F_ML);

my $i_cnt = 0;
my $i_old;
my (@a_buf, @a_buf1, $a_mlog, $c_date, $c_to_uid, $c_from_uid, $i_size, $i_msg_num);

$| = 1;

while ($i_cnt < scalar(@a_mlog))
{
$a_mlog = @a_mlog[$i_cnt];
$a_mlog =~ s/\r//g;
$a_mlog =~ s/\n//g;
@a_buf = split (/ +/, $a_mlog);

etc.
это часть парса логов.
лог был на сколько помнится гиг 30.
kernel 2.4.18.

JoeUser

Сообщ. #5 , 20.06.02, 13:34

Unregistered

Цитата lamo, 20.06.02, 16:24:15

Как-то подозрительно это все

У меня ядро 2.4.7-10 если не ошибаюсь. Я еще раз попробовал:

1) -f на файл в 23Gb возвращает 0
2) stat возвращает размер файла undef
3) на маленьких файлах - все как положено

так что легко??? и tar у тебя нормально на таких размерах пашет? Поверять нужно так - не на размер создаваемого таром файла смотри, а попробуй "достать" не битый файл.

Кстати, мене интереснее как ты сможешь сделать seek на гиг так 11-12? Покажи работающий перловый код.

И еще...Может чего в в ядре добавили за это время?
У тебя ядро то по-новее будет.

JoeUser

Сообщ. #6 , 20.06.02, 13:45

Unregistered

Цитата lamo, 20.06.02, 16:24:15

Стоп-стоп-стоп. >:( Ты "гонишь". 30Gb этот код не обработает... Я позволю себе коментарии расставить!

# взяли из командной строки имя обрабатываемого файла my $c_fn_mlog = $ARGV[0]; # определили массив my @a_mlog; # открыли файл для чтения (а проверять кто будет?) # правильнее было бы так: # # open(F_ML, "$c_fn_mlog") || die "Shit happiness!"; # # open(F_ML, "$c_fn_mlog"); # опаньки !!! загоняем построчно весь файл в 30G в память!!!!!!!!!! @a_mlog = <F_ML>; # типа хотим еще чего-то закрыть close(F_ML);

Какие 30G ???

lamo	Сообщ. #7 , 21.06.02, 09:40
Unregistered	опс. 23 мега. а с перепою показалось гиг )

lamo

Сообщ. #8 , 21.06.02, 09:43

Unregistered

про проверки ипроч ...
задача тривиальная и разовая.
писалось все на коленке с жесточайшего похмелья
за пять мин.
и сразу забылось )

а про 30 гиг - интересно.
правда никогда такой задачи не было.
4 гига было.
найду сырц - скину.

JoeUser

Сообщ. #9 , 21.06.02, 10:06

Unregistered

Цитата lamo, 21.06.02, 13:43:25

Я не говорю что проверки - нечто экзотическое. Эт-так, просто на файлах в 30G это спасает

от дополнительной головной боли в тяжкие времена похмелья. ;D ;D ;D

А вот если сырец найдешь - будет очень даже замечательно. Проблему-то я решил, но на Ц++. А вот если бы Перл'овкой все сделать ... Уважаю я Перл, а так досадно даже как-то ;D ;D ;D

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0,0263 ] [ 15 queries used ] [ Generated: 26.04.24, 09:52 GMT ]