Найти общий двоичный блок -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [3.133.12.172]

В разделе обсуждаются следующие темы:

1) Процесс разработки программного обеспечения.
2) Определение требований к программному обеспечению.
3) Составные части и процесс проектирования (см. Шаблоны проектирования).
4) Документирование программного продукта(проекта).
5) Руководство разработкой программного обеспечения.
6) Проектирование пользовательского интерфейса.
7) Контроль версий проекта (см. Управление версиями в Subversion, Стратегии использования svn).

Модераторы: ElcnU

Новое голосование

Найти общий двоичный блок

Славян

Сообщ. #1 , 24.04.13, 13:14

Master

Профиль · PM

Рейтинг (т): 135

Есть задача: даны два двоичных файла. Например (1,2,3,4,5,6,7,8,9) и (9,8,7,6,5,3,4,2,1).
Хочется найти наибольший общий блок(последовательность). В этом примере - (3,4).
Скажите, есть такая программа (адрес начала и длина) или проще написать самому?

deil	Сообщ. #2 , 26.04.13, 13:49
Master Профиль · PM Рейтинг (т): 49	Есть такой алгоритм в дискретном анализе - поиск наибольшей общей последовательности.

Славян	Сообщ. #3 , 08.05.13, 07:54
Master Профиль · PM Рейтинг (т): 135	Цитата deil @ 26.04.13, 13:49 Есть такой алгоритм в дискретном анализе - поиск наибольшей общей последовательности. Хорошо. А есть готовые решения (для файлов)? Или всё же придётся самому написать? ;-)

MBo	Сообщ. #4 , 08.05.13, 10:07
Master Профиль · PM Поощрения: 3 Dgm Рейтинг (т): 320	diff выводит различия. Возможно, общие места тоже умеет

Славян	Сообщ. #5 , 08.05.13, 12:36
Master Профиль · PM Рейтинг (т): 135	Цитата MBo @ 08.05.13, 10:07 diff выводит различия. Возможно, общие места тоже умеет Спасибки! Будем исследовать.

amk	Сообщ. #6 , 09.05.13, 14:15
Guru Профиль · PM Поощрения: 4 Dgm Рейтинг (т): 268	diff -U-1 file1 file2 Добавлено 09.05.13, 14:16 Но diff работает с текстовыми файлами

Славян	Сообщ. #7 , 10.05.13, 04:51
Master Профиль · PM Рейтинг (т): 135	Ага. Не то. Не работает, как хотелось.

deil	Сообщ. #8 , 13.05.13, 19:33
Master Профиль · PM Рейтинг (т): 49	Автор, ну алгоритм же реально простой. Вечерок почитать-осознать, другой вечерок - реализовать. Зачем тратить время на поиск того, что не нужно и априори на порядок сложнее?

Славян	Сообщ. #9 , 22.05.13, 00:44
Master Профиль · PM Рейтинг (т): 135	Увы, но других, более важных дел, на два вечера полно...

HardRock

Сообщ. #10 , 18.06.13, 06:21

Profi

Профиль · PM

Рейтинг (т): 61

Я писал программу для поиска общих бинарных последовательностей в файлах.

Дано на вход множество бинарных файлов (что внутри не важно), прога ищет общие последовательности байт в этих файлах размером от 4 до бесконечности. При этом смещение сигнатуры не имеет значение. Т.к. допустим в одном файле байты лежат в начале файла, во втором в середине, а в третем в конце. Прога их всех найдет.

Сообщение отредактировано: HardRock - 18.06.13, 06:23

Славян	Сообщ. #11 , 24.06.13, 15:15
Master Профиль · PM Рейтинг (т): 135	Цитата HardRock @ 18.06.13, 06:21 Я писал программу для поиска общих бинарных последовательностей в файлах. Вы ж чувствуете, что за этим следовать должно моё: а поделитесь оной программой, а!? ;-)

TRoman

Сообщ. #12 , 24.06.13, 19:53

Unregistered

Цитата Славян @ 24.04.13, 13:14

Есть задача: даны два двоичных файла. Например (1,2,3,4,5,6,7,8,9) и (9,8,7,6,5,3,4,2,1).
Хочется найти наибольший общий блок(последовательность). В этом примере - (3,4).

Если не секрет, какой практический смысл в этой задаче?

HardRock

Сообщ. #13 , 12.08.13, 07:22

Profi

Профиль · PM

Рейтинг (т): 61

Цитата Славян @ 24.06.13, 15:15

Поделиться исходным кодом к сожалению не могу, но направление движения озвучу:

"Анализ хэшей, полученных сдвигом на 1 байт по индексируемому буфферу (т.е. по файлу)"
Хэширование вполне подойдет CRC32.

Добавлено 12.08.13, 07:27

Цитата TRoman @ 24.06.13, 19:53

Цитата Славян @ 24.04.13, 13:14

Если не секрет, какой практический смысл в этой задаче?

В антивирусной индустрии эта задача стоит очень остро - нахождение сигнатуры, которая покрывала бы целые семейства малвары.
Собственно поэтому исходником и не поделюсь, не смотря на то что прога была написана "дома", и я там уже на работаю, но прога до сих пор используется в одной всем известной антивирусной компании.

Как пример "для чего это нужно" - по сигнатуре найденной этой прогой удалось задетектить большое семейство пакованой малвары в котором в файлах ни одного похожего байта, но прога нашла последовательность из 8 байт (видимо ключ пакера) по ней и задетектили =) Кроме этой 8 байтовой сигнатуры в файлах больше не было общих блоков. Файлы не эмулировались.

Сообщение отредактировано: HardRock - 12.08.13, 07:31

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0,0307 ] [ 15 queries used ] [ Generated: 24.04.24, 11:21 GMT ]