Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[44.211.34.178] |
|
Сообщ.
#1
,
|
|
|
Не нашел на форуме раздела для новичков.
Не нашел на форуме раздела для обсуждения используемых при программировании программных инструментов. Поэтому после долгих размышлений "куда же запостить тему?" решил что это наиболее подходящий раздел. ------------ В этой теме я буду спрашивать про то, в каком софте реализованы те или иные фишки, позволяющие существенно ускорить и облегчить анализ и понимание чужого кода за счет соответствующего его отображения. 1) Какие программы умеют делать свёртку одинаковых (или похожих) кусков кода в макросы/шаблоны. Т.е. операции, обратные разворачиванию макросов (дефайнов) и шаблонов. Просто хотелось бы как-то радикально сокращать размер исходника. Это сделает его более обозримым и простым для изучения. Поясню это на самом простом примере (в реале все сложней). Есть штук 16 файлов. И в каждом из них присутствует фрагмент из 25 строчек: #include <assert.h> ... #include "rfdesitm.h" Хотелось бы чтобы программа просканировала все файлы проекта и заменила эти крупные куски кода на, к примеру, на "inc_files". Вы скажите: задача выеденного яйца не стоит. Юзай "поиск и замену". Или сложи все эти инклюды в один, и замени этот кусок на вызов этого инклюда. Но не все так просто. 1) Нужно чтобы сам исходный код не менялся. Менялось только его отображение в программе. 2) Поиском и заменой можно воспользоваться когда уже знаешь, какие куски повторяются. А если не знаешь? Хотелось бы чтобы программы сама, автоматом, их обнаруживала и предлагала заменить на более короткий дефайн. 3) Нужно чтобы имя дефайна было уникальным, чтобы не произошло коллизии с идентификаторами исходного кода. Т.е. программа должна автоматом проверять вводимые юзером имена дефайнов на уникальность. 4) Нужно искать не только одинаковые куски исходника, но и ПОХОЖИЕ. Которые могут свернуться в макровызовы с параметрами. 5) Чтобы наведя мышку на такой "дефайн" можно было в тултипе увидеть его исходный код, который он заменяет 6) Иногда два куска кода можно «привести к общему знаменателю» т.е. сделать одинаковыми, просто произведя соответствующие преобразования. К примеру, поменяв местами в одном из них строки или ещё что-нибудь. Нужно чтобы программа находила и такие КВАЗИ похожие куски и предлагала юзверю сделать соответствующие преобразования (повторяюсь: сам исходник при этом не должен меняться) или напротив, чтобы юзверь указал «здесь преобразования недопустимы, так как изменится логика работы программы» |
Сообщ.
#2
,
|
|
|
Исмаил Прокопенко
Такое будет подвластно только искусственному интеллекту. И то 2 или 3 поколения. |
Сообщ.
#3
,
|
|
|
Да ладно.
Найти одинаковые/похожие куски текста программа не может? Всякие матлабы/маткады (или как там называются программы для алгебры - забыл) умеют же сложнейшие уравнения и выражения решать/преобразовывать/сворачивать/разворачивать в символьном виде. Неужели для кода нет ничего подобного? В конце концов есть же IDA Pro Advanced для дизассемблирования машинного кода, которая может машинный код обратно в сишный код сворачивать Добавлено Кроме того, я слышал что есть инструменты, умеющие С++ код сворачивать в UML-диаграммы. Посоветуйте программульку для этого. Только не из гугла. А которую сами юсали и она Вам понравилась |
Сообщ.
#4
,
|
|
|
Исмаил Прокопенко
Может. Но проще от этого программа не станет. Тут стоит вспомнить подход гуманитариев. Для быстрого вникания в суть на первых курсах им дают очень большие списки книг которые они должны прочитать. Чем больше ваш словарный запас чем больше знаний тем проще вам ориентироваться. |
Сообщ.
#5
,
|
|
|
Цитата Pavia @ Может. Но проще от этого программа не станет. Почему же? Когда Вы скроете "детали реализации" и оставите одну "бизнес-логику" |
Сообщ.
#6
,
|
|
|
Цитата Исмаил Прокопенко @ Когда Вы скроете "детали реализации" и оставите одну "бизнес-логику" При свёртке число связей не изменяется поэтому проще система не становится. А чтобы разделить бизнес логику от не бизнеса нужен искусственный интеллект. Ибо что одного детали реализации для другого бизнес-логика. |
Сообщ.
#7
,
|
|
|
Цитата Pavia @ При свёртке число связей не изменяется Это почему же? Если часть связей оказываются внутри и поэтому не показываются? Добавлено Цитата Pavia @ А чтобы разделить бизнес логику от не бизнеса нужен искусственный интеллект. Давайте только без мистики. Окей? Это сугубо практическая тема. Нужно разобраться в большом чужом проекте. Как? Какие есть средства, чтобы упростить и ускорить это дело? |
Сообщ.
#8
,
|
|
|
Цитата Исмаил Прокопенко @ Это почему же? Потому что всё что можно было свернуть уже свернули программисты: - повторяющийся код вынесен в цикл - повторяющейся код вынесен в функции - повторяющиеся классы вынесены в шаблоны Цитата Исмаил Прокопенко @ Если часть связей оказываются внутри и поэтому не показываются? В теории хорошо. На практике либо вы получите нечитаемые идентификаторы. t1, t2.. t666,.., t9050 и тд Либо на основе тех же функций получим спагетти типа КамераКватеренонноеУмножениеПеремещениеУмножениеСложение(Matrix, offsetX, oofsetY, AlfaCvaterion,..) Да ещё с кучей параматеров. Цитата Это не мистика. Давайте только без мистики. Окей? Увы но пока что программы не научились отгадывать ваши мысли и знания. А поэтому скрыть от вас то что вы знаете они не могут. Добавлено Цитата Исмаил Прокопенко @ Как? Какие есть средства, чтобы упростить и ускорить это дело? Есть такая штука как она совсем забыл стоит на полке есть просит. Вспомнил книга называется. Вот больше читайте тогда больше будете знать быстрее будете ориентироваться. |
Сообщ.
#9
,
|
|
|
Не очень Вас понял.
Почему сворачивание в маленькие понятные макросы больших кусков кода плохо? К примеру чем плохо свернуть уже упоминавшийся выше повторяющийся во всех файлах кусок из 25-ти строк в маленький идентификатор "inc_files"? Ведь весь смысл этого большого куска описывается этим малюсеньким идентификатором. А кроме того, программисту не нужно будет напрягаться, чтобы понять, что эти большие куски кода ОДИНАКОВЫ, когда это будет ЯВНО задано идентификатором. С похожими кусками кода аналогично. Когда два больших фрагмента кода отличаются буквально совсем чуть чуть, ИМХО, разумно общую часть свернуть в точку (в один идентификатор) и оставить только эти различающиеся части. К примеру когда вместо двух больших фрагментов кода строк по 20 будет написано fir(as, +, xet) и fir(s, -, lt) Где fir - это ПОНЯТНЫЙ ВАМ (потому что он введен Вами) идентификатор назначения кода Ну а если Вы все же забыли что такое fir - наводите на него мышку и в тултипе видите его исходный код. Разве это неудобно? По сравнению с листанием огромных портянок похожего и повторяющегося кода? Т.е. как бы мы оставляем в отображении одну бизнес-логику, а детали реализации скрываем |
Сообщ.
#10
,
|
|
|
Цитата Почему сворачивание в маленькие понятные макросы больших кусков кода плохо? Неплохо. Просто таких участков менее 1%. Цитата Т.е. как бы мы оставляем в отображении одну бизнес-логику, а детали реализации скрываем Для этого есть UML диаграммы. В RAD это возможно, только он для проектирования заточен нежели чем для реверса. Говорят в платной версии VC Studia есть подобное. |
Сообщ.
#11
,
|
|
|
Сообщ.
#13
,
|
|
|
Вот записал как в RAD можно. По быстрому по функциям для Си++ тоже можно.
бесплатный хостинг картинок |
Сообщ.
#14
,
|
|
|
Впечатляет
Только я не очень понял, что Вы делали. Не могли бы пояснить словами |
Сообщ.
#15
,
|
|
|
Чо молчите?
|
Сообщ.
#16
,
|
|
|
Хз как с вашими плюсами, а для нормальных ( ) языков есть https://scrutinizer-ci.com/tour/measure-and...ve-code-quality
|
Сообщ.
#17
,
|
|
|
SerafimУх ты. Круть какая. Спасибо за сцылку. У мен как раз есть "legacy code bases" причем "very big" размера
А что-то я не нашел какие языки поддерживаются |
Сообщ.
#18
,
|
|
|
php, python, ruby, js
Исмаил Прокопенко, доки читать надо потому что: https://scrutinizer-ci.com/docs/ |
Сообщ.
#19
,
|
|
|
Нучо пацанва!
Ничего крутого не появилось в деле анализа, парсинга и ребёрсинга терабайт чужого кода? |
Сообщ.
#20
,
|
|
|
Цитата Pavia @ Вот записал как в RAD можно. По быстрому по функциям для Си++ тоже можно. бесплатный хостинг картинок Так что за софтина-та? |
Сообщ.
#21
,
Сообщение отклонено: negram -
|
Сообщ.
#22
,
Сообщение отклонено: Flex Ferrum -
|