Конкурс - алгоритм определения курильщика по кардиограмме. -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.216.238]

Модераторы: Rust

Новое голосование

Конкурс - алгоритм определения курильщика по кардиограмме.

ilyad555

Сообщ. #1 , 24.12.15, 15:23

Newbie

Профиль · PM

Рейтинг (ф): 0

Уважаемые участники сообщества.
Проект CardioQVARK проводит конкурс на разработку алгоритма определения курящего человека по его кардиограмме.
Призовой фонд конкурса - 500 000 руб.
Приглашаем всех заинтересованных принять участие
cardioqvark.ru/challenge/

shm	Сообщ. #2 , 24.12.15, 21:53
Master Профиль · PM Поощрения: 1 Dgm Рейтинг (ф): 89	А есть хоть какое-то теоретическое обоснование, что это вообще возможно?

ilyad555

Сообщ. #3 , 25.12.15, 07:16

Newbie

Профиль · PM

Рейтинг (ф): 0

Это правильный и хороший вопрос. Мы его нашим Конкурсом и задаем.
Набрав в поисковике "вариабельность сердечного ритма" (ВСР ну или HRV), можно увидеть сколько полезной и нужной информации содержится в кардиограмме человека. Мы хотим расширить исследования кардиосигнала, и попытаться обнаружить новые существенные маркеры или новые способы анализа ЭКГ человека.
Одна из наших задач - вести постоянное исследование данных, постоянно получаемых с помощью разработанного нами чехла-кардиографа, и увидеть как реальное состояние человека (возраст, болезни, физиологическое и эмоциональное состояние, наличие вредных или приобретенных привычек и их развитие во времени) может отражаться на известных или неизвестных производных от кардиосигнала.

MedEx

Сообщ. #4 , 25.12.15, 17:26

Senior Member

Профиль · PM

Рейтинг (ф): 6

Цитата shm @ 24.12.15, 21:53

невозможно.
На ЭКГ в момент когда человек не курит ничего необычного (кроме стандартных гипертензии, гипертрофии) ничего не будет. В момент курения гипертензия, стеноз и т.д. но никак не отличающиеся от такого же состояния некурящего пациента.

Besha

Сообщ. #5 , 25.12.15, 18:43

котэ

Профиль · PM

Поощрения: 6 Dgm

Рейтинг (ф): 334

А почему именно через ЭКГ решили, да и есть другие способы определить курящего человека, а если определять то уж точно не через ЭКГ, а как минимум через анализы, которые довольно точно покажут курит или нет :yes:

Сообщение отредактировано: Besha - 25.12.15, 18:44

shm

Сообщ. #6 , 25.12.15, 19:05

Master

Профиль · PM

Поощрения: 1 Dgm

Рейтинг (ф): 89

Цитата ilyad555 @ 25.12.15, 07:16

Мы его нашим Конкурсом и задаем.

Нет вы его не задаете. Если даже кто-то и напишет какой-то алгоритм, который разделит тестовую выборку с допустимой погрешностью, то это не будет означать, что это будет работать на практике. Тут нужна работа хороших кардиологов + математиков. Хотя я сильно сомневаюсь, что вообще будет выявлено хоть что-то.

Сообщение отредактировано: shm - 25.12.15, 19:06

ilyad555

Сообщ. #7 , 02.02.16, 12:57

Newbie

Профиль · PM

Рейтинг (ф): 0

Конкурс CardioQVARK подводит итоги января:
Зарегистрировано 58 заявок, в том числе командные.
Подано более 100 решений.
Лучший результат: чувствительность = 57,81%; специфичность = 65,05%
Рейтинг - http://cardioqvark.ru/challenge/
Конкурс продолжается - ждем новых участников!

K313	Сообщ. #8 , 02.02.16, 16:01
Full Member Профиль · PM Рейтинг (ф): 1	да пусть сперва хоть один кардиолог определит по ЭКГ курильщика и объяснит, как он это сделал. А уже потом программист напишет вам что надо.

Rust

Сообщ. #9 , 03.02.16, 06:49

Moderator

Профиль · PM

Поощрения: 2 Dgm

Рейтинг (ф): 159

Цитата ilyad555 @ 02.02.16, 12:57

Лучший результат: чувствительность = 57,81%; специфичность = 65,05%

Так то любой чукча с 50%-ной вероятностью определит по кардиограмме человек курильщик или нет, варианта то всего два - да и нет

Добавлено 03.02.16, 06:51
Судя по информации на сайте уже кто-то к 60% подобрался ))

ilyad555

Сообщ. #10 , 03.02.16, 07:49

Newbie

Профиль · PM

Рейтинг (ф): 0

Ни один кардиолог не определит по ЭКГ курильщика - помоему это очевидно. Мы и не пытаемся это доказывать или выяснять.
Давайте возьмем другую ситуацию. Есть 1000 человек которые курят, и 1000 человек которые не курят. Эти люди, примерно, одного возраста и имеют, примерно, один и тот же образ жизни.
Объединяет этих людей то, что они иногда думают о своем здоровье, умеют пользоваться интернетом (ну например http://www.who.int/mediacentre/factsheets/fs317/ru/ или http://www.treatment-abroad.ru/types/cardi...scular_diseases) и решили регулярно пользоваться кардиомонитором CardioQVARK, являющимся диагностическим прибором, который выдает ны выходе объективные медицинские показатели. За год (а нашему проекту уже более двух лет) мы получим большой массив снятых ЭКГ. За год состояние курильщиков явно не улучшиться. И мы захотели посмотреть - а нет ли прямых или производных маркеров в массиве сигналов ЭКГ, явно свидетельствующих об этом. Допускаем, что таких маркеров нет, а вдруг?. Вот такой получился ответ на Ваш вопрос.

Добавлено 03.02.16, 08:00
Чукча Чукче - рознь.
Нам нужен чукча, который не пальцем в небо.
Нам нужен чукча, котрый скажет, - "Судя по продолжительному утреннему кашлю, желтым пальцам и отсутствию тяги к белым женщинам - человек курит, однако".
Это он проанализировал некие объективные показатели, данные ему в ощущениях и сделал вывод.
Аналитик - однако.

С нас показатели - с Конкурсанов результат. Коммисия всех рассудит, призы вручит.

Rust

Сообщ. #11 , 04.02.16, 06:47

Moderator

Профиль · PM

Поощрения: 2 Dgm

Рейтинг (ф): 159

Цитата ilyad555 @ 03.02.16, 07:49

Вот такой получился ответ на Ваш вопрос.

Не обращайте внимания на стеб, народ любит тут языками поворочать, а конкурс интересный

Сам бросил курить три месяца назад и занялся спортом. Надеюсь бросил навсегда, пока даже не тянет.

ilyad555

Сообщ. #12 , 04.02.16, 08:05

Newbie

Профиль · PM

Рейтинг (ф): 0

Все нормально. На форумы обращаются не за манерностями, а за результатом.
Если бы я сам был бы не в теме, и прочитал условия этого Конкурса - однозначно назвал бы бредом и прошел мимо.
Но, есть и въедливые умники - вот они и молодцы. Таких, собственно и ждем - http://www.cardioqvark.ru/challenge/

Designer

Сообщ. #13 , 12.02.16, 22:44

Unregistered

Здоровье - личное дело каждого, так сказать свобода.
Хочешь курить - кури, хочешь пить - пей... лишь бы не мешал другим.(запахом, дурным поведением рвотой...)

Цитата

Сам бросил курить три месяца назад и занялся спортом

Хочешь брось и гордись этим.

Цитата

Но, есть и въедливые умники - вот они и молодцы.

Напрасно потраченное время. Здоровье курильщика никому не надо, даже самому курильщику.

Сообщение отредактировано: Designer - 12.02.16, 22:47

Step

Сообщ. #14 , 14.02.16, 07:51

Full Member

Профиль · PM

Рейтинг (ф): 1

Хм, незнаю как сигареты, но кофе к примеру можно классифицировать как стимулятор. Когда кофеман со стажем, можно попытаться выявлять моменты когда "хочется бахнуть кофейку" и момент когда он непосредственно его употребил - у человека меняется настроение и исходя из этого может меняться сердечный ритм. Но для этого нужно знать что это именно кофе, а не например секретарша, по которой субъект сохнет, поцеловала его в щечку, т.е. программа должно уметь видеть разницу между разными явлениями - кардиограмму придется потрошить по полной, а не только привязываясь к курению.

ilyad555

Сообщ. #15 , 10.03.16, 09:49

Newbie

Профиль · PM

Рейтинг (ф): 0

Итоги первого этапа конкурса CardioQVARK. Участниками стали 148 команд и индивидуальных конкурсантов, которые отправили 1738 решений. В итоговый рейтинг попали 72 участника. Первый этап соревнования завершен, и до 15 марта организатор принимает работы 10 лучших конкурсантов.

Представляем список организаций, чьи сотрудники сформировали команды для участия в Конкупсе (в скобках указывается количество членов команды, если цифры нет — это значит, что участвовал один человек):

Университеты: МГУ им. М. В. Ломоносова: Мех-мат, ВМК, Физический факультет (27), МФТИ (20), СПбГУ, МАМИ, МГТУ имени Н.Э. Баумана (3), НИУ ВШЭ (6), Казанский ГМУ, ПензГТУ (3), ВятГУ(2), ВлГУ, УГНТУ, САФУ им. М. В. Ломоносова, УГАТУ (2), LUT Финляндия, БГТУ им. В.Г.Шухова, Приокский государственный университет, Белорусский государственный университет (2), SMMS (NY) США (2), УрФУ, НИУ МЭИ, НИУ МИЭТ, ТГТУ, КНУ им. Т. Шевченко, ГрГУ им. Янки Купалы, ПГТУ, РГРТУ, ННГУ им.Лобачевского

Институты РАН: ИСА РАН, ВЦ РАН им. А. А. Дородницына (4), ИБХ РАН, ИММ УрО РАН им. Н.Н.Красовского, ИАП РАН, ИПУ РАН им. В. А. Трапезникова, СПИИРАН, ИМ СО РАН (2), ИППИ РАН(3)

Компании и организации: Яндекс (1) и Яндекс ШАД (2), Searchmetrics, COMODO, BBOXX Ltd, Cinimex, Softsystem, Rambler&Co, Ident, NetCracker Technology Corp, ЦГЭ, ВЕБРОБОТИКС, МЕТКОМБАНК, Baker Hughes, Luxoft, Сфит Лайф ФудСервис, Кировский научно-исследовательский институт гематологии и переливания крови

А вот как выглядит десятка лидеров, которым удалось создать алгоритмы, показавшие наилучшие показатели чувствительности и специфичности:
1. belavin - МФТИ. Первое решение: Se = 54,69%, Sp = 45,70%, Sum = 100,39%. Лучшее решение: Se = 60,94%, Sp = 78,57%, Sum = 139,51%.
2. djakonov - МГУ им. М. В. Ломоносова, ВЦ РАН им. А. А. Дородницына. Первое решение: Se = 39,06%, Sp = 46,24%, Sum = 85,30%. Лучшее решение: Se = 73,44%, Sp = 67,74%, Sum = 141,18%.
3. IRV - ВлГУ. Первое решение: Se = 57,81%, Sp = 53,76%, Sum = 111,57%. Лучшее решение: Se = 62,50%, Sp = 70,97%, Sum = 133,47%.
4. ibryukhanov - МГУ им. М. В. Ломоносова. Первое решение: Se = 54,69%, Sp = 59,14%, Sum = 113,83%. Лучшее решение: Se = 50,00%, Sp = 81,18%, Sum = 131,18%.
5. alex_dok - ВЦ РАН им. А. А. Дородницына. Первое решение: Se = 28,13%, Sp = 56,99%, Sum = 85,12%. Лучшее решение: Se = 59,38%, Sp = 66,67%, Sum = 126,04%.
6. eugtsa - МГИ НИТУ МИСИС. Первое решение: Se = 50,00%, Sp = 50,00%, Sum = 100,00%. Лучшее решение: Se = 60,94%, Sp = 63,98%, Sum = 124,92%.
7. potom20. Первое решение: Se = 64,06%, Sp = 31,72%, Sum = 95,78%. Лучшее решение: Se = 57,81%, Sp = 65,05%, Sum = 122,86%.
8. dubnov - ИСА РАН. Первое решение: Se = 89,06%, Sp = 14,52%, Sum = 103,58%. Лучшее решение: Se = 40,63%, Sp = 75,27%, Sum = 115,89%.
9. AlexSemenov - МФТИ. Первое решение: Se = 70,31%, Sp = 29,03%, Sum = 99,34%. Лучшее решение: Se = 39,06%, Sp = 75,81%, Sum = 114,87%.
10. leksotat - МГТУ имени Н.Э. Баумана. Первое решение: Se = 79,69%, Sp = 12,37%, Sum = 92,06%. Лучшее решение: Se = 42,19%, Sp = 72,58%, Sum = 114,77%.

Мы благодарны всем конкурсантам за серьезное отношение к решению поставленной задачи.

amk

Сообщ. #16 , 10.03.16, 16:10

Guru

Профиль · PM

Поощрения: 4 Dgm

Рейтинг (ф): 156

ilyad555, если хочешь похвастаться результатами, то неплохо было бы расшифровать цифры. Конкретно, что понимается здесь под чувствительностью и специфичностью, и с чего это они складываются.

А вообще, судя по цифрам, похоже, не самым плохим решением было бы принимать решение случайно. Подбросил монетку, орёл - курильщик, решка нет.

ilyad555

Сообщ. #17 , 11.03.16, 12:00

Newbie

Профиль · PM

Рейтинг (ф): 0

amk
Я просто информирую о ходе конкурса, ну и конечно привлекаю внимание к проекту.
Вы можете отнестись к результатам так, как к подрасыванию монеты.
Мы, зная крайнюю ограниченность нашей выборки, относимся по другому. Список конкурсантов нас удовлетворяет, даже более.
У нас есть данные. В недалеком будущем их будет очень много. Не хотим отказывать себе в удовольствии разобраться с ними. Мы предполагаем, что если по выборке в 100 измерений можно сделать вывод с такой точностью, то если будет по 100 измерений взятых с 1000 человек, эта точность приобретет уверенный характер. Для нас это означает только то, что разбираться с данными имеет смысл. И мы делаем все правильно. Конечно практического результата именно с этого конкурса не будет никаких. Зато мы лишний раз убедились, что можно заниматься легочными паталогиями, туберкулезом, ХОБЛ. Конкурс развернул нам горизонты в этом направлении. Будем двигаться дальше. Убежден - продолжем сотрудничество с рядом конкурсантов.

А подбрасывать монетку можно и дальше - дело интересное и многообещающее... Но это не к нам.

amk

Сообщ. #18 , 11.03.16, 15:41

Guru

Профиль · PM

Поощрения: 4 Dgm

Рейтинг (ф): 156

Да нет, именно к вам. Я написал о том, что не вижу существенных различий между работой программы и случайным выбором. Чем ты хотел привлечь внимание к проекту? Цифрами типа: "Программа определяет курильщик с 50% вероятностью"? Так чем это отличается от бросания монеты? Эти цифры хоть какую-нибудь значимость имеют?
Или ты названиями фирм решил похвастаться?

ilyad555

Сообщ. #19 , 12.03.16, 21:01

Newbie

Профиль · PM

Рейтинг (ф): 0

Мне кажется на все эти вопросы я ответил в предыдущем посте - можете перечитать.
Если Вы чего-либо не видите - это Ваше мнение. Мы до конца конкурса ничего не утверждаем. В настоящее время цифры для нас имеют большое значение. А цифры нам подсказывают, что даже на никаких данных мы можем уверенно уйти за 0,5. Значит будем копить данные и смотреть дальше.
В медицине постановка диагноза с 70% вероятностью - очень хороший результат. Хвастаюсь я только нашим проектом. А внимания этот проект заслуживает только за то, что призывает хоть немного задуматься каждого об отношении к своему здоровью. Не хочешь - не думай...
Я на первой страничке топика давал ссылку. Половина читателей этого форума уйдет от нас раньше времени и именно от болезней связанных с сердцем. Наш проект принесет реальную помощь на современном уровне. Ради этого мы разбираемся в куче данных, пытаемся улучшить алгоритмы и функционал прибора. И нам теперь что, после Ваших замечаний все бросить?
Мы подобные суждения слушаем уже больше двух лет. Не конструктивненько и несерьезно это.

Сообщение отредактировано: ilyad555 - 12.03.16, 21:09

amk

Сообщ. #20 , 13.03.16, 04:30

Guru

Профиль · PM

Поощрения: 4 Dgm

Рейтинг (ф): 156

Ну это ваше дело, какую вероятность считать достаточной.

Цитата ilyad555 @ 12.03.16, 21:01

В медицине постановка диагноза с 70% вероятностью - очень хороший результат

Вот поэтому я и не хожу к врачу. потому что вас такой низкий показатель вполне устраивает. У меня на работе, например, вероятность ошибки в 2% уже вызывает сомнения в качестве алгоритма. А если не дай боже, ошибка при каких-то входных данных (вероятность появления которых сама менее 1%) достигнет 10%, то вообще караул, "алгоритм никуда не годен". при том, что уже используемые алгоритмы процентах на 10 данных вообще никак не работают.
Постоянно сталкиваясь с такой паранойей, и сам, того и гляди, станешь параноиком.

ilyad555

Сообщ. #21 , 13.03.16, 08:26

Newbie

Профиль · PM

Рейтинг (ф): 0

уважаемый AMK,
насчет "не хожу к врачу" - это неправильно. Иногда следует ходить - можно многое предупредить на будующее. Я также судил о своем здоровье по собственным ощущениям, до попадания в больницу на реанемобиле. Там мне бысторо объяснили зачем надо ходить в больницу хотя бы несколько раз за 25 лет. По поводу 70% - это действительно хороший результат. Только из-за того, что любое заболевание и организм и их взаимодействие это чертовски многофакторная вещь.
Очевидно, что нам не нужен "чистый и надежный алгоритм определения курильщика". Мы хотим анализировать большой массив данных реальных пациентов и для этого мы ищем (специалистов) алгоритмы обработки данных. Мы надееемся извлечь из них существенную информацию об имеющихся паталогиях. Получиться - хорошо, значит у нашего комплекса появиться новый диагностический функционал. Не получиться - отсутствие результата, это тоже результат. Мы очень критически относимся к результатам наших исследований. В конечном итоге мы оказываемся в клинических условиях. А там все без мудростей, нейросеток, каглей, бустов и вейвлетов - или есть результат или нет. Все. Приговор системе или её функции дают специалисты. Если наши предложения будут носить теоретически-виртуальный характер, то их ценность также будет виртуальной. Так что паранойи у нас тоже достаточно).

foreach	Сообщ. #22 , 13.03.16, 08:43
Junior Профиль · PM	Цитата ilyad555 @ 12.03.16, 21:01 что даже на никаких данных мы можем уверенно уйти за 0,5. Любопытно, насколько далеко?

JoeUser

Сообщ. #23 , 13.03.16, 09:02

Unregistered

Цитата ilyad555 @ 11.03.16, 12:00

Я просто информирую о ходе конкурса

Бегло прочел условия конкурса, смутило два момента:

1) Откуда уверенность, что 100 вариантов кардиограмм - это достаточно? Бегло загуглил про заболевания сердца, список внушительный. Допустим возьмем некурящего, но больного человека. Пусть заболеваний 10, возьмем сочетания по 3, получаем 120 вариантов. Вы же для "некурящих" выделили только 50. Можете сказать, "мы же выбрали курящих без заболеваний, только с отклонениями". Тогда вопрос, как будете некурящих (но больных) отсеивать?

2) Анализируемый материал предоставлен в виде звуковых файлов с указанными параметрами. Вопрос: данные взяты и обработаны на одной и той же аппаратуре и алгоритмами? Если "нет", ничего не сказано о нормализации. Или это не важно? Я не медик, не знаю "ценность" величины амплитуд, но интересно.

Считаю, что сам вопрос конкурса, в принципе, интересен. Но с такой постановкой - это действительно "эксперименты с монеткой".

ilyad555

Сообщ. #24 , 14.03.16, 10:56

Newbie

Профиль · PM

Рейтинг (ф): 0

foreach
Это не к нам вопрос. Это мы как раз сами и спрашиваем ))

JoeUser
1) Для достоверных исследований недостаточно - даже не сомневайтесь. Плюс, как Вы правильно указываете, есть или могут быть другие болезни и патологии.
Но ведь мы с чего-то начинать должны? Мы перед конкурсом предварительно проверили данные, получили обнадеживающие результаты и после этого запустили конкурс на большую аудиторию.
Цель - найти толковых алгоритмистов и методы исследования больших, регулярно снятых ЭКГ от конкретных, описанных людей. Через год количество пользователей будет принципиально другим, база ЭКГ, соответственно тоже. А у нас, как мы надеемся, через год будет создана сложная, многоэтапная система анализа данных.
2) Амплитуды важны и спектр важен, мы стараемся мимнимально воздействовать на снятые показания в процессе обработки. Нормализация отсутствует.
3) Это как пробный шар для нас. Принципиальный вопрос следующий - получится или нет. А главные задачи впереди.

1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0,0884 ] [ 15 queries used ] [ Generated: 15.07.25, 00:57 GMT ]