Исследователи из Медицинского колледжа Бейлора опубликовали в журнале «Нейрон» данные, которые опровергают связь между повышенным уровнем вируса герпеса и болезнью Альцгеймера. Кроме того, исследователи предоставляют новую статистическую и вычислительную основу для анализа крупномасштабных последовательностей данных.
«Как и все виды деменции, болезнь Альцгеймера характеризуется массовой гибелью клеток головного мозга, нейронов. Выявление причины, по которой нейроны начинают и продолжают умирать в мозге пациентов с болезнью Альцгеймера, является активной областью исследований», — сказал автор исследования Чжандун Лю, адъюнкт-профессор педиатрии в Бэйлоре и Неврологическом научно-исследовательском институте им. Яна и Дэна Дункан в детской больнице Техаса.
Одна из теорий, которая получила распространение в прошлом году, заключается в том, что некоторые инфекции, например, вирусные, могут вызывать болезнь Альцгеймера. В исследовании 2018 года сообщалось о повышенных уровнях герпесвируса 6А человека (HHV-6A) и герпесвируса 7 человека (HHV-7) в посмертных тканях головного мозга более 1000 пациентов с болезнью Альцгеймера по сравнению с тканями головного мозга здоровых людей старшего возраста или тех, кто страдает от другого нейродегенеративного состояния.
Наличие повышенного уровня генетического материала вирусов герпеса указывало на активные инфекции, которые были связаны с болезнью Альцгеймера. Менее чем через год эта теория привела к началу нескольких исследований, чтобы лучше понять связь между вирусными инфекциями и болезнью Альцгеймера.
Удивительно, но когда соавтор доктор Хён-Хван Чжон, научный сотрудник в группе доктора Лю и другие, повторно проанализировали наборы данных исследования 2018 года, используя идентичные статистические методы со строгой фильтрацией, а также четыре широко используемых статистических инструмента, они не смогли получить такие же результаты.
Команда была мотивирована повторно проанализировать данные из предыдущего исследования, потому что они заметили, что в то время как значения p (статистический параметр, который предсказывает вероятность получения наблюдаемых результатов теста, предполагая, что другие условия верны) были очень значительными, их приписывали данным, в которых различия не были ощутимо заметны.
Более того, p-значения не соответствовали простой логистической регрессии — статистическому анализу, который предсказывает исход данных как одно из двух определенных состояний. Фактически, после нескольких типов тщательных статистических тестов, исследователи не обнаружили никакой связи между обилием вирусной ДНК или РНК герпеса и вероятностью болезни Альцгеймера в этой когорте.
«Поскольку высокопроизводительные технологии, включая технологии для геномики, протеомики, метаболомики и др., становятся возможными и легкодоступными, в базовых биомедицинских исследованиях наблюдается тенденция к „большим данным“. В этих ситуациях, учитывая огромные объемы данных, которые могут быть добыты и извлечены в короткие сроки, исследователи могут испытывать соблазн полагаться исключительно на p-значения для интерпретации результатов и получения выводов», — считает доктор Лю.
По мнению авторов, данное исследование подчеркивает одну из потенциальных ловушек чрезмерной зависимости от p-значений. Хотя p-значения являются очень ценным статистическим параметром, их нельзя использовать в качестве отдельной меры статистической корреляции — наборы данных из высокопроизводительных процедур все еще нужно тщательно отображать, чтобы визуализировать распространение данных. Наборы данных также должны использоваться в сочетании с точно рассчитанными значениями р, чтобы сделать ассоциации геном-болезнь статистически правильными и биологически значимыми. Цель авторов — создать инструменты и рекомендации для анализа больших данных, чтобы научное сообщество могло определить стратегии лечения, которые, вероятно, пойдут на пользу пациентам.