Торшин И.Ю.1,2, Громова О.А.1,2, Кобалава Ж.Д.3
1 Федеральный исследовательский центр
«Информатика и управление» РАН (ФИЦ ИУ РАН)
2 Центр хранения и анализа больших данных,
ФГБОУ ВО «Московский государственный университет
имени М.В. Ломоносова»
3 ФГАОУ ВО «Российский университет дружбы народов»
Введение
«Британские ученые доказали, что падение с велосипеда есть следствие потери равновесия» I. Shah, «The Natives are Restless», Octagon Press, 1987.
В рамках парадигмы биомедицинских исследований, известной как «доказательная медицина» (англ. – evidence-based medicine) считается, что наиболее приемлемые способы терапии и профилактики могут быть установлены посредством стандартных статистических подходов к анализу данных клинических исследований и также посредством проведения метаанализов. В случае современных постгеномных исследований данные каждого из пациентов могут включать несколько миллионов разнородных признаковых описаний, в т. ч. однонуклеотидные полиморфизмы (англ. – SNP), профили транскриптома, метаболома и т. д. Столь большой объем персональных данных пациента делает стандартные статистические подходы полностью неприменимыми вследствие очевидных вычислительных трудностей и недостаточной проработанности этих подходов для анализа «больших данных» (англ. – “big data”). Поэтому современное понимание доказательности той или иной группы биомедицинских исследований должно учитывать эти особенности уже наступившей эры постгеномных исследований [1], в т. ч. крайнюю необходимость разработки и применения инновационных методов
интеллектуального анализа «больших данных» наряду с привлечением в область доказательной медицины специалистов по интеллектуальному анализу данных (англ. – data mining) [2].
Приводимые выше аргументы указывают на насущную необходимость проведения тотальной модернизации всего аналитического инструментария доказательной медицины. Тем не менее значительная пропорция имеющихся публикаций, маркированных как «доказательные» в реферативных базах данных, характеризуются регрессией к простейшим статистическим методам. Эти простейшие методы были, как правило, изобретены в конце 19-го века и абсолютизированы в 20-м веке. Были придуманы многочисленные вариации этих подходов наподобие грубых эмпирических оценок “I2”,
“Q”, так называемые “random effects meta-analysis” и др. Геномные данные пациентов, являющиеся основой персонализированной медицины [3], практически не используются в «доказательных» исследованиях. Например, среди 13952 публикаций в Cochrane Database Syst Rev только одна использует персонализированные данные генома [4]. Ни одна из 13952 кохрейновских публикаций не использует никаких новейших технологий анализа «больших данных» [5-9]. Сентимент-анализ текстов публикаций, позиционируемых как «доказательные», указывает на абнормально высокое
содержание в этих текстах манипулятивных конструкций английского языка (см. конкретные примеры далее в тексте статьи).
Последний факт, который отнюдь не ограничивается примерами, приводимыми в настоящей статье, позволяет говорить о захвате области доказательной медицины так называемыми «пиратами» (термин исследования [10]). Эти «пираты», зачастую, характеризуются полным отсутствием реальной клинической практики и, тем не менее, обладают существенным медийным ресурсом для навязывания своих произвольных мнений сотням тысяч реальных врачей во всем мире [11]. В рамках настоящей статьи мы называем таких «пиратов» адептами доказательной медицины.
Поэтому ряд ведущих аналитиков вполне обоснованно утверждают, что в настоящее время метаанализы по типу кохрейновских не являются сколько-нибудь доказательными хотя бы вследствие повсеместного использования устаревших и, более того, ошибочных методов анализа данных [5-7]. «Доказанность» того или иного подхода в диагностике или терапии, в принципе, не может быть основана только на значениях тех или иных статистических показателей и должна учитывать все уровни уже накопленной научной информации: физико-химические особенности структуры молекул
исследуемых препаратов, биохимические, экспериментальные, клинико-лабораторные и другие данные [6-9].
Перечисленные выше особенности текстов, публикуемых под видом «доказательных исследований», указывают на очевидный кризис в методологии подходов к анализу данных и в критериях качества, используемых при оценке доказательности той или иной терапии [12,13]. В рамках рассмотрения таксономии «отзыва» статей (англ. – “retraction”) и «аннуляции» кохрейновских публикаций (англ. – «withdrawn») [14] в настоящей статье мы детально рассмотрим одну такую публикацию, для которой характерны все упоминаемые выше «отличительные черты» [15]. Казалось бы, еще один метаанализ, ну что такого? Однако статья [15] позиционируется как новейшее «всестороннее» и «всеохватывающее» научное исследование кардиоваскулярной эффективности ω-3 ПНЖК («This is the most extensive systematic assessment of effects of omega-3 fats on cardiovascular health to date»). Что еще более важно, публикация [15] даже позиционируется как имеющая прямое отношение к постановлениям ВОЗ («this review was commissioned by WHO») [15].
Поэтому, если публикация [15] выполнена профессионалами в области кардиологии, объективно, прагматично и не противоречит здравому смыслу, то сотрудники ВОЗ, принимающие соответствующие решения, действительно должны ее рассмотреть.
Если же, наоборот, метаанализ [15] выполнен непрофессионально, содержит многочисленные «натяжки» и «подтяжки», которые полностью игнорируют элементарные знания из области клинической кардиологии и фармакологии, то эта публикация может нанести существенный вред общественному здравоохранению во всем мире, способствуя превращению общественного здравоохранения в «здравозахоронение» кардиоваскулярных пациентов, и вызовет многочисленные вопросы [16,17].
Общий разбор текста публикации [15]
Первичное впечатление от изучения текста работы [15] (743 страницы текста, 100 исходов, описания отдельных исследований, обширная библиография) достаточно обманчиво. Детальный анализ текста публикации показал, что данный текст [15] характеризуется обилием грубейших нарушений процедур анализа данных, оставляя в стороне весьма манипулятивную стилистику текста (см. далее результаты сентимент-анализов). В этом разделе мы рассмотрим девять наиболее заметных аномалий, характерных для кохрейновского текста [15]. В последующих разделах проведенные нами количественные и качественные аргументы будут представлены более детально.
Аномалия I. Отсутствие доступа к реальным данным (англ. «data set»). В тексте [15] скрывается методология проведения анализа и исходные данные, подвергшиеся обработке. Прежде всего, первичные данные (в виде таблиц Excel, Lotus или в ином рабочем формате) почему-то не представлены в публичном доступе, а на соответствующем интернет-сайте утверждается, что необходима «подписка для доступа к данным». Однако никаких реальных таблиц в рабочем формате так и не удалось загрузить даже при наличии «особой подписки». А ведь именно неограниченный доступ любого врача-исследователя к такого рода исходным данным необходим для сохранения кохрейновскими публикациями лидерства в области доказательности [18,19].
Аномалия II. Крайне низкая клиническая однородность включаемых в метаанализ исследований. В тексте публикации [15] не представлено сколько-нибудь обоснованных результатов стратификационного анализа. И это несмотря на то, что анализируемые исследования включают когорты пациентов с существенно различающимися заболеваниями. К примеру, из 36 публикаций, данные которых были использованы в попытке метаанализа общей смертности, ишемическая болезнь сердца (ИБС) и другие кардиоваскулярные заболевания изучались всего лишь в 23 работах (приводимые далее аббревиатуры исследований взяты из исходного текста [15]). Расшифровки этих аббревиатур и ссылки на соответствующие тексты указаны в списке литературы. Остальные 13 исследований не имели практически никакого отношения к кардиоваскулярной патологии. Так, в публикациях «Derosa 2016», «Risk & Prevention 2013» исследовались когорты участников с инсулинорезистентностью. В других работах анализировались пациенты со следующими заболеваниями и состояниями:
• удаленные колоректальные опухоли (DIPP 2015);
• дегенерация макулы или ретинитом (AREDS2 2014, NAT2 2013, Berson 2004);
• нейродегенеративные заболевания (ADCS 2010, Shinto 2014, Bates 1989) или деменция (MAPT 2017);
• болезнью Крона (EPIC-1 2008, EPIC-2 2008);
• остеоартритом (FOSTAR 2016) и т п.
Несмотря на заявления авторов о проведении некоторых неуточняемых «поправок» на указанные выше заболевания, длительность применения ω-3 ПНЖК, разновидности, ω-3 ПНЖК, курение, другие медикаменты и др. [15], в тексте [15] не приведено ни одного конкретного результата применения заявляемых поправок. В тексте можно только найти фразы наподобие «поправки не изменили значимость», которые просто повторяются как мантры, без указания значений каких бы то ни было статистических показателей. Иначе говоря, авторы формулируют, казалось бы, правильные принципы проведения метаанализов, но не считают необходимым придерживаться этих принципов при проведении собственного метаанализа.
Столь неразборчивое отношение к включению исследований в метаанализ поднимает более общий вопрос о том, а какими же формальными и неформальными критериями авторы публикации [15] пользовались для выбора исследований? Следует принимать во внимание то, что 30% биомедицинских исследований могут содержать «аномальные данные» (которые иногда даже приводят к расследованиям с участием полиции [20]) и то, что до 50% доказательных исследований содержат те или иные грубые ошибки анализа данных [9]. Поэтому критерии оценки исследований, которые включаются в метаанализ, не могут быть просто основаны на каких-то формальных признаках (например, то, что авторы исследования написали о рандомизации и т. п.). Такие критерии должны включать более тонкий экспертный анализ (сродни знаменитому «дедуктивному методу»), позволяющий выявлять истинное качество биомедицинских публикаций. По меньшей мере, должна проводиться клинически адекватная оценка неоднородности когорт участников с учетом возраста, соотношения полов, наличия коморбидных патологий и т. д. Если во включаемых в мета-анализ исследованиях процент мужчин варьирует в диапазоне от 31 до 100% и данный факт никак не учитывается при проведении метаанализа, то говорить о клинической однородности выборок не приходится.
Отметим еще одну особенность текста [15]: по заявлениям авторов, из 79 клинических исследований только 25 были отмечены как «исследования с низкой необъективностью» («low summary risk of bias», слово «bias» также переводится как «предвзятость», «дискриминация», «уклон», «пристрастность» [21]). Однако авторы то ли преднамеренно, то ли по глубокому невежеству скрывают тот простой факт, что эта самая «предвзятость» может проявляться не только в направлении получения позитивных результатов терапии, но и в направлении получения негативных результатов. Кохрейновские метаанализы, в т. ч. и публикация [15], практически никогда не представляют результаты «проверок на необъективность» в сторону негативного результата (по крайней мере, нам не удалось найти ни одного такого примера среди более чем 13 000 кохрейновских текстов). Примеры такого рода необъективных (если не сказать, ошибочных) публикаций, с очевидным «уклоном» в сторону негативного результата («OMEGA 2009», «ALPHAOMEGA – ALA 2010» и т. п.) были детально разобраны ранее [22].
Аномалия III. Не проведен анализ коморбидной патологии. Более того, сам вопрос о коморбидности сердечнососудистой патологии даже и не поднимался в публикации [15], уже не говоря о принятии их во внимание при проведении метаанализа. И это, несмотря на низкий уровень клинической однородности когорт пациентов, которые вошли в попытку проведения метаанализа в работе [15]: ИБС, рак, нефрит, СД2, ревматоидный артрит, рассеянный склероз, псориаз, язвенный колит, астма. Без учета проблемы коморбидных взаимодействий исследователи в области доказательности становятся подобны тому пресловутому ребенку, отделившему от мухи крылья, голову и туловище, а потом гадавшему – а куда же делась живая муха… Иначе говоря, анализ коморбидных ИБС-патологий позволяет учитывать фундаментальные причины патогенеза ИБС в исследуемых когортах пациентов [23].
Аномалия IV. Эффекты курения и других вредных привычек не анализировались. Помимо того, что курение является общеизвестным фактором риска кардиоваскулярных заболеваний, курение также является весьма важным фактором в исследованиях, вошедших в метаанализ [15]. В самом деле, заявленная доля курящих в каждом из исследований варьировала от 0 до 62% курильщиков (уже не говоря о различиях в таких количественных характеристиках курения как стаж, потребление пачек в год и др.).
Данный момент особенно странен и с той точки зрения, что многие из авторов разбираемого обзора [15] имели ранее публикации, указывающие на негативные последствия курения (см. ниже) и не могут не быть осведомлены о негативных последствиях курения для кардиоваскулярного здоровья.
Аномалия V. Авторами текста [15] не проведен адекватный анализ «спутывающих» (англ. – «confounding») переменных. Таковыми, зачастую, являются профили генетических вариаций участников. Ни авторы метаанализа [15], ни авторы отдельных публикаций не осуществляли так называемую «менделевскую рандомизацию», при которой пациенты распределяются по группам «терапия»/«плацебо» не по какой-то виртуальной «генерации случайной последовательности чисел», а по вариантам генетических полиморфизмов участников, то есть по их генетической конституции. Генетическая информация тесно взаимосвязана с этносом, группами неравновесного связывания (англ. – linkage disequilibrium), частотами нуклеотидных полиморфизмов, опосредующих взаимодействие между клиническими эффектами потребления микронутриентов, включая ω-3 ПНЖК [24]. Наиболее известный пример таких полиморфизмов – MTHFR677С/T, определяющий наличие у пациента термолабильной формы фермента метилтетрагидрофолатредуктазы, необходимого для синтеза биологически активных форм фолатов. Наличие у пациента варианта MTHFR677T снижает эффективность синтетической фолиевой кислоты [25] и делает необходимым применение тетрагидрофолата и других активных фолатов [26]. Несмотря на то, что аналогичные полиморфизмы известны для ω-3 ПНЖК, в тексте [15] таковые даже не упомянуты.
Еще одной важнейшей формой «спутывающих» переменных явлется фармацевтическая форма ω-3 ПНЖК (см. далее), поправки на которую даже не рассматривались в тексте публикации [15].
Аномалия VI. Чрезмерное акцентирование воображаемой важности «генерации последовательности случайных чисел». Авторы текста [15] уделяют гипертрофированное внимание упоминанию этого мелкого технического соображения в тексте той или иной публикации по оценке эффектов ω-3 ПНЖК, тем самым придавая этому ничтожному моменту статус чуть ли не основного критерия «качества» биомедицинского исследования. Простейший здравый смысл, однако, подсказывает, что просто «генерация случайных чисел» не может сама по себе сколько-нибудь повышать качество биомедицинских исследований. Что действительно важно для оценки качества, так это установление клинических важных и статистически достоверных различий в клинико-лабораторных описаниях пациентов в группах «терапия» и «плацебо» на день 0. Очевидно, что даже после генерации случайных чисел нельзя полностью исключить существование таких различий между группами, включенными в рандомизированное исследование. Поэтому такая «рандомизация» в полном смысле слова фиктивна и не имеет научной значимости. Если же в клинических описаниях двух групп на день 0 таких различий нет, то это действительно повышает качество выбора групп, без использования ритуалов вроде «случайной последовательности чисел». Заметим, что чрезмерное акцентирование этой мелкой технической детали осуществляется на фоне полного пренебрежения действительно важными клиническими описаниями групп (см. далее).
Аномалия VII. Неадекватная структура представления данных о пациентах. Представление клинических описаний в тексте [15] отличается характерными особенностями. Например, в описаниях индивидуальных исследований авторы перечисляют препараты, употребляемые, по крайней мере, 50% (или 20-49% и т. д.) участников в контрольной группе, но почему-то не в группе принимавших препараты ω-3 ПНЖК (дословно – «Medications taken by at least 50% of those in the control group»). Читатель метаанализа [15] должен, таким образом, либо использовать метод дедукции, либо быть телепатом, либо поднимать текст каждого из исследований, вошедших в метаанализ и вручную проверять этот текст (то есть проводить метаанализ заново, что полностью обнуляет ценность
публикации [15]). Эта деталь, заметим, находится в соответствии с предвзятым отношением авторов к вопросу о клинической эффективности ω-3 ПНЖК (см. следующий раздел).
Аномалия VIII. Игнорирование различий между фармацевтическими формами ω-3 ПНЖК. Количество ошибок авторов текста [15] касательно данного вопроса настолько велико, что рассмотрение этого вопроса вынесено в особый раздел настоящей статьи. Вкратце, авторы текста [15] не делают никаких различий между высокоочищенными эфирами ω-3 ПНЖК (90% и более) и, по какой-то причине, неизвестной современной науке, данная фармацевтическая форма называется «рыбьим жиром» (“fish oil”), который, вообще говоря, не подразумевает практически никакой стандартизации состава.
Подобное словоупотребление является еще одним косвенным доказательством неадекватности химического и фармакологического образования отдельных адептов доказательности. Считая за «вмешательство» (англ. – intervention): и «капсулы» с т. н. «рыбьим жиром», стандартизированные ω-3 ПНЖК, и даже назначение каких-то неуточняемых «диетологических рекомендаций» (наподобие «употребление жареной рыбы») авторы текста [15], по сути дела, подменяют объект исследования.
Аномалия IX. Использование словесных формулировок, носящих явно манипулятивный характер. Данное утверждение подтверждается результатами сентимент-анализа, приведенными в следующем разделе. К примеру, составители текста [15] заявляют, что взяли в метаанализ 79 исследований, включивших «взрослых пациентов с разнообразным риском кардиоваскулярной патологии» (дословно “adults at varying cardiovascular risk”). Столь изощренная конструкция попросту затеняет тот факт, что более чем 50% исследований, включенных попытку метаанализа, представленную в тексте [15], вообще не имели ничего общего с кардиоваскулярными заболеваниями (как упоминалось ранее, включены когорты пациентов после резекции опухолей ЖКТ, пациентов с нейродегенеративной патологией и др.).
Авторы текста [15] также не скрывают свое субъективное отношение к кардиоваскулярной профилактике на основе ω-3 ПНЖК.
Вывод о предвзятости авторов статьи [15] к ω-3 ПНЖК подтверждается анализом встречаемости ключевых слов (см. далее).
Кроме того, авторы текста [15] указывают организацию, пропагандирующую исключение ω-3 ПНЖК из всех протоколов лечения, как источник своего финансирования (см. следующий раздел) в целом, а не метаанализа [27]. Поэтому возникает закономерный вопрос – а кто же эти выдающиеся «исследователи», которые провели обсуждаемый метаанализ?
О других публикациях авторов метаанализа, о конфликте интересов и об отношении авторов к проблеме применения ω-3 ПНЖК в кардиоваскулярной медицине: разбор полетов «сбитых летчиков» Начальник сказал своей английской секретарше: «Мы довольны Вашей работой, но у Вас много опечаток. Вы не могли бы смотреть в словарь, если сомневаетесь?».
Секретарша: «К сожалению, это не сработает. Я никогда не сомневаюсь!».
I. Shah, “Darkest England”, Octagon Press, 1987.
Как авторы метаанализа [15] приводятся следующие действующие лица: “Abdelhamid AS, Brown TJ, Brainard JS, Biswas P, Thorpe GC,Moore HJ, Deane KHO, AlAbdulghafoor FK, Summerbell CD, Worthington HV, Song F, Hooper L” [15]. Краткая характеристика других публикаций авторов метаанализа [15] приведена в таблице 1 и рассмотрена ниже. Характеризация профиля профессиональной деятельности авторов производилась путем загрузки всех публикаций автора из базы данных PUBMED и вычисления информативных ключевых слов [28] по современной технологии интеллектуального анализа данных – комбинаторной теории разрешимости [29].
Анализ наиболее информативных ключевых слов публикаций авторов текста [15] (см. табл. 1) позволяет сделать несколько важных выводов об их специализации и уровне профессиональной пригодности.
Во-первых, важно отметить, что практически все авторы, так или иначе, ассоциированы с со значительными числом публикаций в журнале «Coсhrane database system reviews» (297 статей). Во-вторых, каждый из авторов характеризуется весьма узкой специализацией, а именно составлением систематических анализов в областях, далеких от кардиологии (общественное здравоохранение, медицинское обслуживание, общественное питание, болезнь Паркинсона, гигиена полости рта).
В-третьих, применение вычислительного сентимент-анализа (то есть автоматизированной оценки тональности текстов метрическими методами искусственного интеллекта [29, 30]) к 297 текстам (объединение всех статей в таблице 1) указал на достоверные отличия в модальности авторских текстов при сравнении с контролем. В качестве контроля использовалась случайная выборка текстов, написанных другими авторами на ту же тематику (см. ключевые слова в таблице 1). Для выборки из 297 текстов авторов [15] было установлено абнормально частое использование манипулятивных языковых конструкций (англ. – «spin words» [30], наподобие «relatively», «global policy», «slightly», «critically» и т. п.), языковых конструкций, указывающих на отрицательные результаты проведенных исследований («were no significant», «were no effect», «no statistically significant» и др.), конструкций, характерных для пропагандистских выступлений («each other», «at least», «was likely to», «you can», «and so on», «we should» и т. п.), и конструкций, отражающих негативные сентименты, то есть резко отрицательное эмоциальное отношение пишуших («lack of interest», «there was poor», «poorly made» и др.).
В-четвертых, детальное рассмотрение 297 работ заставляет еще и еще вспомнить цитату проф. Иоаннидиса о существенной уязвимости современной концепции доказательности к справедливой критике, указывающей на отражение так называемыми доказательными исследованиями не физической реальности, а латентного консенсуса в некоторой части общества (попросту, догм, принимаемых «на веру») [6,9]. В самом деле, если основной вывод доказательного исследования формулируется наподобие «физические упражнения полезны для детей дошкольного возраста, но и выполнимость связана с состоянием погоды» [31], или «снижение приема жирной пищи ассоциировано со статистически достоверным снижением веса» [32], или «физкультура полезна для повышения контроля уровней глюкозы в крови при СД2» [33], или «легко деформируемые бутылочки с присоединенной соской более легко использовать, чем жесткие бутылки» [34]), то вопрос о практическом значении таких «доказательных исследований» следовало бы рассматривать до их публикации…
Неспособность тех или иных адептов доказательной медицины смотреть на действие лекарств и других терапевтических воздействий с любой другой точки зрения, кроме неадекватно применяемой формальной статистики, неизбежно приводит к ложным выводам, которые противоречат не только значительному массиву реальных исследовательских данных, но и простому здравому смыслу практического врача. К примеру, в публикации определенного автора текста [15] витиевато утверждается, что «пока еще данных недостаточно, чтобы можно было полностью отвергнуть клиническую эффективность понижения пищевого потребления хлорида натрия на кардиоваскулярную заболеваемость и смертность» [35]. Другая подгруппа авторов текста [15] утверждает, что повышенное потребление омега-6 ПНЖК (которые, как известно, стимулируют хроническое воспаление [36]), соответствует снижению кардиоваскулярного риска [37]. При этом авторы даже не потрудились рассмотреть весь комплекс экспериментальных и клинических исследований омега-6 ПНЖК (более 20000 статей), а просто взяли данные из семи случайно выбранных статей и посчитали отношение шансов, даже не обращая внимания на значения 95% достоверного интервала [37].
О качестве «доказательности» авторов текста [15] свидетельствует и то, что девять кохрейновских метаанализов (пять из которых были опубликованы сравнительно недавно, в 2015-2018 гг.) были исключены или аннулированы («WITHDRAWN») из числа кохрейновских обзоров (по всей видимости, в связи с невозможностью оставлять такие «исследования» в публичном доступе).
Из девяти аннулированных текстов пять метаанализов был проведены в рамках специализации авторов – гигиена полости рта [38-42], также, из Cochrane Database Syst Rev были исключены метаанализы по профилактике СД2 [43], кардиоваскулярным эффектам хлорида натрия [44], влияния ожирения на гипертензию [45], влияния потребления жиров на ожирение [46]. Важно подчеркнуть, что коллектив индивидуумов, написавших текст [15], a priori был настроен агрессивно по отношению к вопросам кардиоваскулярной профилактики с использованием ω-3 ПНЖК (о чем свидетельствуют тексты, опубликованные отдельными членами авторского коллектива [15] c 2004 г.) [47, 48].
Не менее важно отметить и то, что в качестве одного из спонсоров публикации текста [15] выступает английский институт под названием «Национальный институт исследований здоровья (NIHR)», находящийся в тесной кооперации с британской общественной организацией под названием «Национальный институт здоровья и совершенствования клинического обслуживания (National Institute for Health and Care Excellence, NICE)». NICE выражает резко негативную позицию по вопросу клинических применений ω-3 ПНЖК, утверждая, что «ω-3 ПНЖК не должны рекомендоваться для кардиоваскулярной профилактики» [15]. Очень интересно! Еще раз подтверждается цитируемое выше соображение о «доказательной медицине» в ее современном состоянии, как еще одном способе получения желаемого результата или же того, что и так было давно известно. Поскольку все авторы текста [15] очевидным образом живут и работают в Великобритании, то они должны быть весьма заинтересованы в выполнении директив организации, разрабатывающей национальные рекомендации для этой страны.
Итак, представленные результаты аналитического обзора других публикаций авторов текста [15] указывают на несколько важных выводов:
• Рассматриваемый коллектив авторов специализирует свою публикационную активность вне кардиологии (см. табл. 1), от общественного питания до стоматологической гигиены;
• Один из авторов (Worthington H.) – координирующий редактор кохрейновского раздела по гигиене рта (Cochrane Oral Health) – является соавтором пяти аннулированных (ретрагированных) метаанализов;
• Среди авторов текста [15] нет ни одного профессионального кардиолога и ни одного специалиста, разбирающегося в биохимии, фармакологии, также нет и ни одного практикующего врача;
• Среди авторов текста [15] нет ни одного специалиста в области машинного обучения и интеллектуального анализа данных (data mining), что принципиально необходимо для адекватного анализа сложных данных современной медицины;
• Анализ публикаций авторов метаанализа [15] указал на их очевидную предвзятость (по крайней мере, с 2004 г.) к проблеме кардиоваскулярных применений ω-3 ПНЖК.
Об адекватности выбора способов оценивания «однородности» когорт, учитываемых при проведении кохрейновского метаанализа При стандартном подходе к метаанализу (то есть проведение метаанализа без использования персонализированных данных по пациентам) оценки однородности включаемых в метаанализ клинических исследований носят принципиально важный характер. Формальное и логически необоснованное применение тех или иных критериев, которое не учитывает разницу в деталях клинических описаний выборок участников, заведомо сдвигает мета-анализ в сторону получения отрицательного результата. Действительно, на неоднородной «объединенной выборке» пациентов вряд ли возможно получение адекватных результатов. Поэтому эпоха больших данных требует разработки и применения новых, комплексных мер однородности/неоднородности включаемых в метаанализ клинических исследований. Такие меры должны обязательно включать анализ клинических значимых подвыборок пациентов (стратификацию) [49].
Авторы кохрейновского текста [15] применили исключительно такой «критерий однородности исследований», при использовании которого совершенно пренебрегаются важнейшие клинические данные по когортам пациентов, включаемым в метаанализ.
Некоторые из авторов текста [15] являются соавторами исследователя “Higgins JP”, предложившего т. н. «I2-критерий» неоднородности исследований [50]. Поэтому неудивительно, что авторы кохрейновского метаанализа [15] слепо используют этот критерий. При этом авторы особо не утруждают себя адекватным клиническим мышлением при использовании «I2-критерия» и попросту используют произвольно введенное, фиксированное ограничение на значение величины «I2» – 60%. Почему же именно «60%», а, например, не «53,4%» или, скажем, «81%»? Ни малейшего внятного обоснования такого произвольного выбора значения величины «I2» авторы ни приводят, а просто ссылаются на какую-то другую публикацию [51], в которой не представлено никаких фундаментальных математических обоснований использования статистических критериев. Заметим, что в тексте публикации [51] приводятся совершенно другие примеры значений для оценки выполнимости критерия «I2» (например, 63% или 44%, и т. п.).
Последствием применения случайно выбранного псевдо-статистического критерия «I2» является то, что авторы текста [15] исключили 54 исследования из почти 80 клинических исследований ω-3 ПНЖК (то есть 2/3), оставляя только 25 публикаций. Неизбежно, получаются соответствующие результаты: а именно, авторами текста [15] не получено ни одного нетривиального результата, который бы имел хоть какое-нибудь клиническое значение.
Очень важно напомнить читателю, что величина «I2» всего-навсего описывает долю вариации результатов от исследования к исследованию и вычисляется как I2=100%×((Q–df )/Q). Величина Q – т. н. «кохрейновская гетерогенность» подвыборки когорт, а df – число взятых в метаанализ когорт минус один [50]. Величина Q вычисляется простым суммированием дисперсии анализируемого эффекта (значения риска и т. п.) по всем исследованиям.
Обратим внимание на очень важный факт: при расчете величины I2 используются исключительно значения дисперсии риска или какой-либо другой измеряемой переменной. В то же время любые другие описания когорт (возраст, пол пациентов, коморбидные заболевания и другие) не входят в формулу для вычисления I2. Такой крайне упрощенный подход предполагает, что впоследствии необходимо провести, по меньшей мере, анализы всех соответствующих подгрупп участников (которые полностью игнорируются в подавляющем большинстве так называемых «доказательных исследований», в т. ч. и в обсуждаемом, см. выше раздел «Общий разбор текста публикации»). Практическое мышление клинициста подсказывает, что любые оценки однородности когорт участников, основанные на вычислении показателей, наподобие Q, I2 и других грубых эмпирических приближений такого рода, догматизируют, фактически, непреложность того, чтобы в любой когорте, данные о который были собраны в любой сезон и в любом географическом регионе, вне зависимости от «стандартной терапии», выбора группы сравнения, лекарственных форм и дозировок препаратов и любых других факторов, у пациентов всегда должна наблюдаться одна и та же величина отклика (!) на терапевтическое вмешательство. Подобного рода грубые приближения нельзя назвать иначе, как кабинетной заумью, чрезвычайно далекой от реальной клинической практики: ведь, по сути, такие «приближения» соответствуют полному игнорированию и дозозависимости фармакотерапии, и самой идеи персонализированной медицины и просто всего гигантского массива клинического опыта настоящих врачей, а не кабинетных «исследователей доказательности».
Из описанных выше определений Q и I2 вытекает и другое крайне важное заключение: любые оценки «однородности» подвыборок различных исследований, основанные исключительно на оценках Q и I2, «смещены», «скошены» (от англ. – “biased”) в сторону получены отрицательных результатов. Общеизвестно, что эффект любого реального лекарства зависит и от дозировки, и от длительности применения, и от сопутствующих патологий, и от генетической конституции участников. Изучение всего комплекса этих сложных взаимосвязей и представляет собой важную задачу персонализированного подхода к терапии индивидуальных пациентов. Напротив, эффект плацебо, то есть эффект приема таблеток из фармакологически неактивных компонентов действительно не зависит ни от одного из перечисленных выше условий. Поэтому при приеме плацебо величины Q и I2 будут давать неправомерно высокие оценки «качества» и «однородности» групп исследований, в которых, по сути дела, исследовался эффект плацебо.
О вопиющих «пробелах» в области фармакологии и биохимии ω-3 ПНЖК, систематически встречающихся у «адептов доказательности»
Обширный экспертный анализ кохрейновских и ряда других «доказательных» публикаций показывает, что декларируемая адептами доказательности «объективность» их «исследований» зачастую неразрывно ассоциирована с полным незнанием основ клинической фармакологии. Незнание основ фармакологии практически всегда отягощается еще и незнанием элементарной химии в пределах школьного курса. Сказанное в полной мере относится к тексту разбираемого в настоящей работе текста [15].
Начнем с очень простого, но весьма наглядного примера – словосочетания «ω-3 жиры», которое используется в тексте [15] около 120 раз. Вспомним, однако, что «жирами» в биохимии называются сложные эфиры определенных «жирных» кислот и трехатомного спирта глицерина. В то же время, в тексте [15] исследуются весьма разнородные ω-3 соединения (ω-3 ПНЖК, сложные эфиры ω-3 ПНЖК и т. д.), но уж никак не «жиры». Таким образом, безграмотное употребление биохимически значимых терминов в тексте [15] уже настораживает любого компетентного читателя.
Поскольку реальных знаний нет, то они подменяются формалистическим подходом, то есть мышлением по шаблону (редукционизм). Мы приведем четыре наиболее вопиющих примера деструктивного шаблонного мышления, которые становятся очевидными при детальном анализе текста [15]: (I) крайне низкая информированность относительно молекулярных механизмов осуществления эффектов ω-3 ПНЖК; (II) очевидное незнание фундаментальных основ фармакологии и фармацевтики; (III) полное игнорирование взаимосвязей между клинической фармакологией и биомедициной; (IV) прикрытие отсутствия элементарных знаний и навыков научного анализа литературы на очевидные языковые конструкции, имеющие открыто манипулятивный характер (см. также ранее результаты сентиментнализа).
Пример I. Непонимание фундаментальных молекулярных механизмов осуществления эффектов ω-3 ПНЖК следует из перечисляемых авторами текста [15] «механизмов» действия: понижение артериального давления, улучшение показателей липидного профиля и профиля свертывания крови, антиаритмическое действие, снижение воспаления, устранение резистентности к инсулину и т. п. Для любого специалиста по фармакологическому действию ω-3 ПНЖК и сами эти перечисляемые «механизмы», и порядок их перечисления, указывают на «плавание» авторов текста [15] приблизительно в таком же стиле, в каком «плавает» как студент, не подготовившийся к экзамену по фармакологии (о чем с ответственностью заявляем на основании собственного педагогического опыта по преподаванию фармакологии и других дисциплин).
Более того, авторы текста [15], упоминая придуманные ими «механизмы» фармакологического воздействия ω-3-ПНЖК, не приводят никаких адекватных ссылок после 2004 г. Этот факт сам по себе указывает на недостаточную информированность авторов относительно того, что основной массив фундаментальных исследований механизмов фармакологического действия ω-3 ПНЖК был выполнен за последние 5-10 лет.
Пример II. Те перечисления, которые авторы текста [15] называют «механизмами ω-3-ПНЖК», указывают на полную неосведомленность авторов относительно азов фармакологии. В современной фармакологии рассмотрение механизмов воздействия любых лекарственных средств с необходимостью включает, по крайней мере, пять важнейших аспектов: (1) указание таргетного белка или множества таких белков; (2) определение значений соответствующих констант взаимодействия исследуемых молекул с указанными таргетными белками; (3) указание молекулярных каскадов, активность которых изменяется в результате модуляции активности таргетного белка или белков; (4) указание молекулярных каскадов биотрансформаций исследуемого лекарства; (5) указание списка и взаимопревращений метаболитов, которые образуются при биотрансформациях рассматриваемой молекулы лекарства.
Заметим, что все эти пять аспектов фармакологического воздействия ω-3 ПНЖК были подробно исследованы и детально описаны в огромном количестве оригинальных статей, опубликованных в ведущих биомедицинских журналах. Вкратце, из ω-3 ПНЖК, известных как эйкозапентаеновая кислота (ЭПК) и докозагексаеновая кислота (ДГК), в каскаде арахидоновой кислоты (АРК) синтезируются десятки фундаментальных модуляторов процессов воспаления, эйкозаноидов и докозаноидов, включающих нейропротектин D1, резолвин Е1 и др. [52]. Спектр действия эйкозаноидов и докозаноидов настолько широк, что его весьма сжатое описание с перечислением соответствующих таргетных белков заняло бы несколько страниц. Важно напомнить читателю, что эти производные ЭПК и ДГК, синтезируемые в каскаде АРК, непосредственно вовлечены в процесс нормофизиологического прекращения воспалительного процесса, т. н. «разрешения воспаления» [52].
Как следует из текста [15], авторы данного текста не удосужились изучить современные систематические обзоры по биохимии и молекулярной биологии ω-3 ПНЖК. Очевидно, что ни один из указанных выше фундаментальных механизмов фармакологического воздействия ω-3 ПНЖК даже не был упомянут в тексте [15]. Нельзя не отметить, что адепт доказательности, отвергающий подобного рода важнейшие данные, уподобляется тому известному персонажу М. А. Булгакова, который предлагал не вдаваться в сложности, а просто «взять всё и поделить»….
Авторам текста [15], по всей видимости, также совершенно неизвестно, что в 1982 г. проф. S. Bergstrom, B. Samuelsson, J. Vane получили Нобелевскую премию за исследование взаимосвязи простагландинов, ω-3 ПНЖК и каскада арахидоновой кислоты.
В 2009 г. проф. E. Blackburn, J. Szostak и C. Greider получили Нобелевскую премию за установление теломеразных механизмов клеточного старения. В 2010 г. проф. E. Blackburn в соавторстве с клиницистами опубликовала результаты исследования, показавшего, что ω-3 ПНЖК тормозят укорочение теломер и, следовательно, увеличивают продолжительность жизни клеток [53].
На очевидное непонимание авторами текста [15] фундаментальных основ фармацевтики указывает тот факт, что данные индивидуумы не считают чем-то из ряда вон выходящим называть «применением ω-3 ПНЖК» настолько различные «воздействия», как: (1) пищевое употребление рыбы; (2) прием так называемого «рыбьего жира», то есть экстрактов жира рыб, не прошедших соответствующей фармацевтической стандартизации; (3) прием препаратов на основе высокостандартизированных фармакологических субстанций ω-3 ПНЖК; (4) прием льняного масла; (4) прием рапсового масла и т. п.
Заметим, что приводимые авторами текста [15] перечисления так называемых «применений ω-3 ПНЖК» настолько необычны, что напоминают образованному читателю тексты, написанные в средние века, в которых подсчитывалась плотность существ высших измерений на единицу поверхности иглы. Авторы тех текстов, в подавляющем большинстве случаев, перечисляли все, о чем слышали на ту или иную тему, без какого-либо критического анализа или простейшего рассуждения. Особенно интересен, например, следующий фрагмент текста, найденный нами в работе [15]: «…жирная рыба (включая скумбрию, рыбу-собаку, лосось, сельдь, форель, тунец, осетр, угольную рыбу, анчоусы, кильку, кижуча, мойву, сардины, меч-рыбу, молодь сельди, сардины, бризлинг, американскую сельдь, рыбу-колотушку, краба, угря)…».
Вслед за этим следует не менее длительное перечисление различных видов растительных масел: льняное, рапсовое, горчичное и т. п. – практически весь ассортимент современного гипермаркета. Что особенно интересно, в конце всех этих перечислений из средневековья авторы текста [15], как будто с неким оттенком снисходительности, добавляют, что, мол, стандартизированные формы ω-3 ПНЖК также могут быть приемлемы. Эта ошибка авторов текста [15], заключающаяся в очевидной путанице между фармацевтически стандартизированными и нестандартизированными формами ω-3 ПНЖК (оставляя в стороне путаницу между приемом пищи, приемом капсул и т. п.), выглядит особенно нелепо при сопоставлении с результатами биохимических анализов жирнокислотного состава экстрактов ω-3 ПНЖК из различных природных источников ([54, 55] и др.).
В частности, в нашей недавней работе было показано, что, по данным хроматографии, содержимое образцов содержимого капсул т. н. «рыбьего жира» включает несколько десятков различных веществ, причем содержание каждого, в среднем, составляет всего 4% и не превышает 15% (рис. 1).
В случае фармацевтически стандартизированных субстанций ω-3 ПНЖК последние содержат всего 3-4 вещества (как правило, производные ЭПК/ДГК), которые составляют 90% и более от массового содержания ω-3 ПНЖК (рис. 2).
Пример III. О полном игнорировании взаимосвязей между клинической фармакологией и биомедициной авторами текста [15] свидетельствует тот факт, что авторы полностью пренебрегли необходимостью оценки биотрансформаций ω-3 ПНЖК. ЭПК и ДГК, равно как и любые другие вещества, поступающие в организм, претерпевают комплекс биотрансформаций, продукты которых
затем поступают в кровь. Следовательно, определение концентраций разнообразных ω-3 ПНЖК в крови (например, в форме теста на «омега-индекс») принципиально необходимо и для установления комплаентности участников, и для оценки эффективности терапии (подобным образом, например, измеряются концентрации 25-дигидроксивитамина D3 при приеме препаратов холекальциферола).
Невзирая на то, что концентрации ω-3 ПНЖК оцениваются при проведении рандомизированных исследований, авторы текста [15] полностью проигнорировали этот важнейший момент.
Нельзя не подчеркнуть, что подобного рода «подход» к оценке «доказательности» эффектов ω-3 ПНЖК носит отчетливые следы идеологии магизма. В самом деле, авторы [15], пренебрегая и фармакодинамикой, и фармакокинетикой ω-3 ПНЖК, тем самым неявно постулируют, что доказательность того или иного лекарства никак не зависит от соответствующих биотрансформаций и от таргетных белков, а «осуществляется» исключительно через волю «мага», то есть адепта доказательности, проводящего такое «доказательное» исследование.
Пример IV. О том, что авторы текста [15] систематически стараются прикрыть отсутствие элементарных знаний и навыков научного анализа литературы посредством применения языковых конструкций манипулятивного характера, говорят и приводимые выше результаты сентимент-анализа, и отдельные «яркие» примеры из текста [15]. Например, авторы [15] формулируют весьма правильную идею о том, что экстракты жира рыб, живущих в естественных условиях, могут содержать повышенные количества диоксинов и ртути (в форме метилртути), что, естественно, может влиять на состояние участников, принимающих такие нестандартизированные экстракты. Несмотря на формулировку этой верной мысли, она лишь служит трамплином для демагогического переключения внимания читателя от реально важного вопроса (то есть количественной оценки содержания диоксинов, ртути и других тяжелых металлов в экстрактах «рыбьего жира») на…. архиважность изучения безопасности ω-3 ПНЖК [15]. Таким образом, внимательный читатель текста [15] понимает, что главная мотивация данного текста [15] отнюдь не сбалансированное рассмотрение вопроса о кардиоваскулярной эффективности ω-3 ПНЖК, а на самом деле рассмотрение того, не наносят ли ω-3 ПНЖК какого-либо вреда. Очень странная, на наш взгляд, мотивация для метаанализа эффективности чего бы то ни было.
Более того, заявляя столь неадекватную цель метаанализа, авторы либо по-прежнему проявляют полное непонимание фармакологии и биохимии, либо просто еще раз наглядно демонстрируют стойкость и живучесть двойных стандартов. В самом деле, если авторы столь обеспокоены повышенным содержанием токсических веществ в тех или иных конкретных препаратах ω-3 ПНЖК, то для изучения этого действительно важного вопроса необходимо проведение не метаанализа, а биохимического и элементного анализа различных образцов ω-3 ПНЖК, которые используются в клинической практике.
Если же в препаратах ω-3 ПНЖК такие примеси отсутствуют или содержатся в пренебрежительно малых количествах, то каким же образом отсутствующие примеси могут вообще оказывать какое-либо влияние, в т. ч. заявляемое авторами текста [15] отрицательное воздействие? Вместо этого авторы выбрали весьма странный и неэффективный путь оценки химического состава препаратов ω-3 ПНЖК – путем выполнения метаанализа на крайне низком научном уровне…
Адекватные оценки клинически значимых показателей гетерогенности когорт исследований, включаемых в метаанализ – важнейшее условие адекватного проведения метаанализа
До настоящего момента мы выявили и описали значительное число ошибок, которые были допущены при попытке проведения кохрейновского метаанализа [15] вследствие пренебрежения основополагающими принципами фармакологии и клинической медицины. Следующая фундаментальная ошибка данного «метаанализа» заключается в отсутствии в тексте [15] результатов адекватного анализа клинической гетерогенности исследуемых когорт пациентов. Последовательно применив комплекс методов интеллектуального анализа текстов, мы извлекли из текста [15] информацию, имеющую отношение к клиническим описаниям когорт, провели анализ клинической гетерогенности (неоднородности) этих когорт и затем заново выполнили метаанализ смертности от всех причин.
Применение комплекса алгоритмов для анализа текстов [27,56-61] позволило экстрагировать из текста [15] данные по соответствующим клиническим работам [62-97]. В результирующую таблицу включены данные когорт, представленные в 79 публикациях.
Описание каждой из когорт пациентов проводилось посредством формирования набора значений 27 показателей (таких, как размер когорты и подгрупп случай/контроль, сопутствующие кардиоваскулярные и некардиоваскулярные патологии, демографические данные, распространенность курения, данные о приеме других препаратов, режим курсового приема ω-3 ПНЖК, фармацевтическая форма ω-3 ПНЖК и др.). Фрагмент таблицы из 27 параметров представлен в таблице 2.
Установление клинически однородной подгруппы исследований было проведено посредством метода метрических карт, который представляет собой один их самых чувствительных подходов к кластеризации [58] при проведении анализа «сверхбольших данных» [59,60]. Наборы значений 27 показателей, описывающие каждую из 79 когорт, были преобразованы в 27-мерные вектора, расстояния между которыми вычислялись различными способами (метрика Колмогорова-Смирнова, Lp-метрика, инженерная полуметрика [61]) и затем подвергались кластеризации. Вне зависимости от выбора способа расчета этих «расстояний между исследованиями» в результате анализа находился только один кластер клинически однородных когорт (рис. 3).
Применение метода метрических сгущений позволило выделить один кластер клинически близких друг к другу (то есть однородных) когорт (см. рис. 3), включающий данные 19 исследований ω-3 ПНЖК. Сравнение значений 27 показателей между подгруппой «кластерных» исследований и подгруппой «внекластерных» исследований указало на комплекс различий в клинических характеристиках соответствующих когорт (табл. 3).
В целом, в результате кластеризации была получена подвыборка, включающая данные по 19 когортам, которые были однородными с клинической точки зрения. Когорты пациентов в данной выборке (1) были более схожи друг с другом, чем все остальные когорты; (2) включали преимущественно пациентов с кардиоваскулярной патологией; (3) чаще включали пациентов, которым были назначены фармацевтически стандартизированные ω-3 ПНЖК, а не препараты на основе так называемого «рыбьего жира»). Соответственно, именно эти исследования и могут быть включены в метаанализ, так как они удовлетворяют требованию клинической однородности когорт.
Мы провели метаанализ 19 кластерных исследований. Суммарно метаанализ включил 32407 участников, которые принимали ω-3 ПНЖК и 32364 участников, принимавших плацебо или только стандартную терапию. Метаанализ 19 кластерных исследований подтвердил, что прием ω-3 ПНЖК (в виде ЭПК+ДГК) ассоциирован со сниженной смертностью от всех причин: риск смертности снижался на 5,0% на каждые 1 гр/сут. (ОР 0,95; 95% ДИ 0,91-1,01; Р=0,0542 – рис. 4).
Очевидными преимуществами нашего метаанализа по сравнению попыткой метаанализа в публикации [15] являются: (а) уточненная клиническая характеристика когорт, которые берутся в метаанализ; (б) принятие во внимание важнейших особенностей фармакологии и фармацевтики ω-3 ПНЖК; (в) адекватное применение современных методов анализа «больших данных», на основании которого была получена подвыборка клинически сопоставимых исследований, как сгущение точек в определенном метрическом пространстве.
Далее представлены результаты применения еще одной аналитической процедуры (так называемый «делетивный подход» [24]), которые позволяют оценить «устойчивость» полученных результатов метаанализа. На первом шаге анализа устойчивости вычисляется центр кластера, как точка, характеризующаяся минимальным значением суммы расстояний до всех других [59, 60] (такой точкой является когорта/исследование “DO IT 2010”). На втором шаге все остальные точки кластера упорядочиваются по возрастанию расстояния от центра. На третьем шаге проводится серия метаанализов, которые последовательно включают первые два исследования, наиболее близких к центру (в т. ч. само «центральное» исследование), затем первые три, первые четыре исследования и др. Каждый из метаанализов в данной серии характеризуется при посредстве ряда статистических показателей. Целью такой усложненной методики проведения метаанализов является установление эффектов последовательного учета все менее и менее однородных исследований при включении их в метаанализ (табл. 5, рис. 5).
Рисунок 5. Статистические характеристики серии метаанализов, последовательно проводимых, начиная с центра кластера клинически однородных исследований. Обозначения исследований – в списке литературы [62-97]: (А) Стандартизованная переменная Z; (Б) статистическая достоверность Р; (В) значения ОР (центральная линия) и 95% ДИ (темно-красные линии).
Проведение описанной выше серии метаанализов указало на приемлемую «стабильность» приведенных ранее результатов метаанализа клинически однородных исследований. Как видно из данных рисунка 5, постепенное включение когорт/исследований в метаанализ приводит сначала к росту значений ОР, а после учета исследований «DART 1989», «Doi 2014», «GISSI-P», «GISSIHF» происходит стабилизация значений ОР и 95% ДИ. При включении в серию метанализов внекластерных (то есть клинически гетерогенных) когорт пациентов отмечается проградиентное возрастание значений ОР и Р, соответствующее потере статистической достоверности.
Заключение
«Мы должны остановить Лондон, пока он не уничтожил нас».
Худ. фильм «Хроники хищных городов», 2018.
С точки зрения «строгостей» прикладной математики и фундаментальных основ статистического анализа данных, повсеместно используемая процедура медицинских «метаанализов» занимает пограничное место между наукой и квази-наукой. Одно дело, когда для каждого исследования находится таблица с описаниями индивидуальных пациентов и все эти описания объединяются в единую базу данных («individual patient data meta-analysis»). Такая процедура имеет фундаментальное обоснование и в математической статистике, и в интеллектуальном анализе данных. И совсем другое дело, когда из каждой публикации, данные из которой включаются в метаанализ, извлекается лишь самая общая информация (например, средние значения параметров по исследованным подгруппам, размеры подгрупп пациентов и др.) после чего предпринимаются те или иные попытки объединить эти заведомо разнородные и «зашумленные» данные.
Тем не менее эти попытки проведения метаанализов могут все же быть полезными, убедительными и доказательными. Однако это становится возможным только при условии, что мета-анализы выполнены не в соответствии с волюнтаристскими «стандартами доказательности», навязываемыми «пиратами доказательности» [10], а основаны на: (А) четкой клинической логике при построении метаанализа; (Б) тщательном анализе именно клинической неоднородности когорт, включаемых в метаанализ [3]; (В) адекватном применении современных методов анализа данных.
К сожалению, эти три фундаментальных принципа проведения метаанализов полностью игнорируются современными нам адептами доказательности, которые, очевидным образом, «пиратски захватили» (англ. – «hijacked») значительную часть соответствующих публикационных ресурсов в области доказательной медицины [10].
Поэтому вместо трех фундаментальных принципов, описанных выше в пунктах А, Б и В, «пираты доказательности» используют приемы манипуляции вниманием слушателей [98].
Первый прием. Игнорирование основ фармакологии, биохимии и эпидемиологии с одновременным использованием шаблонных моделей мышления. Примеры подобного рода изобилуют в настоящей статье (см., например, приведенные ранее перечисления «вмешательств», характерные для текста публикации [15]).
Второй прием. Игнорирование всех современных методов анализа данных на фоне выбора необоснованных критериев оценки гетерогенности исследований. Эти непроверенные «критерии» потом систематически навязываются как «стандарты» [50]. При этом никакого математического или клинического обоснования этих «критериев» не приводится, а просто используется имеющийся обширный административный и медийный ресурс. При этом игнорирование современных трендов в анализе данных (интеллектуальный анализ данных, англ. – data mining; анализ больших данных, англ. – big data analysis; машинное обучение, англ. – machine learning) носит явный характер фобии: в самом деле, ни одна из кохрейновских публикаций их не использует (см. Введение).
Можно только предположить, что такого рода «исследователи» от доказательной медицины могут бояться использования современных информационных технологий, которые позволяют мгновенно выявлять аномалии в данных, нарушения процедур анализа данных и возможную подтасовку данных.
Третий прием. Систематическое подавление всякого научного дискурса в области доказательности на фоне абсолютизации необоснованных «критериев качества» клинических исследований.
Напомним читателям, что публикация статьи [15] происходила на фоне известных событий вокруг публикационной активности организации Cochrane Collaboration, произошедших 14 сентября 2018 г. После того, как один из редакторов Cochrane Collaboration, Р. Gøtzsche, опубликовал весьма взвешенную и рациональную критику всего лишь одной из кохрейновских публикаций, он был исключен из числа редакторов Cochrane Collaboration [99]. Более того, редакторы, поддержавшие его, также были выведены из Cochrane Collaboration, в результате чего число основных редакторов журнала Cochrane Database Syst Rev сократилось с 13 до 6. Заметка [99], опубликованная в журнале «Нэйче», показывает, что такого рода события вскрывают всеохватывающие конфликты интересов в так называемой «доказательной медицине» и существенно роняют престиж данной области. Этому же способствуют и публикации наподобие [15].
Единственно допустимым оправданием публикаций, которые позиционируются и как «доказательные», является ничем не ограниченный доступ независимых исследователей к индивидуальным данным пациентов (естественно, при условии строжайшего соблюдения требований к деперсонализации данных). Именно наличие такого доступа позволяет адекватно проводить метаанализы. Если же доступ к данным ограничен «особой подпиской» и т. п. и неограниченного доступа к данным нет, то адепты доказательности становятся похожими на приверженцев сект и прочих клановых объединений.
Благодарности
Работа выполнена по грантам No 16-29-12936, 18-07-00929 Российского фонда фундаментальных исследований (РФФИ).
Список литературы смотрите здесь.
Источник: Журнал “Фармакоэкономика. Современная фармакоэкономика и фармакоэпидемиология” №2, 2019