N-T.ru / Текущие публикации / История науки |
Долгое прощание с лысенковщинойВ.П. ЛЕОНОВ Часть 6Нормальное распределение в биомедицине
|
Категория статей | Характеристики статей и используемые в них статистические методы | АПЖ | Журнал невропатологии психиатрии им. С.С. Корсакова | |||
1980 | 1979 | 1980 | 1981 | 1987 | ||
1 | Описательные и обзорные сообщения | 28 | 94 | 101 | 95 | 93 |
2 | Краткие сообщения без статистических данных | 129 | 37 | 50 | 43 | 47 |
3 | Описательная статистика: таблица, графики, средние, вариабельность | 90 | 35 | 45 | 43 | 55 |
4 | χ2, t-тесты, метод Фишера | 236 | 30 | 29 | 38 | 52 |
5 | Корреляционные методы | 94 | 3 | 7 | 7 | 10 |
6 | Частотный анализ, F-тест | 79 | 1 | 0 | 0 | 1 |
7 | Непараметрические ранговые методы | 36 | 0 | 0 | 0 | 1 |
8 | Измерение связей некоррекционными методами | 32 | 0 | 1 | 0 | 0 |
9 | Регрессионный анализ | 25 | 0 | 0 | 0 | 2 |
10 | Дискриминантный и факторный анализ | 17 | 1 | 2 | 1 | 1 |
11 | Оценки максимальной вероятности, интервальные оценки | 5 | 0 | 0 | 0 | 0 |
12 | Кластер-анализ, классификации | 2 | 0 | 1 | 0 | 1 |
13 | Анализ «выживаемости» | 3 | 0 | 0 | 0 | 0 |
14 | Сериальный и спектральный анализ | 3 | 0 | 0 | 0 | 0 |
15 | Планирование эксперимента: латинские квадраты, иерархические модели | 4 | 0 | 0 | 0 | 0 |
16 | Байесовы методы | 1 | 0 | 0 | 0 | 0 |
Спустя 6 лет данное исследование было продолжено уже в другом авторском составе и его результаты приведены в [70]. «В настоящее время в России существует уже несколько новых психиатрических журналов, существенно расширился диапазон публикаций, исследовательская психиатрия оснастилась компьютерами, с помощью которых легко использовать пакеты стандартных статистических программ. Можно было ожидать существенного расширения использования математических методов. Проверка этого предположения и стала главной целью настоящего исследования» [70]. Для проведения исследования авторами был выбран журнал «Социальная и клиническая психиатрия» (СКП). «Главная трудность анализа использования количественных методов в СКП лежит вне математики, в смысловой организации большей части работ, в их семантике. Это, прежде всего нечеткость формулировки цели и задач, как работы в целом, так и отдельных ее фрагментов, в частности статистических, которые часто даются без какой-либо мотивировки и последующего обсуждения, то есть, используются формально. Последнее, особенно наглядно в тех работах, где существовал раздел «материалы и методы». В этом разделе иногда не было даже упоминаний о методах математической статистики, которые затем появлялись в тексте без какого-либо объяснения. Если же указания на такие методы и были, ни в одной работе не встретилось объяснения, почему выбраны именно эти методы, а не другие, и что с их помощью предполагалось получить» [70]. Результаты этого достаточно глубокого и беспристрастного анализа представлены авторами в виде графика и таблицы, которая приведена ниже.
Таблица 5.
Использование статистических методов в публикациях психиатрических журналов [70]
АП | ЖК | СКП | Отличие от АП | ||
Характер методов | 1980 | 1979...1981 и 1987 | 1991...1995 | ЖК P < | СКП P < |
1 Описательные сообщения и обзоры | 157 | 500 | 225 | 0,0001 | 0,0001 |
2. Описательная статистика: таблицы, графики, средние, вариабельность | 90 | 178 | 113 | 0,0001 | 0,0001 |
3. хи-квадрат, t-тесты, метод Фишера | 236 | 149 | 67 | 0,0001 | 0,0001 |
4. Корреляционные методы | 94 | 27 | 6 | 0,0001 | 0,0001 |
5. Частотный анализ, F-тест | 79 | 2 | 1 | 0,0001 | 0,0001 |
6. Непараметрические ранговые методы | 36 | 1 | 0 | 0,0001 | 0,0001 |
7. Измерение связей некорреляционными методами | 32 | 1 | 0 | 0,0001 | 0,0001 |
8. Регрессионный анализ | 25 | 2 | 5 | 0,0001 | 0,001 |
9. Дискриминантный и факторный анализ | 17 | 5 | 2 | 0,05 | 0,05 |
10. Оценки максимальной вероятности, интервальные оценки | 5 | 0 | 1 | 0,01 | |
11. Кластер-анализ, классификации | 2 | 2 | 0 | | |
12. Анализ «выживаемости» | 3 | 0 | 0 | 0,05 | 0,05 |
13. Сериальный и спектральный анализ | 3 | 0 | 0 | 0,05 | 0,05 |
14. Планирование эксперимента: латинские квадраты, иерархические модели | 4 | 0 | 0 | 0,01 | 0,05 |
15. Байесовы методы | 1 | 0 | 0 | | |
16. Всего статей | 784 | 867 | 420 |
АП англоязычные журналы (Amer. J. Psychiat., Archives Gen. Psychiat.)
ЖК Журнал невропатологии и психиатрии им. С.С. Корсакова
СКП Социальная и клиническая психиатрия
«Прежде всего, обращает внимание резкое доминирование t-оценок в статьях СКП, которые почти полностью исчерпывают категорию 3 (см. таблицу) в отличие от АП, где широко используется метод χ2 и дискриминантный анализ. Существенно отметить и то, что метод Стьюдента используется в статьях СКП без какого-либо его анализа его приложимости. Между тем этот метод разработан для показателей, имеющих нормальное... распределение, тогда как количественные данные некоторых статей показывают, что это условие не выполняется. А это значит, что неприменима не только t-статистика, но также вычисление средней величины Большинство статей, где используется t-статистика, имеет многофакторную структуру. В подавляющей части таких работ предполагалось обнаружить зависимость одного (например, прогноза) или нескольких явлений (например, диагностические группы) от каких-либо нескольких факторов (клинических, лабораторных, социальных и других или от типов течения определенной нозологической формы). Казалось, было очевидным решить эти задачи с помощью многофакторных математических методов, таких, например, как дисперсионный, факторный, дискриминантный, кластерный анализ или множественная регрессия. Однако за редчайшим исключением авторы опираются на t-статистику, иногда умножая ошибки, указанные в пункте «а» [70]. Далее авторы обращают внимание читателей на то, что «...поражает разрыв между трудоемкостью... исследования и простотой статистической обработки многопараметрических результатов, основанной на t-статистике, которая не вполне адекватна задаче исследования». В качестве иллюстрации этого утверждения приведем пример из нашего исследования, содержащий ссылки всего лишь на две докторские диссертации. Так, в диссертации «Роль гемопоэзининдуцирующего микроокружения в регуляции кроветворения при действии на организм миелоингибирующих факторов. Принципы фармакологической коррекции» (14.00.16 пат. физиология, 1994 г.) автор сообщает «Всего было использовано 1418 мышей-самцов линии СВА и 120 мышей-самцов линии С 57В 1/6». Однако все выводы построены только на использовании t-критерия Стьюдента без проверки возможности его использования. В другой диссертации «Влияние нарушения кислотно-щелочного равновесия на динамику раннего постреанимационного периода» (14.00.16 пат. физиология, 1993 г.) автор сообщает, что в работе было использовано 692 беспородных крысы и 531 кролик. И вновь все выводы построены только на применении t-критерия Стьюдента без проверки возможности его использования. Список подобных примеров мог бы занять несколько страниц. Авторы [70] отмечают, что «... большую группу составили работы, в которых статистика или вовсе не использовалась или была представлена только числовой характеристикой некоторых показателей В одной из работ описывается воздействие 9 факторов и 24 возможных исхода для выявления связи между ними. Однако статья не содержит ни количественных данных, ни тем более их статистической обработки. Совершенно ясно, что научная ценность такой работы исчезающе мала не потому, что ее описательные выводы неверны, но, будучи недоказательными, становятся научным балластом» [70]. В последующем обсуждении результатов исследования авторы приходят к выводу что «компьютеризация исследовательских учреждений в последние годы не повлияла на расширение измерительных или количественных подходов. Как в прошлом веке, в российской психиатрии доминируют описательные, качественные методы» [70]. Продолжая анализ, авторы делают вывод о том, что продвижение математических методов в разделы психиатрии будет по сути дела обусловлено экономическими категориями. В качестве аргумента авторы приводят пример с зарубежной психофармакологией. «Это обусловлено, прежде всего, ответственностью ее практических решений, а также дороговизной ее производства и конкуренцией на рынке сбыта. Жесткость всех этих отношений заставила психофармакологов насытить математикой не только теоретический, но и прикладной раздел этой дисциплины (клиническое испытание новых препаратов). Почти тотальное обеспечение психофармакологии математикой стало одним из способов повышения ее эффективности и минимизации неудач Анализ литературы, предпринятый в настоящей работе, свидетельствует, что аналогичная задача еще не возникла перед российской психиатрией в середине 1990-х гг. Более того, часть российских статей по изучению эффективности психотропных препаратов или их сравнительному изучению, даже содержащие количественные данные, обходятся без статистического анализа, лишь изредка используется t-статистика» [70]. В качестве примера подобной работы мы можем привести докторскую диссертацию «Хронобиологические основы нейротропных эффектов солей лития», 14.00.17 нормальная физиология, 14.00.25 фармакология, 1997 г. В диссертации приведено 34 таблицы содержащих порядка 1000 выражений «M ± m» и «р < 0,05», полученных с помощью t-критерия Стьюдента без проверки условий возможности его использования. В этой же работе проверялись гипотезы о равенстве средних с помощью критерия Стьюдента для признака, который оценивался по 4-х балльной системе.
Подобные же результаты сравнения российских и англоязычных публикаций получены и авторами [71], где сообщены выводы наукометрического анализа статей журналов "ECOLOGY" и «ЭКОЛОГИЯ». Результаты анализа основаны на данных об индивидуальной и совместной частоте встречаемости в этих публикациях экологических и математических терминов. Некоторые результаты этой работы приведены ниже в табл.6.
Таблица 6.
Доля публикаций, использующих разные группы математических методов
(в % от числа статей из данного журнала) [71]
Математические методы | Журнал "ECOLOGY" | Журнал «ЭКОЛОГИЯ» |
Описательные и обзорные сообщения без статистических данных | 4 | 24 |
Стандартные методы | 77 | 69 |
Многомерные методы | 60 | 13 |
Непараметрические методы | 35 | 0 |
Категоризованные данные | 15 | 0 |
Марковские процессы | 2 | 0 |
Дифференциальные уравнения | 2 | 0 |
Как видно из табл. 5, наблюдается значительное различие в частоте применения многомерных и непараметрических методов статистики в статьях сравниваемых журналов. Многие из перечисленных выше недостатков отмечались ранее и автором [83]. Немало интересного и поучительного относительно ошибок применения статистики в биологии можно найти и в работах известного пропагандиста биометрии Александра Александровича Любищева, который выделил две группы ошибок: «Ошибки от недостатка осведомленности» и «Ошибки, связанные с избытком энтузиазма» [72...74].
Первые зарубежные исследования, посвященные анализу применения статистических методов в медицине, относятся к 1929 г. [75] и 1932 г.[76]. Более поздние исследования были выполнены в 60-х [77], 80-х и 90-х годах. Результаты этих исследований свидетельствуют о том, что уже в 80-х годах зарубежные публикации стал отмечать достаточно высокий уровень использования статистических методов анализа экспериментальных данных. В табл. 7 приведены результаты наиболее известного зарубежного исследования [78].
Таблица 6.
Proportion of papers in New England Journal of Medicine using certain statistical methods of analysis in 1978...1979 and 1990 [78]
Procedure | 1978...1979 All papers (n=760), % | 1978...1979 Original papers (n=332), % | 1990 Original papers (n=100), % |
No statistical method or descriptive statistics only | 5 | 27 | 11 |
t-test | 24 | 44 | 39 |
Contingency tables | 15 | 27 | 30 |
Pearson correlation | 7 | 12 | 17 |
Non-parametric tests | 6 | 11 | 25 |
Any survival analysis or logistic regression | * | 11 | 32 |
Regression for survival or logistic regression | 1 | * | 27 |
Life-table | 3 | * | 19 |
Other survival analysis | 1 | * | 15 |
Epidemiological statistics | 5 | 9 | 13 |
Simple linear regression | 5 | 8 | 18 |
Analysis of variance | 4 | 8 | 14 |
Transformations | 3 | 7 | 8 |
Multiple regression | 3 | 5 | 6 |
Non-parametric correlation | 2 | 4 | 9 |
Multiway tables | 2 | 4 | 7 |
Multiple comparisons | 2 | 3 | 5 |
Adjustment and standardization | 2 | 3 | 1 |
Other methods | 2 | 3 | 19 |
Достаточно высокая частота многих использованных методов говорит о том, что в большинстве статей используется сразу несколько методов. Кроме того, примерно равные частоты для половины методов позволяют сделать вывод о том, что в среде авторов данного журнала уже сложилось ядро из 7...9 основных используемых статистических методов. Более того, по большинству методов видна положительная динамика.
Среди удручающего обилия работ переполненных «M ± m», «p < 0,05» и t-критерием Стьюдента, изредка встречаются статьи и диссертации, в которых грамотно и глубоко используются достаточно современные методы прикладной статистики. Как правило, число авторов в таких статьях не превышает 3...4 человек. Ниже мы приведем небольшой список таких работ, отмечая набор использованных авторами статистических методов и критериев. Так в статье «Предикторы риска летальности больных в раннем периоде после операции аортокоронароного шунтирований» (В.А. Сандриков, М.Г. Гордон, М.К. Курдов, Кардиология, №8, 1997, стр. 24...28) авторами былп проведена проверка нормальности распределения признаков, использована ранговая корреляция а также модель логистической регрессии. В следующей статье «Прогноз осложнений, развившихся вследствие введения антиаритмических препаратов при пароксизмальных наджелудочковых тахиаритмиях на догоспитальном этапе лечения» (Ю.Г. Шварц, В.Ф. Киричук, Кардиология, №8, 1997, стр. 31...35) авторы использовали кроме t-критерия Стьюдента критерий Краскела-Уоллиса, провели анализ таблиц сопряженности, корреляционный и регрессионный анализ и также провели сравнение многомерных групп с помощью дискриминантного анализа. Мы не обнаружили, что география подобных работ ограничивается в основном только такими научными центрами, как Москва и Санкт-Петербург. Так, к примеру, если первая из вышеназванных работ была выполнена в Научном центре хтрургии РАМН и научно-исследовательском кинофотоинституте (г. Москва), то вторая работа выполнена на кафедре факультетской терапии лечебного факультета и кафедре нормальной физиологии Саратовского государственного медицинского университета. Напомним, что упоминавшаяся выше работа, в которой был использован мем «Полученные данные обрабатывали на ЭВМ методами многомерной статистики», была выполнена также на кафедре факультетской терапии, только уже другого медицинского университета Санкт-Петербургского университета им. И.П. Павлова. Поэтому можно утверждать, что уровень применения статистических методов в биомедицинских работах не определяется географией расположения организаций в которых выполняются эти работы.
Авторы таких интересных работ осознают, что для получения глубокого знания о предмете исследования необходимы не только совершенное оборудование, но и современные сложные методы статистического анализа наблюдений. Подобные работы, выполненные как правило с участием специалиста по прикладной статистике, отмечает высокий уровень как выбора адекватных методов анализа, так и корректная интерпретация полученных при этом результатов. В качестве примеров таких достаточно глубоких (в смысле применения методов статистического анализа наблюдений) можно указать диссертации Н.В. Канской на тему «Роль взаимосвязи дислипопроидемий и иммунологических нарушений в патогенезе коронарного атеросклероза» (1990 г.), Е.Н. Кологривовой на тему «Соотношение систем общего и местного иммунитета при различных режимах функционирования гомеостатических механизмов организма человека» (1991 г.), Огородовой Л.М. «Реактивность нейтрофилов в системе механизмов воспаления основа формирования и лечения атопического дерматита у детей» (1995 г.), Биндерис Н.С. «Влияние антогонистов кальция на префузию миокарда у больных гипертнической болезнью» (1995 г.), Горленко Л.В. «Влияние патологии гепатобилиарной системы на возникновение и развитие атерогенных нарушений у детей» (1996 г.), Гребенюк О.В. «Клинико-иммунологическая характеристика церебрального арахноидита» (1998 г.). Весьма интересные примеры продуктивного использования сложных статистических методов анализа данных опубликованы в 1998 г. в «Зоологическом журнале». Так, в статье Ю.Г. и Г.В. Пузанченко «Экологическая дифференциация грызунов сезонно-влажных тропических лесов Северного Вьетнама» (1998 г. том. 77 №1, стр. 117...132) использовано многомерное непараметрическое шкалирование. В следующей статье В.В. Гриценко, Н.В. Глотова и Д.Б. Орлинского «Эколого-генетический анализ изменчивости центральных элементов рисунка переднеспинки у колорадского жука (LEPTINOTARSA DECEMILINEATA)» (1998 г. том. 77 №3, стр. 277...284) авторами использован анализ 5-мерных таблиц сопряженности.
Отметим, что сравнение в целом работ по кардиологии и по радиобиологии, с точки зрения уровня использования прикладной статистики, явно не в пользу кардиологии. В статьях и диссертациях радиобиологической тематики наблюдается большее разнообразие использованных в работе статистических методов. В качестве примера такой статьи можно указать работу А.А. Конрадова [59] выполненную в Институте химической физики им. Н.Н. Семенова РАН РФ. Аналогичный уровень отмечен и для публикаций авторов филиала института Биофизики г. Озерск. Видимо, здесь сказывается специфика самой радиобиологии, базирующейся на фундаменте биофизики. Уровень использования статистических методов в публикациях академических журналов, значительно ниже, чем в публикациях отраслевых журналов. Приятным исключением можно считать публикации журнала «Клиническая медицина и патофизиология» издаваемого Военно-медицинской академией (г. Санкт-Петербург), которая имеет давние пионерские традиции использования методов статистики в медицинских исследованиях.
Сопоставление публикаций по уровню использования в них методов статистики свидетельствует о том, что лидирующее положение в этом смысле, как правило, занимают несколько авторских коллективов ведущих исследовательских центров того или иного научного направления. Так для подобных публикаций Государственного научно-исследовательского центра профилактической медицины Минздрава РФ характерно глубокое и комплексное применение методов статистики наряду с достаточно подробным изложением специфики этих методов и полученных при этом результатов. Эти же признаки отличает и ряд статей Института клинической кардиологии им. А.Л. Мясникова КНЦ РАМН. Особо следует выделить работу [60], эталонный уровень которой обеспечен наличием среди исполнителей этого исследования и авторов статьи профессионального статистика. Столь же высокий уровень использования методов прикладной статистики характерен и для работ [61...66].
Дата публикации: 15 августа 1999 года |
|