N-T.ru / Текущие публикации / История науки

Долгое прощание с лысенковщиной

В.П. ЛЕОНОВ

Часть 4

Самозарождение «Р <»
и что авторы понимают под «Р»

Примерно в 25% работ, в которых авторы применяли статистику, вообще не упоминаются использованные ими статистические методы и критерии. Большинство таких работ, подобно диссертации «Церебральная гемодинамика в условиях покоя и функциональных нагрузок у мужчин молодого возраста» (1992 г.) изобилуют выражениями типа «р < 0,05», «p < 0,01» или «р = 0,05». Однако нигде в тексте не сообщается, к каким конкретно статистическим критериям относятся данные вероятности. В 56 статьях 11 выпусков БЭБМ за 1997 г., в которых использовалось выражение «p < 0,05», также не упоминается использованный авторами статистический критерий. При чтении таких работ возникает ощущение того, что выражения «р < 0,05» или «p < 0,01» самозарождаются и возникают подобно живым клеткам по теории О.Б. Лепешинской и далее появляются как Deus ex machina (Бог из машины). Тогда как в контексте описываемых задач выражения «р < 0,05» и «p < 0,01» могут быть получены только при использовании конкретных статистических критериев, например критерия Пирсона χ2, критерия Вилкоксона и т.д. Отсутствие данных критериев в тексте позволяет предположить, что авторы либо не считают упоминание использованных статистических критериев достаточно важным для того, чтобы приводить ее в диссертации, монографии или статье, либо же специально не приводят ее исходя из других мотивов. Отметим, что полное отсутствие описания использованных методов статистики характерно не только для публикаций последнего десятилетия, но и для более раннего периода. Например, полностью отсутствует данная информация в диссертации «Электрическая стимуляция сердца при тахикардиях и аритмиях в остром периоде инфаркта миокарда» (1981 г.), в монографии «Родиола розовая – ценное лекарственное растение: Золотой корень» (1987 г.) и в диссертациях «Гепатический метаболизм кортикостероидов в системе регуляции кортикостероидного гомеостаза» (1996 г.) и «Метаболическая концепция бронхиальной астмы» (1996 г.). Перечень подобных примеров можно продолжить на многих страницах. Почему же так важна конкретизация в тексте всей схемы статистического анализа экспериментальных данных, включая указание использованных при этом статистических критериев? Как для каждого лекарственного препарата имеются свои специфические противопоказания к применению, так и для конкретных статистических критериев имеются аналогичные ограничения. Например, нельзя использовать t-критерий Стьюдента когда не выполняются два основных условия его применимости, нельзя использовать этот же критерий и для дискретных бальных (ранговых) оценок, нельзя использовать коэффициент корреляции Пирсона для признаков, не имеющих нормального распределения, не имеет смысла применение множественной регрессии для дискретных, качественных признаков и т.д. Поэтому детальное описание схемы анализа экспериментальных данных является важнейшим аргументом адекватности выбранного критерия анализируемым данным и проверяемой статистической гипотезе, а стало быть, и научности полученных при этом статистических выводов. В противном случае сомнительные выводы не могут признаваться научно доказанными и претендовать на отнесение их к научным истинам.

В большинстве работ авторы не раскрывают наименование и смысл величины «р» и выражения «р <», видимо полагая, что читатели вполне однозначно могут их интерпретировать. Между тем, величина «р» (от латинского Probability – вероятность) может иметь разный смысл. В некоторых работах отмечается путаница этих смыслов, что свидетельствует о том, что авторы этих работ не видят принципиальной разницы между ними. В частности, если часть авторов, исходя из контекста, подразумевает под «р» уровень значимости, то другие понимают под «р» доверительную вероятность. Например, на стр. 30 «Вестника РАМН» №9 за 1995 г. в примечании к таблице 1, читаем: «Примечание: * – t = 2,18; p = 0,971; ** – t = 2,85; p = 0,995; *** – t = 2,16; p = 0,999». Можно догадываться, что видимо в данном контексте под величиной «р» авторы подразумевают доверительную вероятность. Однако такая очевидность имеется не всегда.

Типология описания использованных методов

Оставшаяся часть работ содержит в той или иной форме описание использованных методов статистики. В большинстве таких работ методы статистики упоминаются в разделе (главе) «Материал и методы». В большинстве проанализированных работ описание статистических методов и критериев дается в форме шаблонных клише с весьма расплывчатым содержанием. Можно выделить три группы подобных клише. В первой группе с разными вариациями просто констатируется сам факт использования статистических методов. Доля этой группы, по отношению ко всем работам содержащим описания, составляет примерно 45%. Для нее характерны следующие описания:

  1. Результаты обработаны статистически.
  2. Обработку данных проводили статистическими методами.
  3. Результаты обработаны методом (методами) вариационной статистики (варианты: стандартными программами, общепринятыми методами и т.п.).
  4. Результаты подвергнуты статистической обработке.

Приведем наиболее типичные образцы подобных описаний: «Полученные данные обработаны статистически» («Вестник РАМН», 1995 г., №2, стр. 18), «Результаты опытов обработаны статистически общепринятым способом, различие считали при уровне вероятности не менее 95%» (БЭБМ, 1997, вып.8, стр. 179), «Количественные данные статистически обрабатывали» (БЭБМ, 1997, вып.9, стр. 320), «Полученные данные подвергнуты статистическому анализу» (стр. 36 диссертации «Лечение больных инфарктом миокарда в фазу рековалесценции аминазин-электрофорезом», 1992 г.). Такие же скромно-лаконичные описания мы обнаружили и во многих других диссертациях и монографиях. Изобилуют подобными вербальными орнаментами и многие журнальные статьи. Что подразумевают авторы под стандартными и общепринятыми методами и стандартными программами, читатель может лишь догадываться. Попытайтесь представить аналогичное описание методики лечения: «Больных лечили стандартным (общепринятым) способом...», не упоминая при этом сам стандарт. Пожалуй, наиболее необычное описание этого важного этапа своего исследования дано в статье «Варьирование активностей цистеиновых катепсинов почек и печени» («БЭБМ» 1995, №12, стр. 586...589): «Математическую обработку проводили обычным способом с использованием компьютера». Далее в статье авторы нигде не упоминают ни одного конкретного метода статистического анализа и статистического критерия, хотя и используют выражения «p < 0,05» и «0,01». Если часть авторов удовлетворяется только одним методом вариационной статистики, то другие используют уже методы (несколько). Например, в статье «Использование эссенциальных фосфолипидов в лечении больных ишемической болезнью сердца и инсулиннезависимым сахарным диабетом» (Кардиология, 1996, №1, стр. 30...33) все описание использованных авторами статистических методов свелось всего лишь к одной фразе (стр. 31): «Полученные данные обрабатывали на ЭВМ методами многомерной статистики». Однако далее в тексте авторы видимо забыли об этой фразе и нигде не приводят абсолютно никаких даже намеков на эти самые «многомерные методы». Нет ни только названий этих таинственных методов, но нет и обсуждения результатов их применения. (А был ли ребенок? – В.Л.)

Для второй группы работ (примерно 30%) характерно наличие указаний на более конкретные детали: 1) фамилия автора пособия по статистике; 2) статистический критерий; 3) один или два статистических параметра; 4) тип ЭВМ, персонального компьютера или название пакета программ:

  • Материал обрабатывали статистически по методу Лакина (варианты: по В.Ю. Урбаху; по таблицам Стрелкова).
  • Достоверность значений определяли по t-критерию Стьюдента (варианты: по среднеквадратичному отклонению усредненных значений параметров; методом определения среднего квадратического отклонения от средней величины).
  • Статистическая обработка материала произведена с использованием мини-ЭВМ «Искра-1256» (варианты: IBM PC, IBM PC XT (AT, 386 SX/ 486 и т.п.) по стандартным программам.

Очевидно, что для читателя ссылка на определенную фамилию (Лакин, Урбах, Стрелков) ни о чем не говорит, поскольку в книгах данных авторов описано много разнообразных методов. Что сможет узнать врач, например, о методике лечения больных, если автор статьи или диссертации напишет: «Лечение больным назначалось по Машковскому и Видалю...»? Делать подобную ссылку все равно, что утверждать наличие методики Машковского или Видаля, только по той причине, что есть лекарственные справочники с такими именами. Примерно в половине работ, в которых упоминаются конкретные критерии или фамилии (t-Стьюдента, Лакин, Урбах, Стрелков, Каминский, Венчиков, Генес и т.д.) даются ссылки на литературу. В другой же половине работ никаких ссылок не приводится. В случае применения достаточно популярных статистических критериев, например t-критерия Стьюдента, отсутствие подобной ссылки менее критично. Однако когда автор использует менее популярные методы или критерии, такую практику вряд ли можно считать приемлемой. В некоторых работах авторы просто отмечают сам факт использования вычислительной техники, не конкретизируя наименования ее наименование. Так, например, на 61 стр. диссертации «Оценка динамики развития эффективности лечения и влияние очага некроза на гемодинамику у больных инфарктом миокарда» (1987 г.) читаем, что «статистическая обработка проводилась разностным методом, Ойвин И.Н., 1960», однако в списке цитируемой литературы такой автор отсутствует. Поэтому, что это за разностный метод Ойвина, можно только строить предположения.

Во многих диссертациях и статьях дается конкретное наименование используемых средств вычислительной техники. Упоминание типа компьютера вероятно, по мнению авторов, должно поднять в глазах читателей значимость и доверие к полученным выводам, особенно если результаты работы получены с помощью зарубежного компьютера. В более ранних работах упоминаются программируемые микрокалькуляторы, подобно тому, как это сделано на стр. 43 диссертации «Желчеотделительная функция печени при аппликациях сапропеля в эксперименте» (1992 г.): «Результаты исследований обрабатывали статистически с применением программируемого микрокалькулятора МК-54.» Впрочем, подобные упоминания можно встретить и в относительно свежих работах: «Все полученные цифровые данные подвергались вариационно-статистической обработке на программируемом микрокалькуляторе «Электроника МК 52», используя критерии достоверности по Стьюденту» (стр. 56 диссертации «Соматические и психовегетативные соотношения у больных описторхозом», 1995 г.). Достаточно многие авторы выполняли этап статистического анализа, используя такие популярные в свое время средства вычислительной техники, как ЭВМ СМ-4 и мини-ЭВМ «Искра-1256»: «Математическая обработка результатов производилась методами вариационной статистики на ЭВМ СМ-4» (стр. 42 диссертации «Парамагнитные центры и свободнорадикальное окисление липидов при артериальной гипертонии у строителей БАМ», 1987 г.). В работах же последних лет все чаще упоминаются персональные компьютеры IBM PC, например: «Полученные результаты обработаны статистически с использованием персонального компьютера IBM PC XT» (стр. 50 диссертации «Клинико-конституциональные взаимосвязи при язвенной болезни желудка и двенадцатиперстной кишки», 1996 г.). При упоминании в данных разделах работ персональных компьютеров авторы чаще всего и ограничивают этим фактом описание методики статистического анализа собственных экспериментальных наблюдений. Вот пример подобного описания: «Полученные результаты обрабатывались статистическими методами вариационной статистики с использованием персонального компьютера типа IBM PC 286» (стр. 53 диссертации «Функциональная характеристика эпителиально-гладкомышечных взаимодействий в стенке воздухоносных путей и кровеносных сосудов», 1995 г.). Авторы подобных работ видимо полагают, что упоминание персонального компьютера является как бы «знаком качества» и тем самым гарантирует достоверность и надежность декларируемых ими статистических выводов. Позиция таких авторов отражает весьма опасный миф, бытующий среди медиков и биологов: «ЭВМ не ошибается», что звучит как «жена Цезаря вне подозрений». Авторы таких работ путают два понятия: надежность персональных компьютеров и их производительность с правильностью полученных на компьютере результатов анализа. А между тем это совершенно разные вещи, поскольку для получения верного результата должны быть выполнены многочисленные условия, которые автору не всегда известны, либо не всегда им проверяются. Отметим, что подобные описания чаще всего характерны для докторских диссертаций, нежели статей и кандидатских диссертаций.

Если часть авторов вполне удовлетворялась упоминанием только одного средства вычислительной техники – микрокалькулятора, ЕС ЭВМ или персонального компьютера, то другие авторы приводят целый список таких средств, нередко совмещая в нем несколько поколений ЭВМ. Вот как выглядит такой список на стр. 78 диссертации «Общие закономерности восстановления и механизмы нарушений кровообращения в постреанимационном периоде», 1989 г.: «Обработка проводилась на ЭВМ «Наири-2», ЭВМ ЕС-1022, с помощью микрокалькуляторов «Электроника Б3...18А», «Электроника Б3...21». По всей видимости автор счел, что перечисление не одной ЭВМ, а сразу четырех, усилит доверие к полученным им научным выводам. Очевидно, что информация о типе ЭВМ является излишней и ее не имеет смысла приводить в диссертации или статье. Более же необходимым является достаточно полное упоминание о конкретных статистических методах, критериях, статистических пакетах программ и реализованных в них статистических процедурах. Хотя применение хорошего пакета программ и не гарантирует правильность полученных при этом результатов, тем не менее, читатель может сопоставить результаты, приведенные в работе со своими собственными результатами, если те и другие были получены с применением одного и того же пакета программ или конкретной процедуры пакета. Особенно это относится к тем случаям, когда используются развитые системы статистического анализа с собственным языком программирования, например пакет SAS. В таких случаях для понимания авторской логики статистического анализа данных необходимы уже не только наименования используемых процедур, например FACTOR или FASTCLUS, но и используемые в этих процедурах детализирующие их опции. Такие опции уточняют, например, алгоритм включения независимых, предикторных переменных в уравнение регрессии (пошаговый или принудительный), конкретизируют используемую метрику пространства и алгоритм объединения в кластерном анализе, указывают алгоритм вращения осей в факторном анализе и т.д. Однако в проанализированных работах указание конкретного типа статистической программы было примерно в 3% работ. Наиболее часто упоминаются пакеты STATGRAPHICS, CSS и SPSS. В последние годы стали появляться ссылки и на популярные электронные таблицы SuperCalc и Microsoft Excel.

Третья группа проанализированных работ (примерно 25%) содержит достаточно безграмотные, а подчас и просто абсурдные либо противоречивые сочетания перечисляемых терминов или критериев. В таких описаниях авторы часто вводят свою собственную терминологию, не раскрывая в тексте работы содержания и смысла используемых терминов. Либо же употребляют известные в статистике термины в иных, не раскрываемых ими значениях. Ниже мы приводим несколько таких выражений взятых в диссертациях и статьях.

  1. Доверительный интервал рассчитан для 95% уровня значимости. (?)
  2. Подсчет среднего количества М ± m производили по методу Стьюдента. (?)
  3. Статистическую обработку данных осуществляли с помощью t-критерия Стьюдента при Р > 0,05. (?)
  4. Статистическую обработку данных производили по методу Стьюдента с применением критерия c 2. (?)
  5. Достоверность различий между отдельными контингентами лиц определяли по критерию Фишера.
  6. Результаты обрабатывали статистически с определением средней арифметической, стандартной ошибки и доверительного интервала при Р ? 0,05. (?)
  7. Корреляционный анализ проводили путем сравнения двух групп с помощью критерия t. (?)

Например, невозможно понять смысл выражений типа «Различия считали статистически достоверными при t < 0,05» («Вестник РАМН», 1995 г., №4, стр. 14...16) или «Достоверными считали значения коэффициента корреляции, соответствующие 95% уровню значимости» («Вестник РАМН» 1995 г., №12, стр. 29). Столь же бессмысленны и следующие фразы: «Достоверным считались отличия с уровнем доверительной вероятности P < 0,05» (стр. 35 диссертации «Роль поджелудочной железы в регуляции антитрипсиновой и трипсиновой активности крови» (1992 г.); «... на графиках – величины доверительных интервалов при Р = 0,05» (стр. 82 диссертации «Роль гемопоэзининдуцирующего микроокружения в регуляции кроветворения при действии на организм миелоингибирующих факторов. Принципы фармакологической коррекции» (1994 г.); «Достоверными считали различия с уровнем доверительной вероятности меньше 0,05» (стр. 49 диссертации «Роль трипсина в регуляции моторной функции тонкой кишки» (1992 г.).

Подобный стиль описания наиболее характерен для публикаций журналов БЭБМ, «Кардиология» и «Вестник РАМН». Когда в таких описаниях авторы перечисляют сразу несколько методов или критериев, далее в работе, как правило, при упоминании полученного статистического вывода, обычно приводится только выражение типа «р < 0,05» без указания использованного критерия.

Меметика – аналог генетики

Исследования в области эволюционной теории познания привели в последние 15...20 лет к осознанию некоторых аналогий между Дарвиновской теорией эволюции и эволюцией процессов познания. Представим знание как информацию об окружающей нас среде и происходящих в ней процессах. Априорно главная функция знания состояла в том, чтобы носитель этого знания имел больше шансов на приспособление и выживание в собственной среде обитания. Действительно, те индивиды, которые имеют ложное знание об окружающей их среде, обречены на быстрое исчезновение и вытеснение их носителями адекватного знания. В процессе возникновения и приобретения знания отдельными индивидами наблюдаются процессы, аналогичные биологическим процессам приспособления и отбора. На подобные параллели обращали внимание многие ученые. Достаточно подробно эта аналогия была описана К. Поппером в его известной работе «Рост научного знания». В работе «Эгоистический ген» [84] Ричардом Даукинсом была предложена концепция репликатора в приложении к социокультурным процессам, которая более детально была им описана в его следующей работе «Расширенный фенотип» [85]. В данных работах автор впервые ввел понятие «мема», используемого им для описания процессов хранения и распространения отдельных элементов культуры. В эти же годы Ламсденом и Вильсоном [86] была предложена концепция культургена. Данная концепция способствовала закреплению аналогии между механизмами передачи генетической и культурной информации. В других работах применяют термин «мим», однако по нашему мнению термин «мем» более отвечает содержанию этого понятия, поскольку он ближе к латинскому memos – память.

«Работы Даукинса, Ламсдена и Вильсона положили начало представлению и описанию социокультурных процессов с привлечением терминов и механизмов, хорошо известных в биологии. В этот период выяснилось, что практически все элементы массовой культуры – политические, религиозные, экономические и социальные явления могут быть легко описаны с позиций распространения и репликации элементарных единиц культуры – репликаторов. Быстрый прогресс в компьютерной технологии и информатизация практически всех областей человеческой деятельности привели к тому, что параллельно с осознанием способности многих элементов культуры распространяться как инфекционный процесс, мы стали свидетелями возникновения и эволюции особых информационных существ – компьютерных вирусов, чье бесконтрольное распространение может приводить к катастрофическим последствиям. Вирусы и подобные им информационные существа также являются репликаторами и имеют многие черты и атрибуты, свойственные самореплицирующимся объектам культуры. Стало очевидно, что возникновение и развитие знания и других элементов культуры можно описывать и исследовать с привлечением всего хорошо разработанного категориального и методологического аппарата биологических наук и рассматривать как процесс естественной эволюции, но уже не субъекта знания, как было у Даукинса, а эволюции самих информационных существ.» [87] После публикаций [88...92] достаточно определенно можно было уже говорить о появлении новой науки – меметики. Последние публикации [93...101] свидетельствуют об интенсивном развитии этой науки. Об этом же свидетельствует и появление в сети Интернет серверов, посвященных этому научному направлению:
http://www.hok.no/marius/memetics/,
http://www.cpm.mmu.ac.uk/jom-emit/1998/vol 2/lynch_a.html,
а также телеконференции alt.memetics на которой проводится обсуждение проблем меметики.

Концепции меметики, в частности, позволяют описывать в терминах генетики размножение, распространение, отбор, мутации и рекомбинации, а также и смерть мемов – этих элементарных единиц, квантов культуры. Такими информационными квантами – мемами, могут выступать сформулированные идеи, лозунги, религиозные догмы, мода на тот или иной стереотип поведения, музыкальные мотивы, литературные клише и обороты используемые авторами печатных работ и т.д. Траекторию жизни мема можно представить по аналогии с траекторией вируса, который может существовать только в клетке инфицированного носителя. Так и мем, может существовать только на определенных носителях. Такими носителями могут быть люди, пресса, книги, звуковые записи, видеозаписи, компьютерные файлы и т.д. Наиболее часто роль переносчика мема выполняет человек. При этом в процессе переноса – инфекции, мем легко может подвергаться перестройке, рекомбинации с другими мемами обитающими на данном носителе. Естественный отбор сохраняет в данном индивиде в основном те мемы, которые легко им запоминаются, и понимаются другими носителями, вследствие чего они являются наиболее инфекционными. При этом меметика не занимается вопросами истинности или ложности переносимой в мемах информации. Эту проблему решает естественный отбор. Если вспомнить ложные идеи Лысенко Т.Д. и Лепешинской О.Б., то, несмотря на то, что мемами их учений было заражено множество носителей, естественный отбор показал ложность и неадекватность этих учений жизненным реалиям, и они были отвергнуты. Такой же результат мы наблюдаем как для научных, так и для идеологических и учений.

«Хотя чаще всего говорят про мемы как про структуры, существующие на человеческом материале, на самом деле не менее важны и другие носители мемов – книги, магнитные и оптические диски и т.д., хотя здесь имеются и некоторые отличия, касающиеся особенностей эволюции мемов на этих носителях. Существование мемов на технических носителях может быть уподоблено стадии споры у некоторых бактерий. В состоянии споры ни бактерии, ни мемы практически не могут претерпевать изменчивость, зато могут в латентном неизменном виде существовать веками, пережидая неблагоприятные условия внешней среды, чтобы однажды, при возникновении благоприятной ситуации, сбросить защитную оболочку и зажить активной жизнью. Мемы ведут себя подобно живым организмам, что позволяет применить по отношению к ним терминологию и методологические подходы из эпидемиологии, теории эволюции, иммунологии, лингвистики, семиотики и создать в результате этого объединения новую эффективную теорию – меметику.» [87]

Очевидно, что любая научная деятельность не может происходить, не соприкасаясь со сферой культуры. Нередко эта деятельность непосредственно оплодотворяется культурой, а подчас непосредственно сама культура и является объектом научного исследования. Применительно к нашему объекту исследования это означает, что исследователь в области биомедицины (да и в других областях тоже), мыслит и излагает эти мысли устно и письменно с помощью языка – одного из основных элементов человеческой культуры. К такому же элементу общечеловеческой культуры можно отнести и его познания в тех областях и направлениях науки, которые не относятся к непосредственной сфере его профессиональных интересов. Психологам хорошо известно, что большинству специалистов свойственно преувеличивать глубину познаний профессионала в определенной сфере деятельности, если эта сфера знаний отлична от его собственной сферы профессиональных интересов. Причем чем более удалены друг от друга эти научные области, тем сильнее это заблуждение. При этом, чем выше уровень квалификации специалиста в своей области знания и чем критичнее и осторожнее его отношение к ней, тем более доверчивее и некритичнее его отношение к результатам иных сфер знания. Именно по этой причине исследователь более всего подвержен «инфицированию» мемами из этих пограничных либо удаленных сфер деятельности, и, соответственно, познание о них представлено в его сознании, поведении, речи и научных произведениях в форме подобных мемов. Для выделения и последующего анализа таких мемов достаточно проанализировать публикации исследователей, которые не только содержат элементы его основного научного направления, но и соприкасаются с пограничными областями науки. В нашем случае такой удаленной по отношению биомедицине областью является прикладная статистика. В данном разделе мы попытаемся взглянуть на проанализированный нами материал с позиций меметики, выделяя и вычленяя при необходимости те или иные обороты, выражения, а нередко и отдельные предложения или группы предложений, как ментальные репликаторы – мемы.

Меметический анализ описаний методов статистики

Приведенные выше клише, используемые для описания статистических методов, и являются типичными мемами, которыми инфицированы многие авторы биомедицинских публикаций. Часть используемых мемов вполне адекватно описывает несложный статистический инструментарий применяемый авторами. Однако подавляющее большинство меметических описаний несут на себе отпечаток фрагментарности и логической и вербальной незавершенности их конструкции. Фактически в этой ситуации автор уподобляется умельцу, которому в руки попал конструктор типа «Сделай сам» с набором тех или иных элементов, но при том, что в коробке отсутствует программа сборки нужного изделия. По этой причине часто наблюдается отстраненность и удаленность содержательной стороны выполненного анализа и его меметического описания. Нередко встречаются специфические «меметические цепочки» состоящие из дословно повторяющихся предложений следующих в ряду статей или диссертаций. Эта специфика может проявляться по-разному. Ниже мы рассмотрим несколько подобных специфических мемов, и обсудим их возможные инфекционные траектории.

В приведенной ниже таблице даны четыре авторских описания, относящиеся к определению ими достоверности различия. Три из них приведены в следующих диссертациях:

№1 – Лечение хронического описторхоза препаратом из растительного сырья (попутрилом) и оценка его эффективности. Канд. дисс., 14.00.09 – педиатрия, 1995 г.;

№2 – Влияние некоторых стимуляторов центральной нервной системы на неспецифическую иммунобиологическую реактивность организма. Канд. дисс., 14.00.09 – инфекционные болезни, 1969 г.;

№3 – Ультразвуковая и радионуклидная диагностика патологии гепатобилиарной системы у детей дошкольного возраста. Канд. диссер., 14.00.09 – педиатрия, 14.00.19 – лучевая диагностика,1997 г.

Четвертое же описание приведено в коллективной монографии [102]. Те части мема, которыми наиболее отличаются данные описания, выделены жирным курсивом и цветом.

Таблица 1.

Описание из диссертации №1 [стр. 41]Описание из диссертации №2 [cтр. 53]Описание из монографии [102] [стр. 48]Описание из диссертации №3 [стр. 40]
Достоверность различия сравниваемых величин определяли с помощью показателя точности Р по таблице Стьюдента, где он располагается в зависимости от значений t и n.Достоверность определяли с помощью абсолютного показателя точности «р», который находили по специальной таблице, где он расположен в зависимости от (t) Стьюдента и числа степеней свободы «n?».Достоверность различий средних арифметических определяли по абсолютному показателю точности процентных точек распределения Стьюдента в зависимости от коэффициента достоверности (t) и числа степеней свободы (n).Достоверность различных средних арифметических определяли по абсолютному показателю точности (P) по таблице процентных точек распределения Стьюдента в зависимости от коэффициента достоверности (t) и числа степеней свободы (n).

Как видим, эти четыре описания весьма похожи друг на друга. Менее всего отличаются между собой описания из диссертаций №2, 3 и монографии [102]. Наши исследования показали, что данный мем имеет достаточно большой «возраст». К примеру, если кандидатские диссертации №1 и №3 защищены в 1995 г. и 1997 г., а коллективная монография [102] издана в 1996 г., то диссертация 2 датирована еще 1969 г. Однако ни в одной из этих работ нет одного и того же исследователя, более одного раза выступающего в роли автора, либо в роли научного руководителя. Это делает более вероятным предположение о том, что «инфицирование» этим мемом произошло от некого пятого источника, носителя данного мема. Хотя не исключено, что некоторые из авторов упомянутых работ познакомились с ним и через предшествующие работы. Обратим также внимание читателей на наличие в 4-х случаях субмема «показатель точности», причем в 3-х случаях он называется «абсолютным показателем точности». Наши попытки найти наиболее вероятный источник инфицирования этим мемом успеха не имели. Попытаемся выяснить, какой смысл могли вкладывать авторы этих работ в «показатель точности», используя для этой цели следующий мем, использованный в монографии [102] и диссертации №3 и приведенный в таблице ниже.

Таблица 2.

Описание из монографии [102]Описание из диссертации №3
На основании критерия t по таблице Стьюдента определялась вероятность различия. Различие считалось достоверным при p < 0,05, т.е. в тех случаях, когда вероятность различия составляла больше 95%.[стр. 48]На основании t по таблице Стьюдента определялась вероятность различия (р). Различие считалось достоверным при p < 0,05, т.е. в тех случаях, когда вероятность различия составляла больше 95%. [стр. 40]

Авторы монографии [102] не приводят в этом меме объяснения величины (р). В этом случае можно считать, что авторы подразумевают под величиной (р) уровень значимости, и тогда в последнем предложении использованного мема нет противоречия. Действительно, «при p < 0,05» мы имеем доверительную вероятность более 95%. Таким образом, вероятнее всего авторы монографии [102] подразумевали уровень значимости, величина которого дополняет доверительную вероятность до единицы: р = 1 – Рдов. Совершенно иную, противоречивую и бессмысленную конструкцию имеет этот мем в диссертации №3, где величина (р) определяется как «вероятность различия». В одном и том же предложении диссертант утверждает, что «Различие считалось достоверным при p < 0,05, т.е. в тех случаях, когда вероятность различия составляла больше 95%». Таким образом, мы имеем случай рекомбинации мемов, в результате которой новый мутантный мем приобрел достаточно искаженную и лишенную смысла форму.

Если рассмотренные выше 4 источника относятся к разным областям медицинской науки, то следующие 2 диссертации – №4 и №5, объединяет не только одна научная специальность 14.00.37 – анестезиология и реаниматология, но и один научный руководитель.

№4 – Патогенетическое обоснование вариантов экстракорпоральной детоксикации в комплексной терапии токсической стадии острого разлитого перитонита (экспериментально-клиническое исследование). Канд. дисс., 14.00.37 – анестезиология и реаниматология, 1996 г.

№5 – Экспериментальная оценка нового метода мембранного плазмафереза. Канд. дисс., 14.00.37 – анестезиология и реаниматология, 1998 г.

№6 – Оптимизация лечения осложненных острых воспалительных заболеваний придатков матки у юных женщин). Канд. дисс., 14.00.01 – акушерство и гинекология, 1997 г.

На первый взгляд различие же между этими мемами лишь в двух словах и одной букве.

Таблица 3.

Описание из диссертации №4 [стр. 59]Описание из диссертации №5 [стр. 21]Описание из диссертации №6 [стр. 38]
Статистическая обработка результатов проводилась методом вариационной статистики с использованием «t»-критерия Стьюдента в условиях доверительной вероятности, равной 95%Статистическая обработка результатов проведена методами вариационной статистики с использованием «Т»-критерия Стьюдента в условиях доверительной вероятности, равной 95%Статистическая обработка полученных данных проводилась методом вариационной статистики с использованием «t»-критерия Стьюдента в условиях заданной доверительной вероятности, равной 95%

Однако главное различие между ними в том, что авторы диссертаций №4 и №6 удовлетворились в своей работе только одним «методом» вариационной статистики, тогда как в диссертации №5 использованы уже несколько «методов». Иными словами, первые два диссертанта полагают что «вариационная статистика» и представляет собой один единственный метод, отождествляя его с t-критерием Стьюдента. Третий же диссертант предполагает наличие нескольких методов, которые и необходимы для использования Т-критерия Стьюдента. Как видим, эти две позиции имеют принципиальную разницу между собой. Вместе с тем, данные диссертации объединяет и субмем «в условиях доверительной вероятности», который достаточно верно выражает этот аспект описываемой процедуры.

Анализ публикаций показал, что достаточно широко используются оба типа мема, как тот, где постулируется наличие нескольких «методов», так и мем с наличием одного «метода». Отметим, что такое восприятие статистики авторами публикаций характерно не только для «вариационной статистики», но и для других видов статистики. «Статистическую обработку цифрового материала проводили по стандартному методу вариационной статистики на электронно-вычислительной машине ЕС-1033 ...» – стр. 58 диссертации «Состояние легочной вентиляции и механики дыхания при острой пневмонии», 14.00.05 – внутренние болезни, 14.00.43 – пульмонология, 1990 г. «В эксперименте различие показателей по сравнению с контролем и между возрастными группами оценивались методами вариационной и разностной статистики по критерию Стьюдента и считались достоверными при Р < 0,05» – стр. 46 диссертации «Функции почек и водно-солевой баланс у крыс при гипо- и гиперосмии в динамике беременности», 14.00.17 – нормальная физиология, 1992 г. «Вычисление, обработку полученных результатов осуществляли методом математической статистики при помощи программируемого микрокалькулятора «Электроника МК-52» с использованием специальных программ» – стр. 43 диссертации «Регионарная вентиляция, кровоток, механизмы дыхания у здоровых людей, больных хроническим бронхитом и бронхиальной астмой», 14.00.05 – внутренние болезни, 14.00.16 – пат. физиология, 1994 г. Интересно, как бы воспринял хирург следующее описание: «Внутриполостная операция производилась методом хирургии»?

Анализ мемов со сложной конструкцией не всегда позволяет достаточно надежно представить те понятия и их смысл, которые авторы пытаются описать с помощью рекомбинантных мемов. По своему языку и стилю такие описания нередко напоминают известные произведения А. Платонова «Котлован» и «Чевенгур». Приведем одно из подобных описаний содержащихся на стр. 30 диссертации «Клиника и дифференциальная диагностика инфекционых экзантем у детей», 14.00.09 – педиатрия, 14.00.10 – инфекционные болезни, 1998 г. и сделаем попытку его анализа. «Для определения значимости выборочных показателей, оценки сущности двух или нескольких показателей, а также определения связи между явлениями, полученных (так в тексте, выделено нами – В.Л.) в результате выборочных иследований, были использованы следующие формулы: «...(далее идут формулы ошибки среднего, среднеквадратичного отклонения и t-критерия Стьюдента – В.Л.). Итак, каков же смысл первого утверждения – «определение значимости выборочных показателей»? Предположим, что из выборки в 50 наблюдений мы получили выборочный показатель – среднее арифметическое значение систолического давления равное 90 мм рт ст. Что в таком случае мы должны понимать, согласно автору, под «значимостью выборочного показателя»? Как предлагает автор «оценить сущность двух или нескольких показателей», например того же среднего систолического и диастолического давления, содержания иммуноглобулинов, СОЭ и т.д. и какой смысл вкладывает автор в термин «сущность»? Не ясно и то, как собирается автор «определять связи между явлениями», поскольку ни в приводимых ниже формулах, ни в тексте диссертации об этом ничего не сказано. Продолжим авторский текст: «Пределы возможных колебаний (доверительные интервалы) средних величин, полученные в выборочном исследовании принимались равными удвоенной средней ошибке (+ 2m), что дает основание с вероятностью 95% отнести полученную закономерность ко всей генеральной совокупности». Итак, в первой половине этого предложения автор пытается объяснить технологию построения им 95%-ных доверительных интервалов. Однако из его объяснения не ясно, какой смысл имеет величина (+ 2m). Является ли это величина шириной 95%-ного доверительного интервала, либо же это полуширина, и тогда полная ширина доверительного интервала равна 4m? Остановимся на первой версии, согласно которой весь доверительный интервал равен 2m. В этом случае, принимая что данный интервал является симметричным (на это указывает нам используемый автором критерий Стьюдента, а стало быть распределение вероятностей подчиняется нормальному закону), получим, что левая граница интервала будет равна (Хср. = –1m), а правая граница интервала будет равна (Хср. = + 1m). Тогда полуширина доверительного интервала будет равна 1m. Но тогда для построения 95%-ного двустороннего доверительного интервала необходимо использовать квантиль уровня 0,975, который не может быть равен 1 даже для таких объемов выборок, которые равны нескольким сотням и тысячам. Так для бесконечно большого объема выборки он равен 1, 96, для выборки объемом 60 наблюдений соответствующий t-квантиль распределения Стьюдента будет равен 2. Но в этом случае вся ширина для 95%-ного доверительного интервала будет равна учетверненному значению m, а не удвоенному. Итак, какой же доверительный интервал строит диссертант и для каких обхемов выборок? Не меньше вопросов возникает и при изучении второй половины данного предложения, в которой речь идет о «полученной закономерности», поскольку ранее нигде автор ничего не говорит ни о видах закономерностей, ни о методах их оценки.

Рассмотрим еще один пример такого сложного мема, синтезированного из нескольких субмемов. «Полученные результаты обработаны методом вариационной статистики с применением t-критерия Стьюдента, x2 и метода ранжирования непараметрических данных (статья «Особенности терапии верапамилом, нитратами и корватоном у больных со стенокардией в сочетании с гипотонией», Сибирский медицинский журнал, №2, 1996 г., стр. 26.). Первая часть этого мема сообщает об использовании вариационной статистики. Хотя это название и является уже устаревшим (см. например, книгу П.Ф. Рокицкого «Биологическая статистика» (1973 г.), где он объясняет свой отказ от прежнего названия «Вариационная статистика»), однако само по себе оно не конфликтует с остальным содержанием мема и статьи. Однако упоминание о t-критерии Стьюдента уже требует выполнения двух обязательных условий, о чем ни в данном меме, ни в самом тексте статьи ничего не сообщается. Из чего можно сделать достаточно обоснованное предположение о том, что авторы не проверяли эти условия. Далее, обратимся к результатам проверки гипотез о равенстве средних в группах, приведенным в таблицах 1...3 на стр. 29. В табл. 1 речь идет о числе приступов стенокардии, т.е. о дискретной величине. Такая же дискретная величина и в табл.3 – число гипоперфузируемых сегментов. По причине дискретности этих величин, имеющих достаточно ограниченное число значений, применение t-критерия Стьюдента невозможно. И только в табл. 2 речь идет о непрерывной величине – продолжительности (времени) пороговой нагрузки, и поэтому в принципе, при выполнении известных ограничений, в данном случае применение t-критерия Стьюдента возможно. Однако остается вопрос, как же проверялись гипотезы в табл. 1 и 3? В анализируемом меме после t-критерия Стьюдента речь идет о критерии «Х-квадрат». Предполагая, что при наборе текста вместо греческой буквы «χ» была набрана латинская буква «Х», можно далее предположить, что здесь речь идет о критерии «χ2». Однако этот критерий не используется для проверки подобных гипотез. Неясно тогда и какие же гипотзе и в каких случаях проверялись с его помощью, поскольку в тексте статьи о них ничего не сообщается. Далее в тексте мема упоминается «метод ранжирований непараметрических данных». Что такое «непараметрические данные» видимо известно только кому-то из 8 соавторов этой статьи. Поскольку и в «вариационной статистике», как и в математической статистике, отсутствует такое понятие, как «непараметрические данные» [107, 108]. Итак, какими же статистическими критериями получены выводы в табл. 1 и 3 и что такое «непараметрические данные»?

Еще один пример мема не поддающегося анализу. «Для исследования соотношения определяемых факторов использовался многоуровневый корреляционный анализ» – стр. 21 диссертации «Состояние местного иммунитета при язвенной болезни», 14.00.05 – внутренние болезни, 1994 г. Ни контекст этого мема, ни содержание диссертации никак не расшифровывают, что подразумевал диссертант под «многоуровневым корреляционным анализом». Можно предположить, что корреляционный анализ выполнялся последовательно на разных уровнях (в разных иерархически расположенных группах) и затем коэффициенты корреляции для одних и тех же пар признаков разных уровней сравнивались между собой. Однако изложенные в диссертации результаты исследования не содержат ни таких уровней, ни сравнения разноуровневых коэффициентов корреляции.

Во многих работах само понятие «закономерности» для авторов ассоциировало с понятием функции и функциональной связи. В частности, нередко в тех местах своего описания, где автор вел речь об оценке зависимостей между различными изучаемыми показателями, наблюдались рекомбинации со словосочетаниями «функциональная зависимость» или «функциональная связь». «Функциональная зависимость между показателями определялась с помощью корреляционного и регрессионного анализа» – стр. 46 диссертации «Функции почек и водно-солевой баланс у крыс при гипо- и гиперосмии в динамике беременности», 14.00.17 – нормальная физиология, 1992 г. «Функциональная связь при коэффициенте корреляции ® до 0,5 оценивалась как слабая, 0,5 – 0,7 средняя, 0,7 – 0,9 сильная и от 0,9 до 1,0 как тесная» – стр. 50 диссертации «Особенности регуляторно-метаболических параметров иммунокомпетентных клеток крови у лиц с разным соматотипом», 14.00.17 – нормальная физиология, 1997 г. Элементарное представление о функции сейчас изучается в начальной школе. Обратимся к статье «Функция» в «Советском энциклопедическом словаре» (1982 г., стр. 1449): «Функция (матем.), 1) зависимая переменная величина. 2) Соответствие y = f(x) между переменными величинами, в силу которого каждому рассматриваемому значению некоторой величины х (аргумента, или независимого переменного) соответствует определенное значение другой величины y (зависимой переменной, или функции). Такое соответствие может быть задано различным образом, например, формулой, графически или таблицей (типа таблицы логарифмов).» Теперь обратимся к статье «Корреляция» на стр. 642 этого же словаря: «Корреляция (в матем. статистике), вероятностная или статистическая зависимость. В отличие от функциональной зависимости корреляция возникает тогда, когда зависимость одного из признаков от другого осложняется наличием ряда случайных факторов». Аналогичным же образом определяется этот термин и в «Статистическом словаре» (1989 г., стр. 213): «Корреляция – зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой».

Итак, функциональная зависимость и корреляционная или регрессионная зависимости являются антиподами. В живых организмах, как наиболее сложных природных творениях, практически не встречаются функциональные зависимости в чистом виде, а преобладают именно вероятностные, статистические. И именно по этой причине столь необходима прикладная статистика как инструмент исследования в биомедицине.

Наиболее частая конструкция рекомбинированного мема описания состоит из двух или трех ядер. В одном из них, обычно в первом ядре, упоминается сам факт использования ЭВМ или персонального компьютера. В следующем ядре упоминается название одного или нескольких статистических методов. И завершает эту конструкцию упоминание названия статистического пакета. Как правило, при использовании подобных рекомбинированных мемов далее в тексте авторы уже не возвращаются к их содержимому. Например, выше мы уже упоминали статью «Использование эссенциальных фосфолипидов в лечении больных ишемической болезнью сердца и инсулиннезависимым сахарным диабетом» (Кардиология, 1996, №1, стр. 30...33), где все описание имеет следующий вид (стр. 31): «Полученные данные обрабатывали на ЭВМ методами многомерной статистики». Однако отсутствие в тексте статьи даже намеков на эти самые «многомерные методы» и обсуждения результатов их применения, позволяют высказать вполне обоснованное предположение о том, что данное описание является не более чем камуфляжным мемом. Наличие таких мемов в статьях журнала «Кардиология» не является какой-то редкостью, несмотря на требования самой редакции журнала о детальном описании авторами статей использованных ими статистических методов.

Локализация мемов внутри научных школ

Описания, приведенные в следующих 2 кандидатских и 3 докторских диссертациях представляют особый интерес. Четыре из них относятся к одной и той же научной специальности 14.00.17 – нормальная физиология, а 5-я диссертация защищена по близкой специальности 14.00.16 – пат. физиология. Интересно и то, что, один и тот же человек выступает в роли научного руководителя в кандидатских диссертациях и в роли научного консультанта в докторских диссертациях. Автор же докторской диссертации №8 выступает в качестве научного руководителя в кандидатской диссертации №7. Все это позволяет говорить о принадлежности диссертантов к одной научной школе. Более того, как видно из приведенных ниже наименований этих работ, они достаточно близки и по следующим элементам:

  • срокам выполнения работ: – 1992 г., 1993 г., 1994 г. и 1995г;
  • объектам исследования;
  • структуре названия работ – в трех диссертациях одно и то же первое слово, а в двух диссертациях полностью совпадают первые четыре слова.

Ниже приведены названия данных работ, научная специальность и год защиты этих диссертаций.

Диссертация №7 – Роль поджелудочной железы в регуляции антитрипсиновой и трипсиновой активности крови. Канд. диссер., 14.00.17 – нормальная физиология. 1992 г.

Диссертация №8 – Роль трипсина в регуляции моторной функции тонкой кишки. Докт. дисс., 14.00.17 – нормальная физиология. 1992 г.

Диссертация №9 – Роль поджелудочной железы в регуляции состояния калликреин-кининовой системы крови. Канд. диссер., 14.00.17 – нормальная физиология. 1993 г.

Диссертация №10 – Функционирование калликреин-кининовой системы крови в норме и при патологии. Докт.. дисс., 14.00.16 – пат. физиология. 1995 г.

Диссертация №11 – Механизмы образования и деградации надэпителиального слизистого слоя пищеварительного тракта. Докт. диссер., 14.00.17 – нормальная физиология. 1994 г.

Таблица 4.

Описание из диссертации №7 [стр. 35]Описание из диссертации №8 [стр. 49]Описание из диссертации №9 [стр. 39]Описание из диссертации №10 [стр. 59]Описание из диссертации №11 [стр. 68]
Достоверными считались отличия с уровнем доверительной вероятности
p < 0,05
Достоверными считались отличия с уровнем доверительной вероятности
p < 0,05
Достоверными считались отличия с уровнем доверительной вероятности
p < 0,05
Достоверными считались отличия с уровнем доверительной вероятности
p < 0,05
Достоверными считали различия с уровнем доверительной вероятности
p < 0,05

Все это позволяет сделать вывод о том, что в этой научной школе прочно закрепился и культивируется данный мем ошибочного понимания и описания самого смысла доверительной вероятности. Для того, чтобы это утверждение было осознано и понято читателями даже далекими от прикладной статистики, приведем цитаты касающиеся понятия доверительной вероятности из нескольких популярных книг по статистике (с указанием страницы, на которой расположена цитата), и далее сравним их с анализируемым мемом. Жирным шрифтом и цветом выделим ту часть цитат, которая будет наиболее важна для нашего последующего анализа.

«Доверительная вероятность – вероятность того, что оцениваемый вектор характеристики (параметров) совокупности генеральной накрывается доверительной областью (доверительным интервалом – оценкой интервальной при одном параметре). Доверительная вероятность должна быть достаточно большой, т.е. отвечать принципу практической достоверности. Другие названия: надежность доверительной области, доверительный коэффициент.» – Статистический словарь. М.: Финансы и статистика, – 1989, стр. 117...118.

«А теперь рассмотрим интервальные оценки, т.е. возможность, исходя из выборочных значений x1, x2,...xn, построения некоторого интервала, содержащего истинное значение параметра Q с заданной вероятностью. Метод получения таких интервалов сводится к построению нижнего и верхнего доверительных пределов Qн и Qв (Qн и Qв есть функции от выборочных значений), и если мы говорим, что истинное значение параметра лежит между этими доверительными пределами, то это утверждение выполняется с вероятностью (1 – e) и не выполняется с вероятностью e (число (1 – e) называется доверительным уровнем), Следовательно, выбрав достаточно малое число (обычно в биологических задачах 0,05 или 0,01), мы по выборочным значениям x1, x2,...xn, построим доверительный интервал (Qн, Qв), соответствующий доверительному уровню 1 – e. Обычно строят так называемые центральные доверительные интервалы. Очень часто, когда доверительный уровень измеряется в процентах, применяется термин 100(1 – e)%-ный интервал (например, 95%-ный доверительный интервал confidence interval, если 1 – e = 0,95).» – Компьютерная биометрика / Под ред. В.Н. Носова. – М.: Изд-во МГУ, 1990, стр. 44.

«Значительно более глубокое утверждение, чем в случае точечной оценки, можно сделать, оценивая доверительный интервал. Доверительный интервал вычисляется по данным из некоторой выборки; фиксированная величина параметра ансамбля заключена между границами этого интервала, называемыми доверительными пределами, с некоторой заданной степенью достоверности, называемой доверительной вероятностью.» – Д. Химмельблау. Анализ процессов статистическими методами. М.: Мир, 1973, стр. 124.

«Доверительный коэффициент – вероятность того, что случайно выбранный интервал из совокупности всех возможных доверительных интервалов, будет содержать искомый параметр. В примере доверительный коэффициент был равен 0,90. Иначе говоря: «Был построен доверительный интервал с доверительным коэффициентом 0,90». В конце концов мы говорим о построении доверительного интервала в окрестности выборочной статистики и для параметра, поскольку в данной совокупности параметр принимает только одно значение. Например,

доверительный интервал для М в окрестности Xср.» – Дж. Гласс, Дж. Стэнли. Статистические методы в педагогике и психологии. М.: Прогресс, 1976, стр. 236.

«В этом параграфе мы рассмотрим вопрос получения интервальных оценок, т.е. возможность построения некоторого интервала, содержащего истинное значение параметра с заданной точностью. Сам метод получения таких интервалов сводится к построению так называемых доверительных пределов, а полученные интервалы называются доверительными. Процедура, которую мы собираемся описать в этом параграфе, состоит в построении нижнего и верхнего доверительных пределов уровня (1 – а), обладающих следующим свойством: если мы говорим, что истинное значение параметра лежит между этими пределами, то это утверждение верно с вероятностью 1 – а (и неверно с вероятностью а). Очевидно, что а следует выбирать достаточно малым (обычно используемые значения равны 0,05 и 0,01). Число 1 – а называют коэффициентом доверия или доверительной вероятностью». – К.А. Браунли. Статистическая теория и методология в науке и технике. М.: Наука, 1977, стр. 114.

Закончим этот экскурс в описание понятия доверительной вероятности, часто цитируемым в биомедицинских публикациях учебным пособием Г.Ф. Лакина «Биометрия», М.: Высшая школа, 1990, стр. 106. «Вероятности, признанные достаточными для уверенного суждения о генеральных параметрах на основании известных выборочных показателей, называют доверительными вероятностями. Понятие о доверительных вероятностях предложено Р. Фишером. Оно вытекает из принципа, который положен в основу применения теории вероятностей к решению практических задач. Согласно этому принципу, маловероятные события считают практически невозможными, а события, вероятность которых близка к единице, принимают за почти достоверные. Обычно в качестве доверительных используют вероятности Р1 = 0,95; Р2 = 0,99; Р3 = 0,999

Итак, основной акцент, который делается во всех этих цитатах, заключается в том, что величина доверительной вероятности, т.е. степени нашей уверенности в декларируемых утверждениях, должна быть достаточно близка к 1. В противном же случае, если эта величина близка к нулю, теряется ее смысл как степени уверенности, доверия к этим утверждениям. Таким образом, 5 авторов использовавших приведенный выше мем, утверждали, что степень их уверенности в своих выводах не более 5%! Наличие подобного растиражированного мема означает и то, что это утверждение не смутило никого из руководителей и консультантов этих диссертаций, ни представителей ведущих организаций, ни оппонентов, ни экспертов ВАК РФ. Таким образом, «экологическая ниша», где циркулирует данный мем, гораздо шире! Напомним, что эти утверждения приведены не в дипломных работах выпускников вуза, а в квалификационных работах на ученые степени кандидатов и докторов медицинских и биологических наук, авторы которых уже имели не одну печатную публикацию, а некоторые из них уже не первый год читают лекции студентам. Поэтому сомнительно, что приведенные мемы есть результат неточного изложения авторами своих мыслей. Скорее наоборот, что данные мемы и есть адекватное отображение устоявшегося у авторов искаженного представления о доверительной вероятности.

Анализ многих публикаций, авторы которых принадлежат одной научной школе или связаны каким либо иным образом, обнаружил присутствие в таких группах некоторого пула мемов, относящихся либо к наиболее популярным в этих группах статистическим методам, либо к их описанию. Нередко в диссертациях таких авторов обнаруживается практически дословное совпадение используемых мемов. Ниже приведено описание использованных в работе статистических методов, включающие следующие последовательно друг за другом три предложения из кандидатской диссертации №12 «Гормонально-иммунологические параллели у детей с аллергическим поражением кожи и органов дыхания», 14.00.09 – педиатрия, 1994 г.

Таблица 5.

Описание из диссертации №12, [стр. 31]
Статистическая обработка полученных результатов проводилась на основе банка данных, доступ к которому реализован через пакеты программ «Ребус» и «Statgrafiks».
В тех случаях, когда распределение выборочной совокупности исследуемых показателей было близким к нормальному (выполнялось неравенство П.Л. Чебышова) проверка значимости различий средних осуществлялась по критерию Стьюдента или квантилю t нормального распределения.
Достоверность уравнений регрессии оценивалась по критерию Фишера (F).

В качестве ядра первого мема можно выделить словосочетание «на основе банка данных, доступ к которому реализован через пакеты программ», которое мы встречали потом несколько раз в других, более поздних диссертациях. Ядро второго мема «неравенство П.Л. Чебышева» также встречалось в других публикациях. Отметим, что в одной из них, датированной 1995 г., полностью воспроизводились все три предложения, включая и ошибочное написание популярного статистического пакета: Statgrafiks вместо Statgraphics. Далее на стр. 31 этой же диссертации читаем: «Для определения информативности маркеров использован факторный анализ [46]. Клинико-иммунологическая классификация больных в трехмерном пространстве признаков проведена методом кластерного анализа [1,4].» Однако ни в тексте диссертации, ни в таблицах, ни в обсуждении результатов и ни в «Заключении» не обнаруживаются никакие явные или косвенные признаки применения факторного и кластерного анализов.

В том эшелоне публикаций, который был нами проанализирован, можно достаточно надежно утвердать, что в каждой научной школе циркулирует свой, характерный именно ей пул мемов. Нередко подобный пул мемов переходит из одной публикации в другую вместе с тем соавтором, который по мнению авторского коллектива является наиболее подготовленным в этой области. Эта достаточно устойчивая популяция меметических описаний определяется несколькими причинами. Можно выделить два наиболее важных фактора формирования этого пула мемов. Во-первых, это эталоны в виде статейных публикаций и диссертаций научных руководителей этих школ и подразделений. Именно они своим уровнем требований к собственным работам и работам своих учеников задают рабочий вектор используемых методов анализа экспериментальных данных. Мы неоднократно наблюдали положительную корреляцию между качеством анализа данных в диссертации научного руководителя или консультанта, и качеством анализа данных в руководимой или консультируемой им кандидатской диссертации. В качестве примера такой связи можно назвать две диссертации, которые могут служить хорошим эталоном использования современных методов прикладной статистики в биомедицинских исследованиях. Первая работа, это докторская диссертация Канской Н.В. по теме «Роль взаимосвязи дислипопроидемий и иммунологических нарушений в патогенезе коронарного атеросклероза», 14.00.16 – пат. физиология, 15.00.04 – биохимия, НИИ кардиологии ТНЦ РАМН, Томск, 1990 г. В данной работе использовано порядка десятка разнообразных статистических методов, и в том числе такие как дискриминантный и кластерный анализ. Следующая работа, где доктор мед. наук Канская Н.В. была научным консультантом, – кандидатская диссертация Горленко Л.В. по теме «Влияние патологии гепатобилиарной системы на возникновение и развитие атерогенных нарушений у детей», 14.00.09 – педиатрия, 14.00.04 – биохимия, НИИ Кардиологии ТНЦ РАМН, Томск, 1996 г. В данной диссертации, как и в предыдущей, также использован достаточно широкий спектр статистических методов и критериев, включая критерии Вилкоксона и Крускала-Уоллиса и такие многомерные методы статистики, как факторный и кластерный анализ. Отметим, что в данных работах использованные методы и критерии гармонично входят в ткань задач исследования и являются естественным и логичным продолжением грамотно сформулированных целей исследования. Немаловажным фактором формирования этого пула являются и статьи по данному научному направлению, публикуемые в профильных периодических журналах и трудах конференций.

Анализ разнообразных мемов, близких по своим конструкциям, подтверждает идеи высказанные В.В. Налимовым в своих работах [109, 110] о вероятностном распределении смыслов. Действительно, семантика анализируемых мемов определяется вероятностным распределением смыслов отдельных составных частей мема. Причем, одни и те же элементы мемов не обязательно имеют унимодальное (одновершинное) распределение плотности вероятности. Наиболее типичный пример такого тримодального распределения – это восприятие величины «p <» следующим образом:

  1. как уровня значимости;
  2. как доверительной вероятности;
  3. как абсолютной точности.


Часть 5

Оглавление

 

Дата публикации:

15 августа 1999 года

Электронная версия:

© НиТ. Текущие публикации, 1997



В начало сайта | Книги | Статьи | Журналы | Нобелевские лауреаты | Издания НиТ | Подписка
Карта сайта | Cовместные проекты | Журнал «Сумбур» | Игумен Валериан | Техническая библиотека
© МОО «Наука и техника», 1997...2013
Об организацииАудиторияСвязаться с намиРазместить рекламуПравовая информация
Яндекс цитирования