![]() |
Часть
учебно-методических материалов сайта, в том числе электронная библиотека, доступны только заказчикам работ по анализу данных для кандидатских и докторских диссертаций, а также слушателям системы дистанционного обучения и консультаций. Запрос на
выполнение анализа данных, обучение и консультации направляйте на мэйл |
Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
Отклики читателей статьи "Доказательная или сомнительная?"
Доклад на Международной конференции по доказательной медицине в Ереване (18 - 20.10.2012)
КУНСТКАМЕРА
Дисперсия жизни...
Кликните по фотографии, и вы сможете ... |
На белую страницу
строчка ляжет - И вашу мысль увидят и прочтут. ... Как часто эти найденные строки Для нас таят бесценные уроки. У. Шекспир. Сонет 77
Вырази ложную мысль ясно, И она сама себя опровергнет. Л. Вовенарг
В начале 2001 г. был объявлен конкурс
на эпиграфы к разделу "КУНСТКАМЕРА". За два месяца читатели прислали более
50 эпиграфов... (дальше...) |
За то время, что прошло с начала работы "Биометрики", многие наши читатели в своих письмах спрашивали меня, когда же откроется "Кунсткамера"? Автор не спешил с наполнением этого раздела по разным причинам...(дальше...) |
Диссертант - Кравченко Инесса Вячеславовна, специальность 03.00.16 - ЭКОЛОГИЯ.
Научный руководитель: доктор биологических наук, профессор, Л.Ф. Шепелева.
Научный консультант: доцент Н.П. Баранов.
Государственное образовательное учреждение Высшего профессионального образования
"Сургутский государственный университет Ханты-Мансийский автономный округ", Сургут - 2005 г.
![]() |
![]() |
![]() |
![]() |
Данная работа является типичным исследованием, проводимым на небольшом объёме наблюдений с помощью некорректных статистических манипуляций. Очевидна несоразмерность большой подготовительной работы для получения анализируемых величин, и примитивнейшего статистического анализа выполненного с явными нарушениями. В итоге вместо интересных и полезных сведений получены достаточно тривиальные выводы, надёжность которых весьма сомнительна. На стр. 57-58 диссертант сообщает, что "Статистическую обработку данных проводили с использованием компьютерной программы MSExcel. Вычисляли среднюю, стандартную ошибку ( критерий Стьюдента), коэффициент вариации. Различия между изучаемыми параметрами считали достоверными при Р <0,05 ". Как следует из приведённой выше цитаты, диссертант считает идентичными понятия стандартной ошибки и критерия Стьюдента. Уже только этот симтоматичный факт, должен был насторожить всех принимавших непосредственное участие в оценке научных выводов диссертации, и которые, согласно п. 14 раздел 3 «Положения о присуждении учёных степеней", должны были дать заключение о том, какова "... степень достоверности результатов проведенных исследований, их новизна и практическая значимость, ценность научных работ соискателя ...". А это руководители университета, в котором проводят предварительную экспертизу диссертации, оппоненты, рецензенты, ведущая организация, и, конечно же, члены экспертного Совета ВАК РФ. В этой связи настораживает тот факт, что, как написано на стр. 6 диссертации, апробация работы проходила на 6 различных конференциях. В то же время ничего не сообщается о результатах апробации на профильных кафедрах СурГУ. |
![]() |
На стр.58 диссертант сообщает, что "С целью выявления корреляционных связей между уровнем концентрации загрязняемых веществ и микронутриентным статусом до и после коррекции применялся критерий Пирсона (r)". Судя по всему диссертант подразумевает не критерий Пирсона, а коэффициент корреляции Пирсона, что достаточно красноречиво говорит об уровне владения диссертантом статистической терминологией. |
![]() |
В работе имеется много выражений вида "0,60 ± 0,01". Диссертант не объясняет, какие именно величины соединены знаком ± . Впрочем, из контекста можно понять, что первая величина является средней, а относительно второй величины, стоящей непосредственно после знака ± можно лишь догадываться. Будем исходить из того, что это ошибка среднего, поскольку именно об этой величине диссертант упоминал на стр. 57. В чём же основные некорректности описанного в диссертации статистического анализа? При использовании t-критерия для непрерывных количественных величин, должны выполняться два ограничения. В частности, анализируемые случайные величины должны подчиняться нормальному распределению, а их генеральные дисперсии в двух сравниваемых совокупностях должны быть равны. Процитируем выдержку из книги [1] со стр. 128, где говорится об этих двух ограничениях при использовании t-критерия Стьюдента: " Критерий сравнения средних значений в двух нормальных совокупностях ("двухвыборочный t-критерий"). Проверка гипотезы H: µx = µy о равенстве средних значений µx и µy двух нормальных генеральных совокупностей с равными, но неизвестными дисперсиями |
И как мы покажем далее, этот вывод подтвержается не только отсутствием проверок указанных ограничений, но и многими другими деталями, приводимыми в самой диссертации. Автор этих строк принимал непосредственное участие в анализе массива данных из нескольких сотен наблюдений, полученного при обследовании детей в г. Иркутске. Эти данные включали среди прочего, содержание микроэлементов в моче, волосах и крови детей разного возраста и пола. Часть результатов статистического анализа этого массива данных представлена в диссертации на соискание учёной степени д-ра биол. наук Осиповой Е.В. "Закономерности метаболических реакций у детей с различной функциональной активностью полушарий головного мозга при неврологических синдромах. Иркутск, 2005, 250 с.". Анализ массива в подгруппах по возрасту и полу показал, что примерно в половине групп сравнения распределение содержания микроэлементов не подчиняется нормальному закону. Как правило, такие распределения имели ярко выраженную асимметрию. Ниже приведены две гистограммы распределения для натрия и калия в моче. Следует отметить, что для некоторых количественных показателей, описывающих состояние человеческого организма, изначально присуще асимметричное распределение. Мой многолетний опыт статистического анализа биомедицинских данных говорит о том, что для тех переменных, которые для здорового организма имеют нормальное (таких показателей обычно не более 15-20%), или распределение близкое к нормальному, при отклонении от здорового состояния наблюдается деформация нормального распределения. Чаще всего это проявляется в значительном увеличении размаха изменения этой величины, и, соответственно, дисперсии, а также в появлении левой или правой асимметричности распределения. |
![]() |
![]() |
Поэтому нет никаких оснований считать, что в данной диссертации абсолютно для всех переменных и во всех сравниваемых группах наблюдалось нормальное распределение. Скорее всего диссертант просто не знает о том, что t-критерий Стьюдента имеет данное ограничение. |
На этих же гистограмма отчётливо видно и то, что для больных пациентов характерно увеличение размаха изменения содержания натрия и калия. Ниже приведены графики распределения средних значений, на которых видно, что вследствие большей дисперсии доверительный интервал для среднего в группах больных больше, чем в группах здоровых (объёмы групп были равны). |
![]() |
![]() |
![]() |
Таким образом, вызывает большое сомнение и выполнение второго ограничения правомерности использования t-критерия Стьюдента - равенства генеральных дисперсий в двух сравниваемых группах. Не меньше вопросов возникает и при чтении тех страниц диссертации, где автор приводит многочисленные значения средних величин анализируемых показателей у школьников разных классов и разных школ, приводя тут же и интервал значений этих показателей в норме. Так на стр. 71 автор пишет: "Школа № 32. У детей 1-х кл. уровень обеспеченности аскорбиновой кислотой составил в среднем 0,60 ± 0,01 мг/час, у школьников 6- кл. - 0,33 ± 0,01 мг/час, 10-х кл. - 0,15 ± 0,01 мг/час при норме 0,7 - 1,0 мг/час. Различия между показателями обеспеченности аскорбиновой кислотой, рибофлавином, В6, РР, В1 у школьников 1-х, 6-х, 10-х кл. из контрольного района и территориями исследования статистически достоверны (Р < 0,001) (табл. 12, рис. 12-14). Обратим внимание на то, что на этой странице впервые диссертант приводит значение Р < 0,001 , никак не уточняя при этом используемый статистический критерий. |
![]() |
Приведём цитату со стр. 17 данной диссертации. "Для анализа волос имеет значение возраст, пол, раса, цвет волос, место постоянного жительства, национальность, настоящее и прежнее место проживания, используемая кометика, приём медикаментов и средств ухода за волосами, кухонная посуда, моющие и чистящие средства [17, 130, 145, 188]". Как можно судить по тексту диссертации, большая часть этих факторов никак не учитывалась. Очевидно, что для учёта кроме возраста и места проживания, всех остальных упомянутых факторов, необходимо было использовать не по 10-30 наблюдений в каждой из сравниваемых подгрупп, а гораздо больше. Поэтому не случайно на стр. 70-80 уже нет упоминаний ни пола школьников, ни цвета волос и т.д.
|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Рассмотрим данные приведённые в таблице 12 (стр 91). В частности, проверим выполнение второго условия - равенство генеральных дисперсий в двух сравниваемых группах. Будем считать, что величина стоящая после знака ± является ошибкой среднего. Имея эти величины, а также объёмы наблюдений в каждой из двух групп, в предположении нормальности распределения, вычислим величину F-критерия Фишера-Снедекора а затем и достигнутый уровень статистической значимости для этого критерия. Все вычисления проведём в пакете MS EXCEL, который использовал диссертант. Полученные при этом результаты представим ниже в виде отдельной таблицы 12F. |
Результаты проверки нулевой статистической гипотезы о равенстве генеральных дисперсий в группах до и после витаминизации (таблица 12 F)
|
F-критерий Фишера-Снедекора равен отношению большей дисперсии к меньшей дисперсии. В свою очередь, дисперсию можно вычислить из ошибки среднего и объёма наблюдений по формуле: S2=m2*n, где S2 - дисперсия, m - ошибка среднего, n - объём наблюдений в группе. Для вычисления достигнутого уровня статистической значимости "р" используем в пакете EXCEL встроенную функцию распределения Фишера. Слева в таблице 12F в приведены значения рассчитанных нами критериев Фишера-Снедекора и уровней значимости "р". |
![]() |
Как видим, из 15 пар лишь для двух пар можно принять статистическую гипотезу о равенстве двух генеральных дисперсий в сравниваемых группах (при условии, если в обеих группах наблюдается нормальное распределение). В остальных 13 парах эта гипотеза отвергается, что говорит о некорректности использования в этом случае t-критерия Стьюдента. (см. "Проблема Беренса-Фишера"). Аналогичные результаты получены и для таблиц 13, 14, 15, 16, 17, 23, 24, 25, 26, 27 и 28. Предлагаем читателям самим убедиться в этом, поскольку выполнение этой процедуры в пакете EXCEL не представляет особых сложностей. |
![]() |
![]() |
![]() |
![]() |
|
|
Продолжим изучение результатов статистического анализа, полученных в данной диссертации. Обратимся к таблицам 23, 24, 25, 26, 27 и 28. Выше мы уже говорили о том, что проверка статистической гипотезы о равенстве двух генеральных дисперсий в этих таблицах дала для подавляющего большинства пар групп отрицательный результат. Кроме значений средних, ошибок средних, коэффициентов вариации V и объёмов наблюдений в сравниваемых группах, в этих таблицах приведены значения t-критерия Стьюдента, а также значения уровня статистической значимости для данной величины этого критерия. Для человека, мало-мальски знакомого с этим критерием, не может не броситься в глаза явное несоответствие между величиной t-критерия Стьюдента (предпоследний столбец таблиц 23-28), и теми уровнями значимости, которые отвечают приведённым значениям t-критерия Стьюдента. Напомним нашим читателям, что t-распределение Стьюдента имеет параметр "число степеней свободы" (df), которое при проверке обсуждаемой гипотезы равно: df= n1+ n2 - 2. Слева, в таблице 23t в первом столбце приведены значения t-критерия Стьюдента, заимствованные из табл. 23 диссертации Кравченко И.В., во втором столбце таблице 23t приведены значения числа степеней свободы df, в третьем - значения уровня значимости полученные диссертантом (в примечании к табл. 23 автор называет их "достоверностью" (см. статью Н. Зорина " О неправильном употреблении термина "достоверность" в российских научных психиатрических и общемедицинских статьях" ). В 4-м столбце мы приводим значение достигнутого уровня статистической значимости, вычисленные в пакете EXCEL (для двусторонней альтернативной гипотезы), а в 5-м столбце - "р"-значения, вычисленные в пакете STATISTICA (для двусторонней альтернативной гипотезы). Аналогичные результат, которые мы здесь не приводим, получены и для таблиц 24-28. |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Таким образом, приведённые выше результаты критического анализа статистических манипуляций диссертанта позволяют вполне обоснованно усомниться в том, что в данной работе выполнены требования действующего "Положения о порядке присуждения научным и научно-педагогическим работникам ученых степеней" ВАК РФ, в частности, изложенные в разделах 2-3: «Раздел 2. Критерии, которым должны отвечать диссертации, представленные на соискание ученой степени. … п. 8. Диссертация на соискание ученой степени кандидата наук должна быть научно–квалификационной работой, в которой содержится решение задачи, имеющей существенное значение для соответствующей отрасли знаний, либо изложены научно обоснованные технические, экономические или технологические разработки, имеющие существенное значение для экономики или обеспечения обороноспособности страны». П. 9. «Диссертация должна быть написана единолично, содержать совокупность новых научных результатов и положений, выдвигаемых автором для публичной защиты, иметь внутреннее единство и свидетельствовать о личном вкладе автора в науку. Предложенные автором новые решения должны быть строго аргументированы и критически оценены по сравнению с другими известными решениями». В п. 14 раздела 3 "Положения ..." говорится следующее: «Организация, где выполнялась диссертация или к которой был прикреплен соискатель, проводит предварительную экспертизу диссертации и даёт по ней заключение, в котором должны быть отражены личное участие автора в получении результатов, изложенных в диссертации, степень достоверности результатов проведенных исследований ... . ». Иными словами, ответственность за некорректное использование диссертантом методов статистики, лежит не только на самом диссертанте, как авторе исследования, но и на той организации, где выполнялось данное исследование, и которая проводила экспертизу диссертации, и давала заключение о степени достоверности результатов. |
Быть может Сургутский государственный университет не располагает квалифицированными кадрами, которые могли бы ещё до этапа защиты провести необходимую оценку корректности рассмотренных выше статистических манипуляций? Сомневаюсь в этом, поскольку в СурГУ есть такие кафедры, как прикладной математики, информатики и вычислительной техники, автоматизированных систем обработки информации и управления. Наконец, при СурГУ есть НИИ природопользования и экологии Севера (директор профессор Зуевский В.П., один из основателей медицинского факультета СурГУ), в структуре которого 9 лабораторий, в т.ч.уже 3 года существует лаборатория комплексного мониторинга загрязнения окружающей среды (заведующий Туров Ю.П., кандидат физико-математических наук). Тематика диссертации непосредственно совпадает с основной тематикой этой лаборатории. Однако в тексте диссертации мы не найдём упоминания о том, что работа прошла апробацию в этих кафедрах и лабораториях. Далее, в Сургутском государственном университете есть лаборатория кибернетики и биофизики сложных систем, которой руководит известный учёный, доктор физико-математических наук, профессор, академик РАЕН Еськов В.М., недавно защитивший блестящую диссертацию на соискание учёной степени доктора биологических наук. Однако и эта лаборатория не упоминается в списке мест, где работа проходила апробацию. Очевидно, что обилие статистических некорректностей в диссертации Кравченко И.В., не позволяет говорить о том, что авторские выводы «научно обоснованы», «строго аргументированы», и "достоверны".А стало быть правомерность присуждения ученой степени кандидата наук, согласно действующему "Положению ... " ВАК РФ может быть оспорена любым лицом в установленном порядке в течение 10 лет с момента присуждения этой степени (если, конечно, данная учёная степень присуждена соискателю). Введение в физику и технологию элементной базы ЭВМ и компьютеров Будем надеяться, что диссертационный Совет, в котором проходила защита данной диссертация, сам даст соответствующую оценку обнаруженных в диссертации некорректностей и сообщит о ней в ВАК РФ, не дожидаясь подобных обращений от других организаций и лиц. Введение в семиотику информационных технологий |
Литература
1. Мюллер П., Нойман П., Шторм Р. Таблицы по математической статистике. - М.: Финансы и статистика, 1982. - 278 с.
1997 - 2019.© Василий
Леонов. E-mail:
Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
Отклики читателей статьи "Доказательная или сомнительная?"
Т. Кун "Структура научных революций"