16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц 14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц 14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страниц 17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц 03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц 30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц 06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц 08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы Если приходят, значит полезное находят.. Наш адрес: |
Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...
|
Полезно:... Пример "ПРОГРАММА РАБОТ по статистическому анализу" ...
На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА рекомендую перейти на файл "Поиски методов или результатов статистического анализа" . |
ОЦЕНКА СТАТИСТИЧЕСКОГО АНАЛИЗА В СТАТЬЯХ ЖУРНАЛА
Введение. Русское слово «статистика» происходит от латинского слова «status» — состояние дел. Данный термин «статистика» ввёл в науку немецкий учёный Готфрид Ахенвалль в 1749 году. В статистических исследованиях используют базы данных с числом признаков гораздо более 1-2. Целью такого исследования является раскрытие сути процессов, отображаемых наборами признаков, путём раскрытие присущих им закономерностей. И поскольку между этими признаками могут существовать разные виды взаимосвязи, а также и разной интенсивности, то в статистическом анализе используются не 1-2 простейших методов, а много самых различных методов. При этом между имеющимися признаками могут быть как парные, так и многомерные взаимосвязи. Естественно, что для продуктивной реализации такого большого набора методов требуется использование профессионализма в данном направлении. При этом взаимосвязи, являющиеся результатами статистического анализа, отображаются не с абсолютно точными утверждениями, а с вероятностями. В медицине, ещё гораздо раньше появления статистики, уже использовались процедуры диагностики, которые описывают состояния больных пациентов большим набором признаков. И они также могут иметь самые разные взаимосвязи с различной интенсивностью. А в медицине профессионализм ещё более важен для лечебной практики. Поскольку установленная диагностика служит основанием для отбора закономерности лечения больных пациентов. По мере развития медицины в ней стали использовать и статистику. Так в 1865 году в Германии впервые появилось издание по медицинской статистике. А затем уже в начале 20-го века в Соединённых Штатах, в Германии и в Англии стали проводить анализ смертности пациентов с помощью статистического анализа. Поэтому не случайно уже в 1908 году в Европе была создана первая лаборатория «Биостатистика». К сожалению, в СССР отношение к статистике долго было отрицательным. Не случайно в одной из энциклопедий, изданной в 60-е годы прошлого века, статистика определялась как «буржуазная лженаука». Поэтому в те времена ВАК СССР не утверждал медицинские диссертации, в которых авторы использовали статистику. Такое отношение к статистике в СССР является одной из важных причин того, что уже более 110 лет России не присваивают Нобелевские премии по медицине и биологии. При том, что по другим направлениям научных исследований эти премии присваиваются российским учёным. Увеличение набора показателей в диагностике состояния пациентов стало расширять использование статистического анализа для оценки важных и сложных закономерностей этих показателей. Поскольку такие новые надёжные закономерности позволяют повышать вероятности более точных диагнозов и технологий лечения пациентов. Реально медицинскую статистику ориентируют на разрешение существующих проблем со здоровьем населения. В частности, на увеличение продолжительности жизни населения, на снижение заболеваемости и смертности, и т.п. Учитывая рост количества диагностических показателей, а также расширение и усложнение методов статистического анализа, медицинским учёным необходимо привлекать к этим исследованиям профессиональных биостатистиков. Поскольку именно такие профессионалы, адекватные по своему уровню профессионализма медицинским исследователям, могут оперативно использовать очень сложные и весьма продуктивные методы статистического анализа. В результате исследователи по медицине смогут оперативно получать очень продуктивные закономерности исследуемых ими зависимостей по используемым диагностическим признакам. Этот нюанс понимают зарубежные исследователи по медицине, и поэтому в тех странах, в которых они получают Нобелевские премии, журнальные публикации по медицинской науке очень часто содержат в списке соавторов как раз профессионалов по статистике. В последние 15-20 лет в России стало увеличиваться количество медицинских исследователей, обращающихся за помощью в статистическом анализе к таким профессионалам. При этом увеличивается и количество медицинских журналов, в которых немало статей с корректными, но примитивными результатами статистического анализа. Но также увеличивается и число статей с существенными ошибками использования статистического анализа. Нетрудно догадаться, какие последствия могут приносить такие ошибки медицинским технологиям. Поскольку эти ошибочные результаты исследований не улучшают, а ухудшают медицинские технологии. Ниже приведены примеры типичных ошибок статистического анализа, опубликованных в статьях журнала "ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ". А далее приводится список рекомендуемых к использованию продуктивных методов статистического анализа в проводимых научных исследованиях. Результаты и их обсуждение. В разделе «Материал и методы» автор статьи «ЧАСТОТА ВСТРЕЧАЕМОСТИ И СОЧЕТАННОСТИ НЕОПЛАСТИЧЕСКИХ ПРОЦЕССОВ ГЕНИТАЛИЙ В ПОСТМЕНОПАУЗАЛЬНОМ ПЕРИОДЕ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2019, Том 12, вып. 2) не сообщает об использовании статистического анализа. В этом же разделе написано следующее. «В исследование были включены 306 женщин с доброкачественными и злокачественными новообразованиями гениталий в постменопаузальном периоде. Средний возраст обследуемых женщин составил (59,3±0,4) года (от 48 до 83 лет)». Однако при этом не уточняется, какие же конкретно параметры соединены знаком " ± ". А в таких выражениях знаком " ± " могут соединяться среднее и ошибка среднего, среднее и стандартное отклонение, среднее и полуширина доверительного интервала, и т.д. Подобные выражения продуктивно отображает лишь те параметры, которые оценивались в наборе значений имеющих симметричное нормальное распределение. Однако в реальных базах данных количественные признаки нормальное распределение имеют не часто. А иные эти распределения чаще всего не являются симметричными. Итак, используя выражение «от 48 до 83 лет» вычислим середину «М» между минимальным 48 и максимальным 83: M = (48+(83-48)/2) = 48 + 17,5 = 65,5. Если бы исследуемые 306 наблюдений имели симметричное распределение, в частности, нормальное, то среднее значение возраста было бы очень близко именно к значению 65,5. На рисунке 1 представлен пример гистограммы нормального распределения, с указанными в статье минимальным и максимальным значениями. Как видим, среднее значение в этом распределении не близко к 59,3. А поскольку значение 59,3 меньше чем 65,5 , то из этого следует, что фактическое распределение возрастов не симметричное. В частности чаще исследуются пациентки с меньшим возрастом, нежели с гораздо большим возрастом.
Рис. 1.
На рисунке 2 представлена примерная гистограмма с подобным асимметричным распределением. Результаты исследований по таким асимметричным базам данных не одинаковы для пациентов с меньшим возрастом (в правой части гистограммы) и с большим возрастом (в левой части гистограммы). Направление и степень асимметричности подобных распределений, следует оценивать вычисляя коэффициент асимметрии Пирсона. Однако фактическое распределение с минимальным 48 и максимальным 83, может также состоять из двух раздельных подгрупп, общее среднее значение в котором также может быть равным 59,3. Рис. 2. На рисунке 3 представлен пример гистограммы с подобным распределением двух раздельных подгрупп.
Результаты исследований по такой базе данных с двумя подгруппами не одинаковы для пациентов с меньшим возрастом (в левой части гистограммы) и с большим возрастом (в правой части гистограммы). Итак, в подобных исследованиях необходимо производить анализы распределения количественных признаков, сообщая при этом в статьях типы установленных распределений. Желательно также отображать распределения таких количественных признаков подобными гистограммами. И приводить выражения типа «59,3±0,4» только для нормальных распределений, уточняя при этом значения двух этих параметров.
Рис. 3. Например, типа «М ± m», где М – среднее, m – ошибка среднего; или «М ± s», где М – среднее, s – стандартное отклонение среднего. Но для распределения, не являющегося нормальным, нельзя приводить подобные выражения. А следует приводить значения медианы, 25%-ной и 75%-ной квартили, выражениями типа «Ме; Q1; Q3». Например, в таком выражении: «62; 59; 71». По данному выражению нетрудно понять наличие асимметричности распределения. Поскольку разность Ме - Q1 = 62 – 59 = 3, а разность Q3 - Ме = 71 – 62 = 9. Т.е. различие между медианой (50%) и 25% составляет всего лишь 3 года. А разность между 75% и медианой (50%) составляет 9 лет. Что как раз и отражает существенную асимметричность распределения. Т.е. в анализируемой базе данных доминирует не средние и не максимальные значения возраста.
Причины отсутствия этой информации могут быть разные. Например, сами авторы не уверены в корректности использования этих методов, и поэтому для повышения доверия читателей к этим публикуемым результатам, не описывают такие детали статистического анализа. Следующими ошибками статистического аспекта в данной статье являются выражения «Достоверность различий, p». Однако, согласно "ГОСТ Р 50779.10-2000 «Статистические методы. Вероятность и основы статистики. Термины и определения», М.: Госстандарт России", подобные выражения являются ошибочными. Подробное описание ошибки использования такого термина приведено в статье "О НЕПРАВИЛЬНОМ УПОТРЕБЛЕНИИ ТЕРМИНА "ДОСТОВЕРНОСТЬ"
В РОССИЙСКИХ НАУЧНЫХ ПСИХИАТРИЧЕСКИХ И
ОБЩЕМЕДИЦИНСКИХ СТАТЬЯХ" (автор: Зорин Н.А.). Т.е. нельзя использовать выражение "Достоверность различий". Аналогичные ошибки описания статистического анализа представлены и в статьях «НЕОПТЕРИН – МАРКЕР АКТИВАЦИИ МАКРОФАГОВ У ДЕТЕЙ С ЗАБОЛЕВАНИЯМИ РЕСПИРАТОРНОЙ СИСТЕМЫ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2019, Том 12, вып. 2), «СПЕЦИФИКА ЛЕЧЕНИЯ СИНДРОМА ВЕСТА ТЕТРАКОЗАКТИДОМ: УРОВЕНЬ КОРТИЗОЛА И АДРЕНОКОРТИКОТРОПНОГО ГОРМОНА» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2019, Том 12, вып. 1), «ПРИМЕНЕНИЕ ТРАНСКРАНИАЛЬНОЙ МИКРОПОЛЯРИЗАЦИИ В КОМПЛЕКСНОЙ РЕАБИЛИТАЦИИ ДЕТЕЙ С РАССТРОЙСТВОМ ЭКСПРЕССИВНОЙ РЕЧИ », (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ. 2019, Том 12, вып. 1), и во многих иных статьях. В разделе «Материал и методы» статьи «АНАЛИЗ ДОППЛЕРОСОНОГРАФИЧЕСКИХ ОСОБЕННОСТЕЙ КРОВОСНАБЖЕНИЯ УЗЛОВЫХ ОБРАЗОВАНИЙ ЩИТОВИДНОЙ ЖЕЛЕЗЫ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2019, Том 12, вып. 1) авторы приводят следующую информацию. «Сравнение между группами проводилось согласно t-критерию Стьюдента». Однако, для корректного использования параметрического t-критерия Стьюдента, обязательно должны выполняться 2 ограничительных условия. Во-первых, в обеих сравниваемых подгруппах используемый количественный признак должен иметь нормальное распределение. Однако в реальных базах данных количественные признаки не часто имеют нормальное распределение. Более того, проверку нормальности распределения необходимо производить не одним критерием, а двумя и более. Поскольку надёжность результата этой проверки зависит ещё и от количества проверяемых значений признака. Рекомендуется, например, использовать критерии Шапиро-Уилка, Колмогорова-Смирнова, Крамера-фон-Мизеса, Андерсона-Дарлинга. Второе условие относится к дисперсиям распределения количественного признака в двух сравниваемых подгруппах, которые должны быть статистически равны. Т.е. до использования t-критерия Стьюдента вначале необходимо произвести проверки двух этих условий. И лишь при выполнении двух этих ограничительных условий можно далее использовать t-критерий Стьюдента. Если же данные 2 ограничения не выполняются совместно, то в этом случае нельзя использовать t-критерий Стьюдента. Однако в реальных данных оба эти 2 ограничения одновременно выполняются весьма редко. Т.е. корректно использовать t-критерий Стьюдента можно не часто. Аналогичная ошибка использования t-критерия Стьюдента отмечается и в статьях «РОЛЬ ГИПЕРХОЛЕСТЕРИНЕМИИ В ФОРМИРОВАНИИ НОЗОСТРУКТУРЫ ЗАБОЛЕВАЕМОСТИ НАСЕЛЕНИЯ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2019, Том 12, вып. 1), «ОЦЕНКА ЭНДОГЕННОЙ ИНТОКСИКАЦИИ У СУБФЕРТИЛЬНЫХ ЖЕНЩИН С ХРОНИЧЕСКИМ ЭНДОМЕТРИТОМ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2018, Том 11, вып. 4), и во многих иных статьях. О причинах отсутствия этих условий, и специфике этих ограничений, можете прочитать на сайте БИОМЕТРИКА в статьях "Сравниваем средние, а также и ...", "Ошибки статистического анализа биомедицинских данных", "Коварный t-критерий Стьюдента", "Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента". Отмечаем, что в этой же статье «АНАЛИЗ ДОППЛЕРОСОНОГРАФИЧЕСКИХ ОСОБЕННОСТЕЙ КРОВОСНАБЖЕНИЯ УЗЛОВЫХ ОБРАЗОВАНИЙ ЩИТОВИДНОЙ ЖЕЛЕЗЫ» авторы приводят ошибочные выражения типа «...статистически достоверным» и много выражений типа «22,1±3,11». Однако при этом не уточняется, какие же конкретно параметры соединены знаком " ± ". Подобные выражения типа «58,9±1,1», без пояснения двух этих параметров, отмечаются и в статьях «РОЛЬ ГИПЕРХОЛЕСТЕРИНЕМИИ В ФОРМИРОВАНИИ НОЗОСТРУКТУРЫ ЗАБОЛЕВАЕМОСТИ НАСЕЛЕНИЯ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2019, Том 12, вып. 1), «ПСИХОЛОГИЧЕСКИЕ ОСОБЕННОСТИ БОЛЬНЫХ С ЖЕЛЧНОКАМЕННОЙ БОЛЕЗНЬЮ ПОСЛЕ ХОЛЕЦИСТЭКТОМИИ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2018, Том 11, вып.6), «ОЦЕНКА КОГНИТИВНЫХ ФУНКЦИЙ У ПАЦИЕНТОВ С НЕСТАБИЛЬНОЙ СТЕНОКАРДИЕЙ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2018, Том 11, вып.5), «ОЦЕНКА ЭНДОГЕННОЙ ИНТОКСИКАЦИИ У СУБФЕРТИЛЬНЫХ ЖЕНЩИН С ХРОНИЧЕСКИМ ЭНДОМЕТРИТОМ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2018, Том 11, вып. 4), и во многих иных статьях. В разделе «Материал и методы» статьи «МЕДИЦИНСКАЯ РЕАБИЛИТАЦИЯ БОЛЬНЫХ С СОМАТОВЕГЕТАТИВНЫМИ НАРУШЕНИЯМИ, ПЕРЕЖИВШИХ КРИЗИСНЫЕ СИТУАЦИИ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2019, Том 12, вып. 1) авторы сообщают следующее. «При проведении статистического анализа критический уровень значимости р=0,05». Однако при этом не сообщают методы анализа и статистические критерии, и название второго параметра в выражениях типа «46,5±5,7». Также не сообщаются статистические методы и критерии, и названия параметров выражений типа «47па е», «17,8 ени» и в статьях «ПСИХОЛОГИЧЕСКИЕ ОСОБЕННОСТИ БОЛЬНЫХ С ЖЕЛЧНОКАМЕННОЙ БОЛЕЗНЬЮ ПОСЛЕ ХОЛЕЦИСТЭКТОМИИ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2018, Том 11, вып.6), «ЭФФЕКТИВНОСТЬ ГЕПАТОПРОТЕКТОРОВ В КОМПЛЕКСНОЙ ТЕРАПИИ БОЛЬНЫХ ПСОРИАЗОМ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2018, Том 11, вып. 4), и во многих иных статьях. Возможной причиной отсутствия этой информации являются сомнения самих авторов статьи «МЕДИЦИНСКАЯ РЕАБИЛИТАЦИЯ БОЛЬНЫХ …» в корректности использованных ими этих методов и критериев. Поскольку далее в разделе «Результаты и их обсуждение» авторы приводят следующие выражения типа «(43,2±4,5) балла; р<0,05». При этом использование средних значений баллов является ошибкой. Детали такой ошибки можете прочитать в моём докладе «Почему и как надо учить медиков статистике?» на международной конференции по доказательной медицине в Ереване (18-20.10.2012), выложенном на сайте БИОМЕТРИКА. В отдельных статьях данного журнала авторы в разделе «Материал и методы» приводят лишь названия использованных статистических пакетов, но при этом сохраняют в тайне конкретные названия использованных методов анализа и статистических критериев. Например, в статье «ОБВИТИЕ ПУПОВИНЫ И ПЕРИНАТАЛЬНЫЕ ИСХОДЫ В ЗАВИСИМОСТИ ОТ СПОСОБА РОДОРАЗРЕШЕНИЯ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2018, Том 11, вып.6), авторы сообщают следующее. «Статистическая обработка данных проведена с использованием пакета прикладных программ «Excel MS Office Professional» и «Statistiсa 6.0». Но не сообщают при этом названия использованных статистических методов анализа, статистических критериев, и структуру параметров типа «25,8±2,1». При этом далее используют ошибочные выражения «Достоверность различий между группами – р<0,05». Приведённые выше ошибки нередко обнаруживаются и в статьях, в которых в разделе «Материал и методы» вообще не приводится никакой информации об использовании статистического анализа. Но при этом далее в разделе «Результаты и их обсуждение» как раз и приводится много подобных описанных выше ошибок. Например, в разделах «Материал и методы» статей «ИССЛЕДОВАНИЯ ПО ИЗУЧЕНИЮ ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ РАСТИТЕЛЬНОГО СБОРА ДЛЯ ПРОФИЛАКТИКИ И КОМПЛЕКСНОГО ЛЕЧЕНИЯ ОСТРЫХ КИШЕЧНЫХ ИНФЕКЦИЙ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2018, Том 11, вып.6), «РЕАКТИВНОСТЬ ЦЕРЕБРАЛЬНЫХ СОСУДОВ У ПАЦИЕНТОВ С СОТРЯСЕНИЕМ ГОЛОВНОГО МОЗГА И ВОЗМОЖНОСТИ ФАРМАКОЛОГИЧЕСКОЙ КОРРЕКЦИИ ЕЁ НАРУШЕНИЙ» (ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ, 2018, Том 11, вып.5), авторы не приводят никакой информации об использовании статистического анализа. Т.е. не приводят названия статистического пакета, статистических критериев, критического уровня значимости, структуры выражений типа «3,87 ± 0,05» и т.д. Однако далее, в разделе «Результаты и их обсуждение», в этих статьях приводят более 60 выражений типа «5,09 ± 0,12», «48,54±2,5», и т.д., и выражения «результаты достоверны по сравнению с контролем при p< 0,05», «p>0,05» и «p<0,05». Выводы. Итак, каковы же могут быть причины появления подобных ошибок в публикуемых статьях данного журнала? Подобных причин может быть несколько. Основной же причиной является низкий уровень знаний авторов статей по использованным статистическим методам анализа. Т.к. необходимое это знание как раз и активирует авторов к описанию аргументации выбора и использования конкретных методов анализа. Более того, это знание повышает желание авторов усилить у читателей их статьи доверие к публикуемым результатам, полученных именно с помощью подробного описания статистического анализа. И благодаря этому повысить вероятности использования этими читателями данных результатов, а возможно, и продолжения читателями подобных исследований. Следующей причиной подобных ошибок являются цели публикации статьи как у авторов статьи, так и у редакции журнала. Поскольку основным желанием может быть просто повышение количества публикуемых статей. И это желание обуславливается разными причинами. В частности, повысить это количество публикаций возникает у диссертантов. Аналогичным может быть и желание самой редакции журнала "ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ" (главный редактор Амиров Наиль Багаувич), в редакционных требованиях которого нет никаких требований по описанию статистического анализа. Возможно как раз для того, чтобы не снижать количество публикуемых в этом журнале статей. Но при этом "Правила оформления статей для авторов в журнал «Вестник Современной Клинической Медицины»" требуют оплату в размере 800 рублей за каждую страницу публикуемой статьи. Очередной причиной является полное отсутствие элементарных знаний по статистическому анализу у большинства соавторов статьи, но при этом лишь один иной соавтор как раз и производил этот анализ. Однако этот соавтор владеет лишь минимальными знаниями по данному анализу. При этом все остальные соавторы ему доверяют, и поэтому сами они не могут оценить уровень использования и описания данного анализа. Ещё одна причина перечисленных ошибок относится к незнанию публикаций по анализу подобных ошибок. Например, в сайте БИОМЕТРИКА, которому в 2019 году исполняется уже 22-й год, приведено много статей по данной тематике. В частности, статьи в разделе КУНСКАМЕРА, в статьях «Применение методов статистики в кардиологии (по материалам журнала "Кардиология" за 1993 - 1995 гг.). Журнал "Кардиология", том 38, 1, 1998.», «Статистика в кардиологии. 15 лет спустя», «Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты», «Почему и как надо учить медиков статистике?
(Доклад на международной конференции по доказательной медицине в Ереване 18-20.10.2012)», «Лекция «Статистика - это что? Статистика - нужна зачем ? Статьи читаем – зачем» Статьи пишем - зачем?» для медиков в Ереване», «Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года)», и т.д. Однако при этом авторы статей, с ошибочными использованиями и описаниями статистического анализа, читают много иных журнальных статей, в которых как раз и приводится немало примеров ошибочного использования и описания статистического анализа. В результате авторы, читающие подобные статьи, как раз и повторяют аналогичные ошибки в своих статьях. Рекомендации дополнительных методов статистического анализа. В большинстве статей данного журнала "ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ", содержащих результаты статистического анализа, используют в основном анализ взаимосвязей между парами признаков. Количество таких парных связей, например, для четырёх признаков, равно 4*(4-1)/2 = (4*3)/2= 12/2 = 6. Это следующие парные связи признаков: 1-2; 1-3; 1-4; 2-3; 2-4; 3-4. Т.е. для N признаков количество парных связей равно N*(N-1)/2. При этом необходимо учитывать, что все используемые в анализе признаки подразделяются на 2 типа различающихся признаков. Один тип признаков является количественным (числовым, непрерывным), содержащим конкретные значения, получаемые в результаты измерения или вычисления по конкретным формулам. Например, признаки вес, рост, возраст, артериальное давление, и т.п. А во второй тип входят качественные (номинальные, порядковые, ранговые, ординарные, дискретные) признаки, которые отражают некое состояние исследуемых объектов. Обозначим признак первого типа КОЛ, а признак второго типа – КАЧ. И тогда возникают следующие 3 типа парных сочетаний этих анализируемых признаков: 1) КОЛ – КОЛ; 2) КОЛ – КАЧ; 3) КАЧ – КАЧ. Значит, при этом следует учитывать, что в зависимости от вида каждой из этих пар признаков, специфика связи одной пары будет существенно отличаться от связи другой пары признаков. Например, для пары количественных признаков могут оцениваться разные виды корреляции, и разные уравнения регрессии. Как и для пары качественных, группирующих признаков, виды связи также могут оцениваться разными методами анализа. Соответственно и связи между одним качественным и одним количественным признаком также могут оцениваться разными алгоритмами. Однако при этом часть этих связей может быть статистически не значимой, т.е. практически отсутствующей. Отметим, что отсутствие статистически значимой взаимосвязи для конкретной пары признаков не обязательно является отрицательным результатом. Поскольку для определённых комбинаций пары признаков как раз и желательно, чтобы эти признаки не зависели друг от друга. И этот результат может положительно подтвердить корректность этого отношения. И тогда оцениваемое количество статистически значимых парных связей может быть гораздо меньше. Аналогичный нюанс присущ и для многомерных связей. Поскольку в этих связях могут использовать как разные количества признаков, так и разные методы анализа. При этом для каждого из этих наборов признаков реально может использоваться не один какой-то метод анализа, а более одного метода. Т.к. эти разные методы анализов позволяют установить разные виды и типы зависимостей этих признаков. Для чего, естественно, нужно хорошо владеть этими спецификами. Что как раз и определяет уровень профессионализма в статистическом анализе. Известно, что в медицине практически любой из признаков пациентов взаимосвязан гораздо более чем с одним иным признаком. Поэтому в медицинских исследованиях недостатком является как раз использование только статистического анализа указанных выше парных связей. Но при этом не анализируются, и затем не могут использоваться, продуктивные многомерные взаимосвязи типа VAR1 <--> VAR2 <--> VAR3 <--> VAR4 <--> … <--> VAR9 и т.д. Чаще всего зависимым признаком является группирующий признак. Например, признак отражающий состояние пациентов «До лечения» и «После лечения». И в качестве предсказывающих вероятностей этих состояний используют не только количественные признаки, но также и группирующие (качественные) признаки. Наиболее часто для оценки таких уравнений взаимосвязи используется самый продуктивный метод логистической регрессии, имеющий несколько различных алгоритмов. Изображение примера таких многомерных связей приведено ниже на рисунке, демонстрировавшемся в докладе «Цели, возможности, и проблемы использования биостатистики в доказательной медицине» на международной конференции по доказательной медицине в Ереване в 2015 году (см. фото). Ниже приводится набор названий наиболее продуктивных методов статистического анализа, рекомендуемых исследователям, публикуемым свои статьи как в данном журнале, так и в иных журналах. При этом следует понимать, что часть получаемых при этом результатов анализа являются наиболее важными. Тогда как иная часть методов оказывает лишь помощь в выборе как раз наиболее важных иных методов. 1) Двумерный визуальный анализ по всем парам количественных признаков с выделением сравниваемых подгрупп. 2) Кластерный анализ для поиска в базе данных (БД) скрытых группировок наблюдений, используемый с помощью нескольких основных методов. В т.ч. раздельно для количественных и качественных признаков. 3) Проверка несколькими критериями законов распределений количественных признаков в отдельных сравниваемых подгруппах БД, для аргументации использования параметрических и непараметрических критериев сравнения параметров. 4) Проверка гипотез о видах распределений количественных признаков в сравниваемых подгруппах. А также сравнения в подгруппах параметров групповых средних, мод, медиан и дисперсий, используя при этом параметрические и непараметрические критерии. А при использовании параметрических критериев обязательно производить проверку условий корректности использования этих методов. 5) Анализ таблиц сопряжённости группирующих признаков БД, содержащих и признаки по установленным кластерам, с оценкой отношения шансов, чувствительности и специфичности, и построением ROC-кривых. При этом оценивать не только интенсивности связи пары признаков, но также и анализ структуры установленных взаимосвязей, с оценкой интенсивности и направления взаимосвязи в каждой клетке таблицы сопряжённости. 6) Анализ выживаемости с использованием цензурированных данных. Построение кривых выживаемости, метод Каплана-Мейера, логранговый тест, регрессионная модель пропорциональных интенсивностей Кокса, экспоненциальная регрессия, нормальная и логнормальная регрессия, стратифицированный анализ. 6) Корреляционный анализ в подгруппах БД с использованием двух основных видов коэффициентов корреляции для оценки вида взаимосвязей, с оценкой характера взаимосвязи, а также проверка гипотез о равенстве интенсивности взаимосвязей в сравниваемых подгруппах. При этом с построением двумерного графика распределения наблюдений с линейным или нелинейным отражением вида взаимосвязи. 7) Каноническая корреляция, с предварительным определением группировок количественных признаков БД, и с построением двумерных графиков с распределением в канонических осях имеющихся группировок наблюдений. 8) Факторный анализ, с построением двумерных графиков с распределением в факторных осях имеющихся группировок наблюдений. 9) Линейный регрессионный анализ с разными алгоритмами, а также набор разных видов нелинейного регрессионного анализа. Желательно проведение этого анализа как в целом по всей БД, так и раздельно в сравниваемых подгруппах. 10) Дискриминантный анализ по сравнению подгрупп БД с помощью 3–х основных методов отбора предикторов, и с построением двумерных, или трёхмерных графиков, с распределением в дискриминантных осях имеющихся группировок наблюдений. 11) Логистическая регрессия по сравнению подгрупп БД с помощью 3–х основных методов отбора предикторов. В данном случае обязательно строить ROC-кривые и таблицы сопряжённости по взаимосвязи фактических и предсказанных группировок. При этом стремиться получать не одно единственное уравнение, а максимальное количество уравнений, чтобы из них можно было выбрать несколько самых продуктивных уравнений. Детали этого метода можете прочитать в 10 наших статьях о логистической регрессии, выложенные на сайте БИОМЕТРИКА. Приведённые выше методы статистического анализа описаны во многих книжных изданиях. Списки этих изданий представлены в той приводимой ниже литературе, в которой автор данной статьи, переводивший эти издания, дополнял их этими списками. Так книга [2] дополнена 459 изданиями по статистике; в литературе [3] приведено 75 изданий; в докладе [7] представлены 208 изданий по статистическому анализу. Многие рекомендуемые нами примеры методов статистического анализа, выложены на сайте БИОМЕТРИКА в виде диссертаций и статей, созданных исследователями, для которых в нашем НЦ БИОСТАТИСТИКА были проведены анализы их БД.
Итак, во многих статьях данного журнала приводятся результаты ошибочных и некорректных методов статистического анализа. Либо описывают корректные, но не очень продуктивные методы анализа. Рекомендуется читателям учитывать содержание данной статьи, улучшая как методы проводимого статистического анализа, так и описания получаемых при этом результатов. Для чего воспользоваться представленными выше публикациями. P.S. Создание данной статьи предложил главный редактор журнала "ВЕСТНИК СОВРЕМЕННОЙ КЛИНИЧЕСКОЙ МЕДИЦИНЫ" Амиров Наиль Багаувич. После отправки окончательной версии этой статьи, объёмом в 17 страниц, в его адрес, неожиданно им было предложено мне произвести оплату за публикацию данной статьи в их журнале. Согласно требованиям этого журнала необходимо было оплатить 0,8*17 = 13,6 т.р. С чем я не согласился, поскольку эта работа и была мною бесплатно сделана по просьбе редактора. Нежелание редактора журнала по бесплатной публикации данной статьи, говорит об отсутствии желания по улучшению публикуемых статей у редакции данного журнала. Поэтому статья и была опубликована на нашем сайте. ____________________________________________ ЛИТЕРАТУРА
Хорошая книга: Д. Химмельблау. Анализ процессов статистическими методами. В.С.Степин, В.Г.Горохов, М.А.Розов. Философия науки и техники. Основатели биометрики
Оптимизировано для разрешения 1024х768 в Mozilla Firefox, Opera. |
Мониторинг качества научных медицинских публикаций Обращение межрегионального Общества специалистов доказательной медицины в ВАК РФ СТАТИСТИКА УМЕЕТ МНОГО ГИТИК. С.Е. Бащинский, главный редактор Международного журнала медицинской практики, 1998; №4, с.13-15. Примеры оформления исследователями базы данных, описания признаков и целей статистического анализа этой базы данных
Центр БИОСТАТИСТИКА Интересная ссылка
СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ МЕДИКОВ И БИОЛОГОВ (время и опыт). Леонов В.П. Применение методов статистики в кардиологии. (по материалам журнала "Кардиология" за 1993 - 1995 гг). Леонов В.П. Журнал "Кардиология", том 38, 1, 1998. Статистика в кардиологии. 15 лет спустя. Леонов В.П. 15 лет назад, в 1998 году, в журнале «Кардиология» была опубликована наша статья «Применение методов статистики в кардиологии (по материалам журнала «Кардиология» за 1993–1995 гг.) В ней были проанализированы 426 статей кардиологической тематики. Куплю 500 диссертаций! (Медицинская Газета № 10 за 14.02.2001) В новый век - с доказательной биомедициной Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал медицинской практики, 2007, вып. 2, стр.19-35.
Камуфляжные мемы инфоценоза научных школ // Философия математики: актуальные проблемы. Материалы Международной научной конференции 15-16 июня 2007. Москва, Изд. Саван С. А., 2007. - с. 212-216. Леонов В.П. Доклад "Почему и как надо учить медиков статистике?" Леонов В. П. Доклад на международной конференции по доказательной медицине в Ереване 18-20.10.2012 Зачем нужна статистика в доказательной медицине? В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193. ВЫРОДИМСЯ ИЛИ ВЫМРЕМ, ЧТО НАСТУПИТ РАНЬШЕ? Леонов В.П. ВАК для учёных? или ВАК для… бумагомарак? Леонов В.П. Газета «ТРОИЦКИЙ ВАРИАНТ» № 8 (127), 2013 год. К 2019 году статью прочитали более 68 тысяч читателей. ВОЗМОЖНОСТИ БИОМЕТРИЧЕСКОГО АНАЛИЗА ВЗАИМОСВЯЗИ СОМАТИЧЕСКИХ ПОКАЗАТЕЛЕЙ И СИСТЕМАТИКИ ПСИХИЧЕСКИХ РАССТРОЙСТВ. НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ).Леонов В.П. Вестник Томского государственного университета. Серия "Математика. Кибернетика. Информатика", №275. АПРЕЛЬ 2002, стр. 17-24. Cамая читаемая наша статья после отправки в мае м-це с.г. более 300 писем авторам статей мед. журналов о наличии в них примитивных и ошибочных методов статистического анализа, и получаемых при этом результатах... Логистическая регрессия
в медицине и биологии. В серии 10 статей рассмотрены основы метода логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных. 1. Логистическая регрессия. Основные понятия и возможности метода. Сравниваем средние, а также и ... В. Леонов Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Такими новыми сравнениями являются проверки равенства дисперсий, коэффициентов корреляции, коэффициентов регрессии или векторов групповых средних, сравнение групп многомерными методами, и т.д. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками. Специфика других сравнений хорошо иллюстрируется различными графиками, а также наличием списка литературы из 98 книг и статей, полезных для этой тематики. Проценты - статистический анализ?
Или проценты - арифметический анализ? Мотивом к написанию данной статьи стал следующий инцидент. 11 апреля 2016 г. я получил вот какое письмо. Уважаемый Василий Петрович! Я являюсь одним из читателей Вашего сайта "Биометрика", который нашёл по ссылке, размещённой на странице http://bono-esse.ru/blizzard/ais.html C большим интересом ознакомившись, в частности, с разделом "Кунсткамера", обращаюсь к Вам с несколько необычным вопросом по независимому, неформальному рецензированию работы .... P.S. Сайт дополнен PDF-файлом полной версии данной статьи В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года). Балакшина Н.Г., Кох Л.И., Леонов В.П. ПРОГНОЗИРОВАНИЕ ИСХОДОВ ХИРУРГИЧЕСКОГО ЛЕЧЕНИЯ ГНОЙНЫХ ВОСПАЛИТЕЛЬНЫХ ЗАБОЛЕВАНИЙ ПРИДАТКОВ МАТКИ
На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА рекомендую перейти на файл "Поиски методов или результатов статистического анализа" . Введение Семинар по биометрике в Красноярске Статистика - это что? Статистика - нужна зачем? Статьи читаем - зачем? Статьи пишем - зачем? Зачем нужна статистика в доказательной медицине? В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193. «Роющая деятельность кабана». Статья в "Независимой" газете... В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года). Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях. Почему появилась эта статья? За время существования сайта БИОМЕТРИКА его автору пришло довольно много писем, в которых читатели консультировались относительно различных нюансов использования и описания методов статистики в статьях и диссертациях. Этот поток писем периодически возрастал после публикаций статей автора на сопутствующие темы в "Бюллетене ВАК РФ", "Международном журнале медицинской практики", "Медицинской газете", "Сибирском медицинском журнале", а также непосредственно на сайте БИОМЕТРИКА. С каждым годом таких писем становится все больше... ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК N5 1997 г. В.П.Леонов, П.В.Ижевский. Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях. Международный журнал медицинской практики, 1998 г., вып. 4. В.П.Леонов, П.В.Ижевский. ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ. ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П. Применение статистики в статьях и диссертациях по медицине и биологии. Часть IV. Наукометрия статистической парадигмы экспериментальной биомедицины. Международный журнал медицинской практики, 2002 г. вып. 3. Леонов В. СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ МЕДИКОВ И БИОЛОГОВ. (время и опыт). Леонов В. Общие проблемы применения статистики в биомедицине, или что разумнее: ДДПП или ДППД? Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал медицинской практики, 2007, вып. 2, стр.19-35. КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?Чтобы не допускать ошибок в использовании и описании статистики в статьях и диссертациях, следует прочитать материалы представленные в КУНСТКАМЕРЕ - коллекции диссертаций и статей по медицине и биологии, с набором статистических ошибок и нелепостей. Экспозиция 1 Экспозиция 2 Экспозиция 3 Экспозиция 4 Экспозиция 5 Экспозиция 6 Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа Н.Г. Веселовская"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ" Г.А. Попова СРАВНИТЕЛЬНОЕ ИЗУЧЕНИЕ ПОДВИДОВ LINUM USITATISSIMUM L . В УСЛОВИЯХ ЗАПАДНОЙ СИБИРИ. (диссертация на соискание учёной степени кандидата биологических наук). А.Г. Сыркина Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).
|
На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА рекомендую перейти на файл "Поиски методов или результатов статистического анализа" . |
Наш адрес Сайт БИОМЕТРИКА создан в 1997 г. © Василий Леонов
Пример "ПРОГРАММА РАБОТ по статистическому анализу" базы данных Исследователя
Зачем нужна статистика в доказательной медицине?
Доклад "Почему и как надо учить медиков статистике?" В. Леонов.