Яндекс.Метрика

Логистическая регрессия в медицине

Каждый слышит то, что понимает. Гете

Статистика посещаемости БИОМЕТРИКИ


16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страниц
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы
Если приходят, значит полезное находят.
.  
Наш 
адрес:  
Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...

На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА , рекомендую перейти на файл "Поиски методов или результатов статистического анализа".

 

Логистическая регрессия в медицине и биологии

В. Леонов

   Логистическая регрессия. Введение.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5. Особенности логистической регрессии в акушерстве.
6. Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество уравнений логистической регрессии.


 

В данной серии статей, на уровне доступном для начинающих, рассмотрены цели и направления метода логистической регрессии. В частности, приводятся пояснения, какие надёжные результаты этого метода могут быть использованы для поставленных целей медицинских и биологических исследований. На примерах реальных медицинских массивов данных, поясняется специфика использования данного метода. Объяснено, что метод имеет много алгоритмов оценки уравнений логистической регрессии, что позволяет находить для использования во врачебной практике самые удобные и надёжные методы лечения. Рассмотрено использование метода к массивам данных, содержащим несколько сотен признаков разной природы. Показано, что корректное создание таких массивов, и их анализ, возможны лишь при участии биостатистиков на самых первых этапах таких исследований. Рассмотрена связь логистической регрессии и ROC-анализа. Приведены многочисленные уравнения логистической регрессии и ROC-кривые, полученные при анализе реальных данных. Объяснена целесообразность использования вместе с методом логистической регрессии набора методов анализа парных взаимосвязей между различными признаками, а также использование более сложных методов многомерной статистики.


Логистическая регрессия.
Введение.

 

Приложение статистики для определения
диагностической важности симптомов
и достоинства операций, можно рассматривать
как важное приобретение новейшей хирургии.

_____________________
Н. И. Пирогов.

  

   Эта вводная статья, с доступным описанием возможностей логистической регрессии, написана через пару лет после создания серии из 9 статей по этому методу. Данные статьи являются самыми посещаемыми читателями сайта БИОМЕТРИКА. При этом по ним приходит немало вопросов как от читателей этой серии статей, так и от многих заказчиков, которые получают результаты логистической регрессии при анализе их массивов данных. Именно поэтому было решено написать ещё одну вводную статью об этом методе. В которой без описания основ его теории, рассказать об основных возможностях использования метода логит-регрессии в биомедицинских исследованиях. А также использования этого метода статистического анализа в психологии, экономике, геологии, социологии, почвоведении, гидрологии, и т.д.

   Метод логистической регрессии всё активнее вводится в практику мировой медицинской науки, являясь примерами продуктивных исследований в доказательной медицине. Это объясняется наличием следующих основных возможностей данного метода:

1. Определение для конкретного дискретного, группирующего (зависимого) признака Y, набора признаков-предикторов X, объясняющих наборами своих значений вероятности отнесения конкретного k-того наблюдения к группе сравнения.

2. Ранжирование, упорядочение отобранных признаков-предикторов Xпо степени своего воздействия на зависимый признак Y.

3. Оценка надёжности объяснения принадлежности наблюдений (пациентов) к конкретной градации (группе) зависимого признака Y, с помощью определённой комбинации отобранных признаков-предикторов X.

4. Возможность оценки не одного, а многих уравнений логит-регрессии, путём использования различных алгоритмов оценки этих уравнений. Благодаря чему из этого набора можно выбрать самые полезные и продуктивные уравнения.

5. Выбор различных наборов потенциальных предикторов, по которым используемые алгоритмы оценивают разные уравнения логистической регрессии. При этом может изменяться и объём анализируемых наблюдений, по которым оцениваются структуры уравнений. В итоге это приводит к получению различающихся уравнений.

 В настоящее время логистическая регрессия является одним из самых продуктивных методов доказательной медицины. Поэтому от подобных детальных анализов своих ценных баз данных как раз и выражают свои подробные мнения учёных из Франции, Германии, Испании и Италии. А поскольку основным показателем, оцениваемым с помощью этого метода, является вероятность отнесения конкретного пациента к одной из сравниваемых групп, то приведём фрагменты из книги "Основы доказательной медицины", автором которой является Т. Гринхальх. С момента первого издания в 1996 г., эта книга переведена на восемь языков (испанский, итальянский, китайский, немецкий, русский, французский, чешский, японский) и напечатана огромными тиражами. Данное руководство завоевало признание большинства медиков-исследователей во многих странах. В книге 17 глав, среди которых есть и глава "Статистика для неспециалиста". Ниже приведём определение термина "Доказательная медицина" и комментарий этого определения.

       "Доказательная медицина — это применение математических оценок вероятности пользы и риска вреда, получаемых в высококачественных научных исследованиях на выборках пациентов, для принятия клинических решений о диагностике и лечении конкретных больных". С учётом возможностей оценок этих самых вероятностей с помощью метода логистической регрессии, можно считать, что данный метод как раз и является одним из основных методов доказательной медицины. Результаты подобных научных исследований публикуются в журнальных статьях, диссертациях, монографиях, в докладах на конференциях, и т.п.

   Далее Т. Гринхальх уточняет этот аспект следующей фразой: "Таким образом, в основе доказательной медицины лежит использование количественных сведений, полученных в исследованиях на группах пациентов, при принятии решений о конкретных пациентах". И этот специфический аспект также присущ методу логистической регрессии. Т.е. уравнения логистической регрессии  оцениваются разными алгоритмами с использованием всего имеющегося массива данных (базы данных - БД), но затем, используя полученные уравнения, вычисляются упомянутые выше вероятности пользы и риска вреда для каждого из проанализированных пациентов. Более того, полученные уравнения могут далее использоваться для новых пациентов, данные по которым отсутствуют в проанализированной БД. Далее обсудим доступным образом эти детали и возможности этого отличного метода.

    Практически во всех медицинских научных исследованиях, авторы собирают массивы данных, которые содержат несколько различных группировок признаков. Некоторые из этих основных группировок как раз и сравниваются методом логит-регрессии. Такие группировки имеют свои специфики. Например, если исследуются пациенты в периоды наблюдения "До лечения" и "После лечения", то данные 2 группы различаются временем наблюдения, а также значениями основных признаков, отражающих состояние здоровья больных и здоровых пациентов. Для использования метода логистической регрессии при анализе двух этих периодов наблюдения, в качестве зависимого признака Y используем признак с градациями "1 = До лечения" и "2 = После лечения". Назовём этот признак, например, PERIOD. При этом значения, фиксируемые (измеряемые) в оба эти периода, вводятся в один признак. Например, у пациентов в оба периода ("До лечения" и "После лечения") измеряется систолическое артериальное давление. Назовём этот признак, например, SAD. Отметим, что данный признак SAD является количественным признаком.

    Однако помимо количественных признаков, в реальных научных исследованиях фиксируется немало и иных, неколичественных признаков, так называемых дискретных, качественных признаков. Например, в научном исследовании производится сравнение двух групп пациентов: "Больные" и "Здоровые", или "До лечения" и "После лечения", и т.п. В этом случае используется зависимый признак (назовём его, например, BZ) с двумя градациями: "1 = Больной" и "2=Здоровый". Такие качественные признаки могут иметь и более 2 градаций (уровней, значений, групп). При этом данные градации могут быть ранговыми т.е. упорядоченными, а также и не ранговыми. В качестве примеров других дискретных, качественных признаков, используемых в исследованиях как признаки-предикторы (объясняющие признаки), приведём несколько следующих признаков: VAR97A = 'Функциональный класс сердечной недостаточности', PR15A = 'Наличие одышки', K126A = 'Мужчина курит', PHAS = 'Признаки хронической аневризмы сердца', SA = 'Симптомы аритмии', и т.д. Такими не ранговыми могут быть также признаки отражающие национальность пациента, пол пациента, место жительства, и т.д.

  Исторически самыми первыми методами статистического анализа, при работе с массивами данных содержащих количественные и группирующие признаки, были процедуры сравнения групповых средних. Так более 100 лет тому назад, Уильямом Госсетом был разработан t-критерий Стьюдента. Данный критерий имеет свою специфику. В частности, его корректное использование при сравнении двух групповых средних, требует выполнения двух обязательных условий в обеих сравниваемых группах. К сожалению большинство авторов, публикуемых результаты использования этого критерия, не знают об этих условиях.

   Сравнение групповых средних, двух и более, является исследованием наличия/отсутствия причинно-следственной взаимосвязи между двумя признаками. В частности, между количественным признаком, по которому вычисляются средние значения в каждой из сравниваемых групп, и группирующим признаком, по значениям которого наблюдения относятся в одну из этих групп.

  При исследовании взаимосвязи между парой признаков, производится также и оценка направленности этой взаимосвязи. Т.е. какой из признаков является причиной, а другой признак, по сути, является следствием первого признака. То есть оценка наличия/отсутствия и направленности причинно-следственной взаимосвязи, уточняет специфику отношений этой пары признаков. В некоторых парах исследуемых признаков такие причинно-следственные взаимосвязи устанавливаются достаточно легко. Например, в зависимости от пола пациента, могут существенно меняться некоторые изучаемые количественные признаки. В этом случае пол пациента является причиной, а значения количественного признака являются следствием.  Однако в других аналогичных парах признаков констатация причинно-следственной направленности не всегда доступна. Т.е. несмотря на подтверждение статистически значимого различия групповых средних, отсутствует объяснение какой признак является причиной, а какой - следствием.

   Аналогичные соотношения имеют место при анализе взаимосвязи между парой количественных признаков, и между парой дискретных, качественных признаков. Для пары количественных признаков в этом случае могут применяться методы корреляционного или регрессионного анализа, которые позволяют оценивать направление и интенсивность этих связей. А для пары дискретных, качественных признаков весьма продуктивно использовать анализ таблицы сопряжённости. И в этом случае также оцениваются различные показатели интенсивности и направленности этих взаимосвязей. Более того, при наличии статистически значимой взаимосвязи пары дискретных признаков, в таблице сопряжённости можно (и нужно!) идентифицировать структуру этой взаимосвязи. Т.е. в каких комбинациях значений этой пары признаков данная взаимосвязь имеет место, а в каких - отсутствует. А также в этих комбинациях (клетках таблицы) устанавливается и направленность этой взаимосвязи - отрицательная, или положительная.

   Часто после оценки наличия этих статистически значимых связей, не всегда возможно сразу и адекватно оценить направление причинно-следственной взаимосвязи. Т.е. установить какой из признаков является причиной, в другой - следствием. В таких ситуациях оба эти признака могут быть следствиями некоторых иных признаков. То есть оба эти признака также могут иметь статистически значимую взаимосвязь с некоторыми иными признаками. Причём изменения каждого из этой пары признаков могут быть зависимы не от одного какого-то признака, а даже от некоторого подмножества признаков. Естественно, что для для решения подобных проблем следует использовать наборы иных, более сложных и продуктивных, многомерных методов статистического анализа.

 В качестве примера подобного набора с количественными и дискретными, качественными признаками, приведём список признаков БД исследователя М.С.И. из города С., который проводил научное исследование по теме "Разработка метода комплексного лечения больных после эндоскопической холецистэктомии на раннем восстановительном  этапе с использованием магнитолазерной терапии, КВЧ – терапии и  минеральных вод". Вот список этих 46 признаков:

PERIOD = 'Время наблюдения'
GRUPPA = 'Группа'
VAR4A = 'Пол пациента'

VAR5 = 'Возраст'
VAR6A = 'Градации возраста'
VAR7A = 'Давность заболевания'
VAR8A = 'Фактор риска'

VAR9 = 'Лейкоциты'
VAR10 ='Эритроциты'
VAR11 = 'Гемоглобин'
VAR12= 'СОЭ'
VAR13= 'Лимфоциты'
VAR14A = 'Уровень реактивности'
VAR15 = 'Билирубин крови'
VAR16 = 'АЛТ'
VAR17 = 'АСТ'
VAR18 = 'Лактатдегидрогеназа'
VAR19 = 'Щелочная фосфатаза'
VAR20 = 'Гаммаглютаминтрасфераза'
VAR21 = 'Индекс Кердо'
VAR22A = 'Вегетативный тонус'
VAR23 = 'Индекс Хильдебранта'
VAR24A = 'Боли в правом подреберье'
VAR25A = 'Изжога'
VAR26A = 'Тошнота'
VAR27A = 'Отрыжка'
VAR28A = 'Горечь во рту'
VAR29A = 'Вздутие кишечника'
VAR30A = 'Нарушение стула'
VAR31A = 'Астеновегетативный синдром'

VAR32 = 'ИКП'
VAR33A = 'Интегральный клинический показатель'
VAR34A = 'Холангит УЗИ'

VAR35 = 'Объём ЖП УЗИ'
VAR36A = 'Тип ДЖВП'
VAR37A = 'Синдром холестаза'
VAR38A ='Синдром цитолиза'
VAR39A = 'Синдром мезенхимально-воспалительный'

VAR40 = 'Уровень стресса'
VAR41A = 'Наличие стресса'
VAR42 = ' Уровень п/эмоционального напряжения'
VAR43A = 'Наличие п/эмоционального напряжения'
VAR44 = 'Состояние здоровья'
VAR45 = 'Физическое функционирование'
VAR46 = 'Интенсивность боли'
VAR47A = 'Эффективность'

 

   В приведённой выше таблице красным цветом выделены 25 признаков, называемые дискретными, группирующими (качественными), а синим цветом - 21 количественный признак.

  Напомню, что все существующие методы статистического анализа условно подразделяются на две группы: многомерные методы анализа, и иные, не многомерные методы. Под многомерными методами принято считать те методы анализа, в которых вместе анализируются более двух признаков. Одномерным анализом для количественного признака являются оценки параметров распределения признака, например, оценки среднего значения, дисперсии, ошибки среднего, коэффициента вариации, и т.д. Либо проверка закона распределения значений количественного признака, в частности, проверка наличия/отсутствия нормального закона.

   Следующая группа - это упомянутые выше двумерные виды анализов. То есть те статистические анализы, в которых вместе анализируется пара признаков. Это могут пары количественных признаков, либо пары дискретных, качественных признаков, либо один из признаков количественный, а второй - дискретный, качественный.

    В наших статьях "Проценты - статистический анализ? Или проценты - арифметический анализ?" и "Сравниваем средние, а также и ... " достаточно подробно описаны методы оценки количества всех пар признаков, для которых можно (и нужно!) производить анализ наличия/отсутствия и направленности причинно-следственной взаимосвязи Например, для 5 признаков VAR1, VAR2, VAR3, VAR4, VAR5 имеется 10 парных взаимосвязей, показанные ниже на рисунке.

Это следующие 10 парных зависимостей: VAR1-VAR2; VAR1-VAR3; VAR1-VAR4; VAR1-VAR5; VAR2-VAR3; VAR2-VAR4; VAR2-VAR5; VAR3-VAR4; VAR3-VAR5; VAR4-VAR5.

В общем случае при наличии V признаков, количество таких парных зависимостей будет равно числу сочетаний (неупорядоченных комбинаций) из V по 2:

Так при значении V=5 получаем, Z = 5! / ((5-2)!*2!) = 5*4*3*2*1 / (3!*2!) = 5*4*3*2*1 / (3*2*1*2*1) = 20/2=10. Тогда для 5 качественных, группирующих признаков можно (и нужно!) провести анализ 10 таблиц сопряжённости. А для 5 количественных признаков можно (и нужно!) провести корреляционный анализ (либо парный регрессионный) 10 пар признаков. Также для всех этих пар признаков желательно не только установить наличие или отсутствие взаимосвязи, но при наличии этой взаимосвязи ещё и направленность. Т.е. какой их признаков можно считать причиной, а какой - следствием, результатом. А при установлении признака-причины, и признака-следствия, необходимо установить, а возможно ли в принципе подвергать изменению значения признака-причины. Поскольку очень часто одной из задач исследования является целевое управление значениями конкретных зависимых признаков.

   Если же есть 5 качественных и 5 количественных признаков, то кроме упомянутых выше 10+10=20 пар взаимосвязей, следует проверить наличие или отсутствие взаимосвязи между всеми парами количественных и качественных признаков. В этом случае количество таких пар будет равно 5*5=25. В результате количество всех анализируемых парных взимосвязей будет равно 10+10+25=45. Если же данный подход применить к упомянутой выше таблице признаков с 25 дискретными, группирующими признаками, и 21 количественным признаком, то такое общее количество парных взаимосвязей будет равно 300 + 210 + 525 = 1035.

   Разумеется, при наличии такого количества парных взаимосвязей, сразу возникает вопрос: - А нужно ли производить оценки всех подобных взаимосвязей? Анализ журнальных статей, диссертаций, монографий, и иных содержаний медицинских исследований, показывает, что подобные подходы к анализу имеющихся БД практически не реализуется. Напротив, перечисляется весьма ограниченное количество конкретных пар признаков, для которых и производится анализ взаимосвязей. Причин такому подходу несколько. Во-первых, общее количество анализа возможных парных взаимосвязей велико. Во-вторых, не все парные взаимосвязи вызывают интерес у исследователя. Между тем, установление статистически значимой взаимосвязи для каждой конкретной пары призраков, позволяет гораздо лучше понять механизм и структуру изучаемых систем. А при установлении причинно-следственной направленности в такой паре признаков, оценить возможность и целесообразность управления значением этого причинного признака.

  Напомним, что уравнение логистической регрессии с помощью набора признаков-предикторов X, позволяет оценивать вероятность отнесения конкретного k-того наблюдения к определённой группе сравнения. Например, имеются 2 группы сравнения: "Больные" и "Здоровые". В этом случае признаки-предикторы, включённые в уравнение логит-регрессии, объясняют какими комбинациями значений этих признаков, пациенты могут имеют высокие вероятности (гораздо более 50%; близко к 100%; или 100%) отнесения к группе "Больные", или к группе "Здоровые". При этом сумма двух этих вероятностей, при наличии двух групп сравнений, равна 100%. Обозначим это уравнение как Р(1)=F (X1 , X , ... , Xk-1, Xk ), где Р(1) - вероятность принадлежности, отнесения наблюдения (пациента) к группе Y=1, F( ) - функция для уравнения логит-регрессии, а X- признаки-предикторы, входящие в функцию F( ).

   Практика оценки уравнений логит-регрессии даёт исследователям информацию о том, что признаки-предикторы, вошедшие в составы набора уравнения, представляют собой разные доли от всего количества используемых потенциальных предикторов. Автор этой статьи использует метод логистической регрессии уже 30 лет, получив при этом порядка 25-30 тысяч уравнений. При этом в первые 10-15 лет количество потенциальных признаков-предикторов имело порядок от нескольких десятков до нескольких сотен. И в анализе таких БД, количество наблюдений в которых также имело порядок от нескольких десятков до нескольких сотен наблюдений, число получаемых уравнений по отдельным массивам имело количество от 2-3 до 8-10. Это объяснялось тем, что и в те времена использовались разные алгоритмы оценки уравнений, и разные анализируемые объёмы по одной и тоже БД. Поскольку при изменении состава потенциальных признаков-предикторов в конкретном массиве данных, меняется и объём анализируемых наблюдений. Это объясняется тем, что в большинстве БД многие признаки имеют пропущенные значения. Что и приводит в итоге к оценке новых уравнений.

   В настоящее время при анализе массивов данных объёмами от нескольких сотен до тысяч и миллиона наблюдений, при количестве признаков-предикторов от нескольких десятков до нескольких тысяч, количество уравнений, получаемых по одной и той же БД, возрастает на порядок и более. Это обусловлено как расширением количества самих алгоритмов оценки уравнений, так и существенным увеличением параметров БД.

   Однако за весь этот период использования данного метода, всегда имеет место тот факт, что в уравнения логит-регрессии алгоритмами включается лишь некоторая доля всего набора потенциальных признаков-предикторов. Например, из 100 потенциальных признаков-предикторов могут включаться от одного признака, до нескольких, и даже до нескольких десятков. И никогда не включаются все 100 потенциальных признаков-предикторов.

  В первой серийной статье "Логистическая регрессия. Основные понятия и возможности метода" приведены формулы уравнений логистической регрессии, и описания того, как по по этим уравнениям можно вычислять вероятности отнесения конкретного наблюдения к каждой из групп сравнения. При наличии определённого количества потенциальных признаков-предикторов можно подсчитать всё количество потенциальных уравнений, учитывая включение в эти уравнения разное количество признаков-предикторов. Рассмотрим как это можно вычислить.

   Предположим, кроме признака BZ с двумя градациями: "1 = Больной" и "2=Здоровый", имеется ещё 10 потенциальных признаков-предикторов причём как количественных, так и дискретных, качественных. Также предположим, что в уравнения в принципе можно включить от 1 признака, до всех 10 признаков-предикторов. Такие различные уравнения можно потом сравнить как по их возможностям, так и по важности одних и тех же признаков, находящихся в разных уравнениях. Используя формулу числа комбинаций из 10 признаков, вычислим количество уравнений Z с числом предикторов К от 1 до 10. Ниже приведена таблица со значениями количеств уравнений для разных значений К. Просуммировав все значения Z, установим, что общее количество

K = 1 2 3 4 5 6 7 8 9 10
Z = 10 45 120 210 252 210 120 45 10 1

  возможных уравнений равно 1023.         Очевидно, что использовать при таком    огромном количестве возможных    уравнений, простейший метод отбора    лучших уравнений, проверяя для этого возможности всех 1023 уравнений, не вполне реально. Отметим, что в принципе в программах написанных с помощью разных языков программирования, такой вариант возможен. Но он не продуктивен, поскольку требует очень большого количества времени для получения всех этих уравнений, затем вычисления оценки их результативности, и затем сравнения результативности всех пар уравнений (N.B.! Количество таких пар сравнения будет огромным!). Поэтому при оценке уравнений логистической регрессии пишутся такие программы, которые позволяют производить последовательный отбор самых лучших признаков-предикторов. Однако и в этом случае оценивается не 1 уравнение, а от 2-3 до 20-30 уравнений (и более!), которые отличаются друг от друга как набором признаков-предикторов, так и надёжностью прогноза принадлежности каждого наблюдения к сравниваемым группам наблюдений.

   Чем же объясняется отбор определённых признаков-предикторов в уравнения логистической регрессии? Напомню, что основной целью такого уравнения является выбор группы признаков-предикторов, комбинации значений которых определяют принадлежность анализируемых наблюдений (пациентов) к конкретным группам сравнения. Для чего по этому уравнению вычисляются вероятности отнесения конкретного наблюдения к каждой из групп сравнения. И наблюдение относится к той группе, для которой вероятность самая максимальная. Одна из основных причин выбора первых признаков-предикторов заключается в наличии статистически значимых связей с зависимым признаком Y. Причём с немалыми величинами связей в этих парах Y- X. Именно этот аспект и является мотивацией к проведению анализа взаимосвязи всех этих пар Y- X i . Так для признака PERIOD = 'Время наблюдения'  следует провести анализ взаимосвязи с 24 дискретными, качественными признаками, и с 21 количественным признаком (см. приведённую выше таблицу признаков).

  Однако в большинстве алгоритмов признаки-предикторы включаются в уравнение последовательно. Поэтому уже вводимый второй предиктор может иметь объяснения этого ввода не наличием сильной взаимосвязи с зависимым признаком Y,  а наличием более сильной взаимосвязи с первым введённым предиктором X1 .  Этот аспект мотивирует проверку наличия/отсутствия взаимосвязей между всеми парами признаки-предикторов. То есть для всех 45 потенциальных предикторов следует провести анализ парных взаимосвязей. Ниже приведена формула расчёта этого количества анализа этих парных взаимосвязей. С учётом упомянутых выше 24 и 21 взаимосвязей признака  PERIOD = 'Время наблюдения'  с 45 потенциальными предикторами, получаем общее количество полезных для анализа парных взаимосвязей: 990+45=1035. Выше это количество уже приводилось как общее число парных взаимосвязей для всех 46 признаков.

  Результаты проверки всех подобных парных взаимосвязей имеют несколько полезных аргументов. Во-первых, для каждой из этих пар признаков факт наличия или отсутствия статистически значимой взаимосвязи помогает лучше  и быстрее достичь первично сформулированных целей исследования. То есть сформулировать механизм взаимосвязи анализируемых признаков, либо констатировать их наличие или отсутствие, но при этом не сформулировать наиболее вероятный механизм этой взаимосвязи. Что является очередной мотивацией для расширения цели исследования. Однако применительно к уравнению логистической регрессии эти установленные взаимосвязи позволяют более глубоко и ясно объяснить механизм различия сравниваемых групп наблюдений (пациентов). Поскольку рассматривая набор парных взаимосвязей фактически можно сформировать последовательность признаков, имеющих максимальные взаимосвязи между собой.

   Также сортировка этих интенсивностей взаимосвязей позволяет установить потенциально самые важные и полезные признаки-предикторы, коррекция которых, в нужном направлении, позволяет повышать вероятности перехода наблюдения (пациента) из одной группы в другую. Например, из группы "Больной" в группу "Здоровый".  То есть используя полученные уравнения логистической регрессии, скорректировать процедуры воздействия на анализируемые объекты, путём целенаправленных изменений значений признаков-предикторов, вошедших а уравнение, с целью улучшения их состояния.

  Напомним, что в большинстве БД многие признаки имеют пропущенные значения. Доли этих пропусков разные. Поэтому используя для зависимого признака Y в качестве потенциальных предикторов все имеющиеся признаки, анализируемые программами логит-регрессии количества наблюдений уменьшаются. Поскольку из анализируемых наблюдений удаляются те наблюдения, которые имеют по одному и более пропущенных значений. Напомню, что в БД, вводимых, например, в программе EXCEL, эти пропуски представлены пустыми клетками. Значит при максимальном количестве потенциальных признаков-предикторов используется в анализе минимально возможное количество наблюдений. 

   По мере удаления потенциальных предикторов с наличием пропусков, возрастает количество анализируемых наблюдений. И при этом начинают изменяться значения парных взаимодействий, и, соответственно, состав предикторов введённых в уравнения логит-регрессии. Таким образом, по разным наборам потенциальных предикторов получаются и разные уравнения. Что в итоге приводит и к изменению надёжности этих уравнений. В частности, эти уравнения могут как ухудшаться, так и улучшаться. Естественно, что из всех полученных при этом уравнений можно (и нужно!) выбрать одно, или несколько, лучших уравнений. 

  В разных алгоритмах и программах анализа, которые позволяют получать эти наборы уравнений, используются разные показатели надёжности уравнений. В своём подходе к оценке надёжности каждого полученного уравнения логит-регрессии, мы используем также таблицы сопряжённости для двух признаков. Первый признак - это фактический зависимый признак Y. А вторым признаком является подобный признак, но в котором значения принадлежности наблюдения к конкретной сравниваемой группе устанавливается по величине вероятности, вычисленной по используемому уравнению логит-регрессии. То есть анализируется таблица сопряжённости для признаков "Y-фактический" и "Y-предсказанный".

  Ниже представлены 3 подобные таблицы сопряжённости, полученные по 3 уравнениям логит-регрессии (всего их было порядка 100, полученных по массису данных исследователя К.А.А. из города З.).

Таблица 1

Синим цветом выделены по диагонали те количества наблюдений, которые были предсказаны полученным уравнением в те же самые группы, к которым фактически принадлежали эти наблюдения. То есть из 96 наблюдений 1-й группы уравнение логит-регрессии отнесло в эту первую группу только 85 наблюдений. Из 65 наблюдений 2-й группы - 48 наблюдений, а из 57 наблюдений 3-й группы - 51 наблюдение. Общее количество наблюдений, отнесённых уравнением логит-регрессии в иные группы, равно 11+12+5+6=34. Значит доля неверно отнесённых наблюдений равно 34 / 218 = 15,6% .  

Таблица 2

В данной таблице показано, что второе уравнение получено при анализе 281 наблюдения. Что достигнуто путём удаления нескольких признаков с имеющимися пропусками измерений. При этом из 103 наблюдений 1-й группы уравнение отнесло в эту же группу 97 наблюдений, из 87 наблюдений 2-й группы - 75 наблюдений, и из 91 наблюдения 3-й группы - 87 наблюдений. Общее количество наблюдений, отнесённых уравнением логит-регрессии в иные группы, равно 6+7+5+4=22. Значит доля неверно отнесённых наблюдений равно 22 / 281 = 7,8% . По сравнению с уравнением по таблице 1, в уравнение по таблице 2 было введено в 2 раза больше признаков-предикторов.

Таблица 3

В данной таблице показано, что третье уравнение также было получено при анализе 281 наблюдения. При этом из 103 наблюдений 1-й группы уравнение отнесло в эту же группу 101 наблюдение, из 87 наблюдений 2-й группы - 86 наблюдений, и из 91 наблюдения 3-й группы - 90 наблюдений. Общее количество наблюдений, отнесённых уравнением логит-регрессии в иные группы, равно 2+1+1=4. Значит доля неверно отнесённых наблюдений равно 4 / 281 = 1,4% . По сравнению с уравнением по таблице 2, в уравнение по таблице 3 также было введено в 2 раза больше признаков-предикторов.

  Сравнение этих трёх таблиц говорит о том, что удаление признаков с пропусками увеличивает количество анализируемых наблюдений, и в результате получаются уравнения, которые дают более точное объяснение различий сравниваемых групп. Отметим, что данная реакция на удаление признаков с пропусками, не всегда даёт более лучшие варианты уравнений. Также отметим, что уравнения по таблицам 2 и 3 оценивались по одинаковым объёмам наблюдений, т.е. по 281 наблюдению. Однако при этом последнее уравнение отличалось от предыдущего другим алгоритмом оценки. Что в итоге дало более лучший результат.

 Весьма важным направлением, после получения подобных таблиц, является оценка причин, по которым некоторые наблюдения (пациенты) переведены полученным уравнением из своей собственной группы в иную группу. При детальном выполнении метода логистической регрессии, создаются таблицы со значениями основного показателя BETA для каждого наблюдения, а также таблицы со значениями вероятностей отнесения каждого наблюдения в каждую группу сравнения. Проводя сортировку наблюдений по группам и BETA, можно установить конкретные наблюдения, которые отнесены уравнением не свою группу. После чего полезно установить значения предикторов уравнения для каждого из таких наблюдений, и тем самым установить причины такого перевода из фактической группы в другую. Причины таких переводов могут быть разные. Например, в этих наблюдениях отдельные предикторы могут иметь либо ошибочные значения, либо весьма оригинальные, редкие по величине значения, либо весьма редкие комбинации этих значений по нескольким предикторам.

  Другой часто встречаемой причиной является принадлежность этих наблюдений к некоторым конкретным подгруппам иных признаков. И в этом случае полезно провести оценки уравнений логит-регрессии не по всей БД, а раздельно по подгруппам этих иных признаков. Такой подход оптимально планировать сразу при подготовке этого этапа исследования, используя потенциально самые разные группировки наблюдений. Естественно это увеличит объём самой работы, но зато будут получены более надёжные и ценные уравнения.

  Оценки разных уравнений логистической регрессии помогают исследовать разные механизмы появления различных группировок наблюдений (пациентов). Для этого следует производить оценки этих уравнений используя 3 принципиально разные наборы потенциальных признаков-предикторов. Например, использовать только те признаки, которые в принципе не могут быть изменены какими-то воздействиями. Такими признаками являются возраст пациента, его пол, разные признаки анамнеза, и т.п. Второй набор потенциальных признаков-предикторов может содержать только те признаки, которые доступны к изменения их значений с помощью определённых механизмов. Наконец, третий набор потенциальных признаков-предикторов содержит обе предыдущие группы, т.е. практически все имеющиеся признаки.

  Важным способом установления специфики влияния неизменных признаков, является проведение оценок уравнений логит-регрессии раздельно в подгруппах этих признаков. Например, можно провести вначале оценки уравнений по всей БД, используя указанных 3 вида потенциальных признаков-предикторов. А затем сделать аналогичные оценки используя раздельно БД для пациентов мужского пола. А далее - для пациентов женского пола. Отметим, то продуктивность этого подхода зависит ещё и от общего количества наблюдений в самой БД и подобных раздельных подгрупп. 

Завершая данную вводную статью о методе логистической регрессии, отметим, что основными целями использования этого метода является весьма  глубокое изучение структуры исследуемого явления. Что позволяет делать выбор признаков-предикторов влиящих на вероятности попадания наблюдений (пациентов) в отдельные сравниваемые группировки. А также делать и выбор тех признаков, с изменением значений которых, в нужном направлении, существенно повышается вероятность перевода наблюдений из одной группы, в другую. Например, перевод пациентов из группы "Больные" в группу "Здоровые".

Для знакомства с теорией данного продуктивного метода, и примерами его использования на многих реальных БД медиков-исследователей, следует прочитать все остальные 9 статей данной серии:
     http://biometrica-tomsk.ru/logit_1.htm     http://biometrica-tomsk.ru/logit_2.htm 
     http://biometrica-tomsk.ru/logit_3.htm     http://biometrica-tomsk.ru/logit_4.htm
 
     http://biometrica-tomsk.ru/logit_5.htm     http://biometrica-tomsk.ru/logit_6.htm 
     http://biometrica-tomsk.ru/logit_7.htm     http://biometrica-tomsk.ru/logit_8.htm
     http://biometrica-tomsk.ru/logit_9.htm    


 

Далее: 1. Логистическая регрессия. Основные понятия и возможности метода.

Мониторинг качества научных медицинских публикаций


Обращение межрегионального Общества специалистов доказательной медицины в ВАК РФ


Ответ на письмо Леонова В.П. от  начальника Управления аттестации научных и научно-педагогических работников Федеральной службы по надзору в сфере образования и науки Н.И. Аристера


СТАТИСТИКА УМЕЕТ МНОГО ГИТИК.
С.Е. Бащинский, главный редактор  Международного журнала медицинской практики, 1998; №4, с.13-15.




Предложения зарубежных исследователей о важных методах статистического анализа

  Начиная с 2010 года зарубежные исследователи по медицине, биологии, и многим иным направлениям, чаще стали обращаться по своим просьбам статистического анализа в наш НЦ БИОМЕТРИКА. Которые затем часто и упоминают о нас в своих статьях. И поэтому для проведения нами статистического анализа они как раз и поддерживают использование предлагаемых им многих сложных многомерных методов анализа. А также использовать для них и многие стандартные парные методы статистического анализа, но уже по более глубоким аспектам. И получая результаты этих сложных методов статистического анализа, эти исследователи как раз и осознают реально сложными свои технологии. Что и позволяет им обнаруживать и устанавливать детали новых улучшений своих технологий.


НЦ БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами НЦ пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )

Примеры оформления заказчиками базы данных, описания признаков и целей статистического анализа этой базы данных

Островок  здоровья

Пример 1    Пример 2  
Пример 3


Пример "ПРОГРАММА РАБОТ по статистическому анализу" базы данных Исследователя. Леонов В.П. ... При этом содержание подобных "ПРОГРАММ..." определяются приводимыми 5-ю деталями. ...  В данном примере "ПРОГРАММЫ..." приводится 22 БЛОКА по конкретным методам анализа и графикам.


Отзывы исследователей по статистическому анализу их баз данных




Примеры "Программы по статистическому анализу", и подобных результатов статистического анализа по таким "Программам"

Конференция по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению», (24 - 27 сентября 2015 года).

Камчатская биометрика-2014. Семинар по биометрике в камчатском НИИ КамчатНИРО. (24.03.2014 - 3.04.2014).

Статистика - это что? Статистика - нужна зачем? Статьи читаем - зачем? Статьи пишем - зачем? Краткая версия лекции для слушателей-медиков в Ереване, прочитанной в 2014 году по Скайпу.


В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.

ОТЗЫВ Шрамко Светланы Владимировны, доцента кафедры акушерства и гинекологии ДПО ГИУВ, г. Новокузнецк, о сотрудничестве с БИОМЕТРИКОЙ. "Выражаю огромную признательность и благодарность Леонову Василию Петровичу и его коллегам - коллективу центра БИОСТАТИСТИКА за эффективную и плодотворную работу. ... На мой взгляд, наиболее ценным является возможность обучения статистике, предлагаемый формат общения позволяет не только обсуждать полученные результаты, но и вместе с этим развиваться, расти диссертанту и в какой-то степени облагораживаться. Имея опыт написания кандидатской диссертации, поняла - как примитивны методы статистической обработки материала, которыми я владею, как мало я знаю!

ОТЗЫВ Арутюнян М.Р., врач-стоматолог, г. Саратов.

Здравствуйте, уважаемый Василий Петрович!  Хочу выразить огромную благодарность Вам и Вашим коллегам за высокий профессионализм, индивидуальный и внимательный подход и высокое качество исполнения своей работы! ... До сотрудничества с Василием Петровичем я пыталась самостоятельно разобраться в статистических методах анализа и прочитала не одно руководство. Но, чем больше я читала, тем больше осознавала, что ничего не понимаю. Все мои представления о статистической обработке данных заключались в расчёте средних показателей, стандартных отклонений и их сравнении. Я и представить себе не могла о существовании таких интересных методов анализа, как кластерный анализ, анализ таблиц сопряжённости, корреляционный анализ, логистическая регрессия!

Список научных и учебных изданий по биометрике и статистике

Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях. Почему появилась эта статья? За время существования сайта БИОМЕТРИКА его автору пришло довольно много писем, в которых читатели консультировались относительно различных нюансов использования и описания методов статистики в статьях и диссертациях. Этот поток писем периодически возрастал после публикаций статей автора на сопутствующие темы в "Бюллетене ВАК РФ",  "Международном журнале медицинской практики",  "Медицинской газете",  "Сибирском медицинском журнале", а также непосредственно на сайте БИОМЕТРИКА. С каждым годом таких писем становится все больше...

Леонов В.П. Общие проблемы применения статистики в биомедицине. 

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК N5 1997 г. В.П.Леонов, П.В.Ижевский.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

Леонов В.П. Факторный анализ: основные положения и ошибки применения.

История биометрики


На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА , рекомендую перейти на файл "Поиски методов или результатов статистического анализа".


Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях. ______    _______Международный журнал медицинской практики, 1998 г., вып. 4. В.П. Леонов, П.В. Ижевский

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.   ЧАСТЬ 2. ИСТОРИЯ БИОМЕТРИКИ И ЕЁ ПРИМЕНЕНИЯ В РОССИИ. Леонов В.П.

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.  ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ  "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П.

Применение статистики в статьях и диссертациях по медицине и биологии. Часть IV. Наукометрия статистической парадигмы экспериментальной биомедицины.     Международный журнал медицинской практики, 2002 г. вып. 3. Леонов В.

Общие проблемы применения статистики в биомедицине,  или что разумнее: ДДПП или ДППД?

Леонов В.П. Ошибки статистического анализа биомедицинских данных.  Международный журнал   медицинской практики,  2007, вып. 2, стр.19-35.
Ошибка – это …
Ошибка или обман?

Обзоры ошибок применения статистики в медицине

Причины возникновения ошибок и меры борьбы с ними

Ошибки описания статистических методов

Меметический анализ описаний методов статистики

Локализация ошибочных описаний внутри научных школ

Мемы камуфляжных описаний

Смутно пишут о том, о чём смутно представляют

Коварный t-критерий Стьюдента

«… не зная законов языка ирокезского, можешь ли ты делать такое суждение  по  сему предмету…»

Что же делать, чтобы избежать ошибок?

Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях

Сравниваем средние, а также и ... В. Леонов

Проценты - статистический анализ? Или проценты - арифметический анализ?
В. Леонов
.

Мотивом к написанию данной статьи стал следующий инцидент. 11 апреля 2016 г. я получил вот какое письмо.

Уважаемый Василий Петрович!

Я являюсь одним из читателей Вашего сайта "Биометрика", который нашёл по ссылке, размещённой на странице http://bono-esse.ru/blizzard/ais.html C большим интересом ознакомившись, в частности, с разделом "Кунсткамера", обращаюсь к Вам с несколько необычным вопросом по независимому, неформальному рецензированию работы ....

P.S. Сайт дополнен PDF-файлом полной версии данной статьи.


НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ  (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). В.П.Леонов. Вестник Томского государственного университета. Серия "Математика. Кибернетика. Информатика". №275. АПРЕЛЬ 2002, стр. 17-24.

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ МЕДИКОВ И БИОЛОГОВ (время и опыт).
Леонов В.


ВАК для учёных? или ВАК для… бумагомарак? «ТРОИЦКИЙ ВАРИАНТ» № 8 (127), 2013 год. К середине 2017 года статью прочитали более 50 тысяч читателей...


Статистика - это что? Статистика - нужна зачем? Статьи читаем - зачем? Статьи пишем - зачем? Краткая версия лекции для слушателей-медиков в Ереване, прочитанной в 2014 году по Скайпу.


«Роющая деятельность кабана». Статья в "Независимой" газете...



Музыка для души ...

Послушать и скачать...

    При многочисленной работе с описаниями статистических процедур, и т.д., реально появляется усталость. И для улучшения дальнейшей работы можно прослушать хорошие песни и музыку, увидев при этом также интересные видео. В указанной вверху ссылке приведены много разных вариантов видео-песен с сообщениями о Томске и о Томском государственном университете. А также очень много видео-песен с  Анной Герман. И с остальными певцами: Мария Максакова, Лев Лещенко, Юрий Антонов, Игорь Скляр, Валерий Ободзинский, Владимир Трошин, Галина Хомчик, Виктория Иванова, Юрий Кукин, Олег Митяев, Юрий Визбор, Юрий Кукин, и т.д. Можно прослушать и скачать используемые при этом видео-файлы  *.mp4, применив для этого программу Ummy Video Downloader.



Доказательная или сомнительная?
Медицинская наука Кузбасса: статистические аспекты.
ВВЕДЕНИЕ
ДОКАЗАТЕЛЬНАЯ МЕДИЦИНА И СТАТИСТИКА
.
КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?
ПРОЦЕНТЫ – ПРИМИТИВНО? ЗАТО ДОСТУПНО!

СТАТИСТИЧЕСКАЯ ВАМПУКИЗАЦИЯ,  ОНА ЖЕ ВСЕОБЩАЯ СТЬЮДЕНТИЗАЦИЯ
.
«ЛОШАДЕНДУС СВАЛЕНДУС С МОСТЕНДУС».
КАК ПРАВИЛЬНО: EXCEL ИЛИ EXEL, WINDOWS ИЛИ WINDOUS,
MICROSOFT ИЛИ MIKROSOFT, STATISTICA ИЛИ STATISTIKA?
 
ЗЕММЕЛЬВЕЙС И СТАТИСТИЧЕСКАЯ ТЕХНИКА БЕЗОПАСНОСТИ.
«ЗАЧЕМ НАМ КУЗНЕЦ? НАМ КУЗНЕЦ НЕ НУЖЕН». ПРИМЕРЫ ПОДРОБНОГО ОПИСАНИЯ.
КТО ВИНОВАТ?  ЧТО ДЕЛАТЬ?
ВМЕСТО ЗАКЛЮЧЕНИЯ.

Весь обзор одним файлом


Примеры отличных результатов статистического анализа в диссертациях, дипломных работах и статьях полученных с нашей помощью.

О.Я. Васильцева. Закономерности возникновения, клинического течения и исходов тромбоэмболии легочной артерии по данным госпитального регистра патологии.  (диссертация на соискание учёной степени доктора медицинских наук)

В.В. Половинкин. Тотальная мезоректумэктомия — фактор повышения эффективности лечения среднеампулярного и нижнеампулярного рака прямой кишки.  (диссертация на соискание учёной степени доктора медицинских наук)

В.А. Габышев.  Фитопланктон крупных рек Якутии и сопредельных территорий восточной Сибири.  (диссертация на соискание учёной степени доктора биологических наук)


В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года). Чтобы не допускать ошибок в использовании и описании статистики в статьях и диссертациях, следует прочитать материалы представленные в КУНСТКАМЕРЕ - коллекции диссертаций и статей по медицине и биологии, с набором статистических ошибок и нелепостей.

Экспозиция 1  Экспозиция 2 
Экспозиция 3  Экспозиция 4
Экспозиция 5
  Экспозиция 6 
Экспозиция 7   Экспозиция 8
Экспозиция 9   Экспозиция 10
Экспозиция 11  Экспозиция 12
Экспозиция 13  Экспозиция 14
Экспозиция 15  Экспозиция 16
Экспозиция 17


Статистика в кардиологии. 15 лет спустя. Журнал "Медицинские технологии. Оценка и выбор", 2014, №1, с. 17-28. Леонов В.П.

В. Леонов. Общие проблемы применения статистики в биомедицине. ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК N5 1997 г. В.П.Леонов, П.В.Ижевский.\

В. Леонов. Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях. 

В. Леонов. Общие проблемы применения статистики в биомедицине.

В.П.Леонов. Применение разведочного анализа для оценки исходных данных (на примере наблюдений по уролитиазу)

Леонов В.П. Классификация ошибок применения статистики в отечественной медицине. Материалы научной конференции "Системный анализ в медицине" (САМ 2007). Благовещенск, 2007, Амурский государственный университет.

Леонов В.П. Камуфляжные мемы инфоценоза научных школ. Материалы Международной научной конференции 15-16 июня 2007  г. "Философия математики: Актуальные проблемы." - Московский государственный университет.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

Леонов В.П. Принципы описания статистики в биомедицинских публикациях. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).


Пример "ПРОГРАММА РАБОТ по статистическому анализу" базы данных Исследователя. Леонов В.П. ... При этом содержание подобных "ПРОГРАММ..." определяются приводимыми 5-ю деталями. ...  В данном примере "ПРОГРАММЫ..." приводится 22 БЛОКА по конкретным методам анализа и графикам.

На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА , рекомендую перейти на файл "Поиски методов или результатов статистического анализа".


Наш адрес       Сайт БИОМЕТРИКА создан в 1997 г. © Василий Леонов

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Пример "ПРОГРАММА РАБОТ по статистическому анализу" базы данных Исследователя

Доклад "Почему и как надо учить медиков статистике?" В. Леонов.