Яндекс.Метрика ПРОГРАММА ПО СТАТИСТИКЕ

Каждый слышит то, что понимает. Гете

Статистика посещаемости БИОМЕТРИКИ


16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страниц
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы
Если приходят, значит полезное находят.
.  
Наш 
адрес:  
Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...
Полезно:...Мнения исследователей о продуктивности многих методов
статистического анализа
...

    На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА, рекомендую перейти на файл "Поиски методов или результатов статистического анализа" ...  Можете просматривать все графики по данной тематике...

Пример
"ПРОГРАММА РАБОТ
по статистическому анализу"
базы данных Исследователя

Леонов В.П.

 

После того, как Исследователи высылают нам согласно образцам  Пример 1, Пример 2, и Пример 3, описания своих баз данных (БД) и цели проводимых ими исследований, мы высылаем им три варианта первой версии "ПРОГРАММЫ по статистическому анализу" БД Исследователя. Подобные примеры результатов использования таких "ПРОГРАММ" и представлены в диссертациях и статьях этих Исследователей. Многие авторы этих БД сообщают также о результатах этих "ПРОГРАММ" и в своих отзывах о сотрудничестве с нашим НЦ БИОМЕТРИКА. При этом содержание подобных "ПРОГРАММ по статистическому анализу" их БД определяются следующими 5-ю деталями.

Во-первых, содержание "ПРОГРАММЫ по статистическому анализу" ориентируется на сформулированной самим Исследователем цель своего научного исследования.  Например, у медиков чаще всего такой целью исследования является использование результатов статистического анализа своей БД на улучшение медицинской технологии лечения пациентов. А у социологов или психологов цель исследования направлена на установку основных взаимосвязей между ответами опросников по большинству конкретных вопросов. Исследователи по биологии желают определить наличие или отсутствие взаимосвязи между всеми используемыми признаками, которые являются количественными или группирующими. При этом сами медики, биологи или социологи некоторые признаки устанавливают самыми основными. Для которых им желательно получить уравнения, определяющие их значения набором конкретных переменных.

Детализация описываемой Исследователем своей цели исследования определяется его уровнем восприятия своей БД, а также уровнем раельной сложности своей используемой технологии. Оценивая при этом используемую свою технологию как элементарную, несложную, соответственно и цель своего исследования также описывается как очень простая. И таких Исследователей чаще всего интересуют лишь проверку равенства групповых средних или анализ только парной корреляции. Тогда как Исследователи, осознающие свои технологии реально сложными и желающими существенно улучшать их продуктивность, описывают свою цель исследования гораздо больших объёмов. При этом и понимают, что в этих сложных технологиях существуют соответственно и сложные зависимости между многими используемыми признаками своих объектов. Почему и одобряют использование поиска этих сложных зависимостей, которые и необходимо оценивать разными многомерными методами статистического анализа.

В описании цели исследования по своей БД, от знания владельцем этой БД методов статистического анализа, могут быть или не быть предложения конкретных методов анализа. Однако это не отрицательный эффект описания своей цели исследования. Поскольку реально каждый профессионал должен быть глубоко проинформирован именно в своей специальности. Соответственно и профессионалы по статистике также не имеют глубокого знания по медицине, биологии, социологии, и т.п. Важно лишь то, чтобы Исследователь очень подробно и описал цель исследования, используя при этом все конкретные названия признаков своей БД.

 Для получения продуктивных результатов, предлагаемых Исследователем своей зависимостью, необходимо использовать немало разных методов статистического анализа. Для чего мы с коллегами и применяем разные БЛОКИ методов анализа в разработке "ПРОГРАММЫ по статистическому анализу" по его БД. От этого и производится выбор вводимых в три варианта первой версии "ПРОГРАММЫ" очень важных методов статистического анализа. Многолетний наш опыт разработки этих первых версий "ПРОГРАММЫ" свидетельствует о том, что примерно 75% этих пробных методов анализа оказываются самыми полезными для реализации сформулированной Исследователем своей цели исследования. Почему Исследователь и одобряет такой вариант "ПРОГРАММЫ".

Второй деталью содержания этих "ПРОГРАММ по статистическому анализу" являются реальные объёмы наблюдений и число установленных Исследователем признаков в этой БД. Так при небольшом объёме БД и малом количестве признаков, предлагаемая Исследователю первая версия "ПРОГРАММЫ", имеет очень малое количество методов анализа. Соответственно при наличии большего объёма БД, с немалым количеством используемых признаков, можно в первой версии по анализу такой БД предлагать и большее количество продуктивных методов статистического анализа. Таким образом, объёмы БД реально влияют и на объёмы своих целей исследования, описываемых авторами БД. Что также влияет и на объёмы предлагаемых высылаемые нами три варианта первой версии "ПРОГРАММЫ". И высылаемые три варианта "ПРОГРАММЫ" производим с коллегами раздельно пробные анализы по всем БЛОКАМ работы.  И затем обсуждаем эти пробные результаты анализа по СКАЙПУ, показывая им эти результаты, и объясняя цели исследования каждого метода анализ. От чего сам Исследователь и может выбирать вариант "ПРОГРАММЫ", либо что-то удаляя, или что-то добавляя в используемую им "ПРОГРАММУ". Детали таких направлений будут описаны подробнее ниже в следующих аспектах.

Третьей деталью, влияющей на метод статистического анализа предлагаемой БД, является наличие в этой БД скрытых, неизвестных группировок наблюдений. Многолетний опыт статистического анализа автора этой статьи свидетельствует о том, что часто в реальных БД действительно имеются скрытые группировки наблюдений. Т.е. нередко среди анализируемых медиками своих пациентов и есть не только стандартные подгруппы, но и существенно различные группы пациентов. В кластерном анализе, используя раздельно количественные или качественные (группирующие) признаки, и в зависимости от объёма БД, обнаруживаются примерно от 2-х до 5 скрытых группировок наблюдений. А чаще всего обнаруживаются 2 - 3 таких важных группировок. Можно просмотреть примеры графиков с такими результатами. Многолетний опыт использования этого аспекта в БД многих Исследователей показывает, что данный аспект оказывается продуктивным примерно в каждой второй БД. В результате и могут быть установлены новые группирующие признаки. И раздельное использование этих скрытых группировок позволяют получать в них различающиеся результаты по одним и тем же многомерным методам анализа. В которых и отражаются основные, но не идентичные результаты по цели исследования автора БД. Т.е. наличие этих скрытых группировок и подтверждают сложность используемых Исследователем своих технологий.

Исследователи, у которых их технологии несложные, отказываются от проверки наличия неизвестных группировок в их БД по предлагаемой первой версии "ПРОГРАММЫ". Однако и получаемые при этом исходные зависимости оказываются менее продуктивными, нежели получаемые раздельно по этим скрытым группировкам.

Четвёртая деталь первой версии "ПРОГРАММЫ по статистическому анализу" связана с наличием в исходной БД группирующего признака, который имеет 2 или более подгрупп типа "До лечения" и "После лечения", приведённых ниже на графике.

tabl_2

 Соответственно в такой  БД используется признак с этими двумя градациями: 1="До лечения", 2="После лечения". При использовании подобного группирующего признака  с двумя или более градациями, производится сравнение этих подгрупп с помощью многих одномерных и многомерных методов статистического анализа. Если же в этих сравниваемых подгруппах используются одни и те же пациенты, то из исходной БД  формируется новая БД, структура которой приведена ниже. В которой используются в виде признаков разного названия один и тот же прежний признак, имеющий значения в периоды "До лечения" и "После лечения", и т.п.  Соответственно в этой новой БД увеличивается число количественных признаков. И их анализ для прежних группирующих признаков как раз и окажется весьма продуктивным. И тогда такая новая БД с двумя подгруппами и количественных, и качественных признаков, имеет вид типа  tabl_4 .

   Соответственно для этих различающихся по признакам двух или более, для новых БД аналогично формируются две или более разные "ПРОГРАММЫ" для каждой из этих БД. Продуктивность такой новой второй  БД заключается в том, что для отдельных новых количественных признаков в подгруппе "После лечения" можно оценивать с помощью многомерных методов зависимости конкретного признака от значений всех остальных количественных признаков из подгруппы "До лечения". Если же при этом в период "После лечения" повторно фиксируется не только количественные признаки, то также для этих группирующих признаков продуктивно используется и метод логистической регрессии.

   При этом как для логистической регрессии, так и для количественной множественной регрессии, используются 3 варианта потенциальных предикторов. В первом варианте используются только признаки периода "До лечения". Во втором вариане используются только признаки периода "После лечения". А в третьем варианте используются потенциальные предикторы обоих подгрупп "До лечения" и "После лечения". Соответственно при наличии 3-х подгрупп используются признаки из следующих 7 вариантов подгрупп: 1;   2;   3;  1+2;  1+3;  2+3;   1+2+3.  И т.п. Результаты этих уравнений покажут, какие же самые важные признаки оказывают влияния на различие этих сравниваемых подгрупп. А какие признаки при этом не оказывают влияние на различие этих подгрупп. И эти влияющие признаки упорядочиваются по степени их влияния на различие сравниваемых подгрупп.

    Пятая деталь расширения версии "ПРОГРАММЫ по статистическому анализу" возникает когда в БД имеется немалый объём наблюдений, но при этом всего лишь немного количественных признаков. Тогда для продуктивного статистического анализа из этих  исходных признаков создаются новые варианты усложнённых количественных признаков. При этом число новых количественных признаков оказывается существенно больше числа исходных количественных признаков. Варианты этих новых признаков оцениваются результатами их использования в пробных анализах при разработке первой версии "ПРОГРАММЫ".

   Чаще всего проверяется продуктивность следующих вариантов создания новых количественных признаков. Например, если в БД всего 6 количественных признаков PR1, PR2, ..., PR6, то создаются 6 новых количественных признаков, вычисляя по каждому исходному признаку его логарифм. Т.е. новый признак LN1 = Log(PR1), и т.д. Следующие признаки создаются в виде умножения пары исходных признаков. Т.е. новый признак UM12 = PR1 * PR2, UM13 = PR1 * PR3, ..., UM56 = PR5 * PR6. Таким образом количество новых таких признаков будет равно 6*(6-1)/2 = 15. Аналогично 15 новых признаков создаются в виде деления пары исходных количественных признаков.  Т.е. новый признак DEL12 = PR1/PR2, DEL13 = PR1/PR3, ..., DEL56 = PR5/PR6.

  Следует учитывать нелинейные зависимости между исходными признаками, и их зависимости с разными группирующими признаками. Тогда из 6 исходных признаков создаются следующие 6 новых признаков: KK1 = корень квадратный из PR1, ... , KK6 = корень квадратный из PR6.

 Очередные 6 новых признаков создаются путём возведения в квадрат каждого исходного признака. Т.е. KV1 = PR1 * PR1, ..., KV6 = PR6 * PR6.

  Итак, из 6 исходных количественных признаков созданы 6+15+15+6+6 = 48 новых признаков. И с учётом исходных 6 количественных признаков, общее число этих признаков будет равно 6+48 = 54.

    По каждой своей БД Исследователи присылают описания признаков и группировок наблюдений, согласно образцам Пример 1, Пример 2, и Пример 3. Ниже приводится пример таких описаний.

Описание признаков Описание подгрупп

NUMBER='Номер наблюдения'
GYF2 = 'Возраст матери, лет'
GYF3F = 'Паритет беременностей'
GYF4F = 'Паритет родов'
GYF5F = 'Этническая принадлежность'

.....

GYF132 = 'III_АЧТВ'
GYF133 = 'III_ПТВ'
GYF134 = 'III_ТВ'
GYF135 = 'III_Фибриноген'
GYF136 = 'III_РФМК'

GYF3F
1 = 'Первород'
2 = 'Повторрод'

GYF14F
1 = 'Некурящие'
2 = 'Курящие'

.....

GYF97F
1 = 'Без осложнений'
2 = 'Легкая'
3 = 'Средняя'

  Используя подобные названия, автор БД подробно и описывает цель исследования. Что позволяет нам при разработке 3 вариантов первой версии "ПРОГРАММЫ по статистическому анализу", используя пробные методы статистического анализа, и ввести те самые БЛОКИ программы, которые и оказываются продуктивными. И затем в 3-х вариантах "ПРОГРАММЫ" предлагаются конкретные методы статистического анализа.

  Далее приводится краткий пример 1-го варианта "ПРОГРАММЫ" по очень ценной БД. Обычно второй вариант первой версии содержит количество пунктов меньше примерно на 25%, а третий вариант - примерно на 50% меньше чем в первой версии. Эти три варианта "ПРОГРАММЫ" высылаются Исследователю, и сразу же обсуждаются по Скайпу. В этом обсуждении Исследователю демонстрируются результаты пробных анализов, и по этим результатам Исследователь сам выбирает нужный и приемлемый ему вариант "ПРОГРАММЫ". Также при необходимости он либо удаляет ненужные ему исследования, либо напротив, дополняет в один из вариантов новые исследования, и высылает нам собственный второй вариант "ПРОГРАММЫ по статистическому анализу". Реальное количество пунктов в каждом из описанном БЛОКЕ разные. Поскольку они зависят как от количества признаков в БД, так и от описания цели исследования по этой БД. Автор описанной ниже БД была кардиологом, и она создавала свою докторскую диссертацию. Так по её согласию были сохранены все 22 БЛОКА, со 164 пунктами в одобренной ей версией "ПРОГРАММА по статистическому анализу". Ниже и приводятся эти 22 БЛОКА, в каждом из которых приводится лишь 1-3 пункта с описанием метода статистического анализа, или описанием построения графиков по предыдущему БЛОКУ.

_________________________________________________________________________________

"ПРОГРАММА РАБОТ по статистическому анализу"
базы данных Исследователя

  Проведение поиска и исправления опечаток массива БД, состоящего из 358 наблюдений по 29 группирующим и 30 количественным признакам. Для этого по всем приводимым ниже признакам создаётся таблица с минимальными и максимальными значениями каждого признака. А также приводится количество значений каждого признака. После чего высылается Исследователю этой БД файл с такими значениями для перепроверки наличия или отсутствия ошибочных значений в БД, и проверки количества пропущенных значений каждого признака. При подтверждении владельцем данной БД отсутствия опечаток, по ней и производятся пробные статистические анализы для их выбора и ввода в 3 варианта "ПРОГРАММЫ по статистическому анализу" данной БД. Ниже представлены таблица со списком кратких названий исходных признаков этой БД. Где признак NUMBER содержит номер наблюдения в БД. Краткие названия признаков БД используются нами при создании специальных программ разных алгоритмов для основных пакетов статистического анализа. Все эти признаки в самой БД также содержат и подробные описания каждого признака. Например, PR1L= "Пол", PR30 = "Систолическое АД", и т.д. Поскольку все эти названия признаков высылает сам Исследователь вместе со своей БД согласно Пример 1, Пример 2, и Пример 3. И при этом результаты статистического анализа, одобренного самим Исследователем, содержат краткие и подробные описания признаков. Что существенно улучшает этому Исследователю осознавать получаемые большие объёмы многих результатов статистического анализа его БД. Ниже приводятся все краткие названия признаков этой БД, а также подробные описания 5 новых признаков, полученных в результате анализа по БЛОКУ 1.

NUMBER
PR1L      
PR2L        
PR3L      
PR4L        
PR5L        
PR6L      
PR7L        
PR8L        
PR9L

PR10L    
PR11L    
PR12L    
PR13L    
PR14L    
PR15L    
PR16L    
PR17L    
PR18L    
PR19L 

PR20L    
PR21L    
PR22L    
PR23L    
PR24L    
PR25L    
PR26L    
PR27L   PR28L  PR29L

PR30 PR31 PR32 PR33   
PR34 PR35 PR36
PR37
PR38
PR39
PR40
PR41
PR42
PR43
PR44
PR45
PR46
PR47 PR48 PR49
PR50
PR51
PR52
PR53
PR54 PR55 PR56 PR57 PR58 PR59
CL2_KACH = 'Кластеры 1-2 по кач. признакам'
CL3_KACH = 'Кластеры 1-3 по кач. признакам'
CL4_KACH = 'Кластеры 1-4 по кач. признакам'
CL2_KOL= 'Кластеры 1-2 по кол. признакам'
CL3_KOL = 'Кластеры 1-3 по кол. признакам'

 

 

 

 

 

 

 

 

 

 

БЛОК 1

   В данном БЛОКЕ анализ устанавливает наличие латентных, скрытых группировок наблюдений. Для этого используется 2 варианта. В частности,  с использованием 25 основных качественных признаков (первый вариант), и 29 основных количественных признаков (второй вариант). При первом варианте кластерный анализ используют не по всей БД, а по 350 наблюдениям, в которых во всех используемых 25 группирующих признаках нет пропусков значений. А во втором варианте используется 347 наблюдений, в которых во всех используемых 29 количественных признаках нет пропусков значений. В результате при проведении первого варианта кластерного анализа дополняются 3 новых группирующих признаков, а при проведении второго варианта кластерного анализа дополняются 2 новых группирующих признаков.  Можно просмотреть примеры графиков с такими результатами.

 Далее изучаются структуры этих новых группировок наблюдений. Т.е. последующие БЛОКИ статистического анализа ответят на вопрос, какие конкретно из количественных или качественных признаков вносят наибольшие вклады в различия между собой скрытых группировок по каждой из этих новых 5 латентных группировок. А затем  будут установлены взаимосвязи каждого кластера с каждым группирующим и количественным признаком. Важность использования данного БЛОКА 1, и полученных при этом результатов, обусловлена тем, что для проводимого анализа необходимо установить скрытые имеющиеся неоднородности наблюдений, которые определяются сочетаниями значений всех количественных исходных признаков. А также связи этих новых группировок с предыдущими группирующими признаками. Полученные 5 новых группирующих признаков, в результаты исполнения пунктов БЛОКА 1, будут добавлены в список  группирующих признаков. В результате общее число качественных, группирующих признаков станет равным 29+5=34. В каждом пункте данного БЛОКА строится график соединения всех наблюдений в раздельные кластеры, а также создаются таблицы с содержанием использованных наблюдений в выделяемые скрытые подгруппы. Ниже приводятся 2 примера таких пунктов данного БЛОКА.

  Проведение иерархического кластерного анализа с использованием набора 25 качественных признаков, имеющим по каждому признаку 350 значений. В результате образуется новый группирующий признак CL2_KACH = 'Кластеры 1-2 по кач. признакам', содержащий значения номера кластера, к которому относится каждое конкретное наблюдение. 
   Проведение иерархического кластерного анализа с использованием набора 29 количественных признаков, имеющим по каждому признаку 347 значений. В результате образуется новый группирующий признак CL2_KOL='Кластеры 1-2 по кол. признакам', содержащий значения номера кластера, к которому относится каждое конкретное наблюдение. 

 

БЛОК 2

      В данном БЛОКЕ производится анализ таблиц сопряжённости между указанными Исследователем важными качественными признаками со всеми остальными качественными признаками. Это необходимо для установления интенсивности взаимосвязей имеющихся важных группировок со всеми остальными качественными признаками. При наличии статистически значимой связи, для конкретной пары качественных признаков, устанавливается структура этой связи. В частности, оцениваются вклады и направления отдельных клеток в данную связь. То есть в одних клетках таблицы нет связи, а в других клетках связи есть, и они могут быть положительными и отрицательными. Это и определяет, какие конкретные значения пары группирующих признаков как раз реально и зависимы друг от друга, а какие пары значения группирующих признаков как раз и не зависят друг от друга. Что и позволит устанавливать переходы пациентов с одного группирующего значения в другое важное значение. Для чего в каждой клетке такой таблицы сопряжённости вводится по 7 ценных чисел. А результат анализа отображается более 20 значениями. В том числе не только 3 параметра Хи-квадрат, но и коэффициенты интенсивности взаимосвязи, значения статистической значимости. В данном БЛОКЕ также используется оценка Монте-Карло для точного теста перепроверкой путём перевода наблюдений БД до 100 тысяч или до 1 миллиона с оценкой 99%-ных интервалов. Что необходимо, поскольку реально для разных пар анализируемых качественных признаков, число наблюдений может оказываться объёмом лишь в несколько десяток. Можно просмотреть примеры графиков с такими результатами. Также полезно и установление факта не только наличия, но и факта отсутствия значимых взаимосвязей между отдельными парами качественных признаков в данной БД. Ниже приводится 1 пример таких пунктов данного БЛОКА.

   Анализ 33 таблиц сопряжённости между признаком PR10L и всеми остальными 33 группирующими признаками.

 

БЛОК 3

      В данном БЛОКЕ производится анализ многомерных таблиц сопряжённости методом логлинейного анализа с числом категориальных переменных от двух и более. Результаты данного метода сходны с регрессионным и дисперсионным анализами. Что позволяет оценить влияние на различие частот подгрупп конкретного группирующего признака не только отдельных предикторов. Но также и влияние сочетания указанных комбинаций двух и более предикторов. Например, устанавливается влияние на две подгруппы признака PR14L четырёх предикторов PR5L, PR8L, PR12L и PR13L. При этом и будет установлено, какой из этих 4-х предикторов сильнее всего влияет на частоты подгрупп признака PR14L. А также и влияния комбинации пар и троек этих предикторов. Т.е. влияют ли на подгруппы признака PR14L следующие сочетания предикторов: PR5L*PR8L;  PR5L*PR12L;  PR5L*PR13L; и т.п., PR5L*PR8L*PR12L, и т.п. Более того, по этим комбинациям устанавливается значимость влияния сочетаний этих подгрупп. Например, для комбинации предикторов PR5L*PR8L оценивается значимость сочетания подгрупп "нет ИБС" + "нет ПИКС" и "есть ИБС" + "есть ПИКС", и т.п. Первоначальные пункты данного метода анализа производятся по всей БД. Однако с учётом отсутствия во многих используемых признаках разных наборов пропущенных значений, соответственно изменяются комбинации признаков, анализируемых многомерным методом логлинейного анализа. Ниже приводится 1 пример таких пунктов данного БЛОКА.

  Логлинейный анализ многомерной таблицы сопряжённости между признаком PR4L и следующими потенциальными предикторами: PR5L, PR9L и PR24L, по всей БД.

 

БЛОК 4

    В данном БЛОКЕ проверяются гипотезы нормальности распределения каждого количественного признака в отдельных группах сравнения. Поскольку в следующем БЛОКЕ производятся сравнения параметров распределения данных признаков PR30, PR31, ... PR58, PR59 в этих группах. Эта проверка наличия или отсутствия нормальности распределения каждого количественного признака необходима для выбора основного результата по сравнению групповых параметров, а также и к результатам корреляционного анализа. Т.к. в очередном БЛОКЕ используются параметрические и непараметрические методы сравнения. Кроме проверки нормальности распределения анализируемых признаков во всех пунктах данного БЛОКА производится оценка следующих дескриптивных статистик: минимальное и максимальное значения, среднее, ошибка среднего, стандартное отклонение, медиана, мода, а также следующие процентили: 5, 10, 25, 50, 75, 90 и 95%. И все эти дескриптивные статистики позволяют продуктивно осознать специфику нормального или ненормального распределения каждого количественного признака в сравниваемой подгруппе. А также осознать и расположение каждого количественного признака в сравниваемых далее подгруппах. Данный анализ производится по всей БД. Для осознания этой специфики распределения количественного признака в конкретной подгруппе, в следующем БЛОКЕ создаются несколько типов графиков такого распределения. Ниже приводится 1 пример пунктов данного БЛОКА.

    Проверка гипотезы нормальности распределения с помощью критериев Шапиро-Уилка, Колмогорова-Смирнова, Крамера фон Мизеса и Андерсона-Дарлинга для каждого из 30 количественных признаков в группах признака PR16L. Также вычисляются оценки минимального и максимального значения, среднего, ошибки среднего, стандартного отклонения, медианы, моды, и следующие процентили: 5, 10, 25, 50, 75, 90 и 95%. Анализ производится по всему массиву.

 

БЛОК 5

    В данном БЛОКЕ создаются графики с гистограммой распределения каждого количественного количественного признака в каждой подгруппе, в которой производилась проверка нормальности распределения в пунктах БЛОКА 4. В первом рисунке приводятся гистограммы, с названием признака и указанием конкретной подгруппы. А также отражаются частоты и проценты наблюдений, и значения этого количественного признака. И приводится кривая линия нормального распределения с параметрами данного признака. Что и позволяет понять наличие или отсутствие нормального распределения данного признака в конкретной подгруппе. А во втором графике также приводится название признака и указание конкретной подгруппы. И в нём отражается суммарная частота перехода от наблюдения меньшего значения этого признака, к следующему наблюдению увеличенного значения. Соответственно приводится суммарная кривая линия нормального распределения, построенная по параметрам данного количественного признака в этой подгруппе. Такой график улучшает понять, в каком регионе количественного признака имеется наличие или отсутствие нормально распределения. Можно просмотреть примеры графиков с такими результатами. Количество этих двух типов отражающих графиков для каждого из 30 количественных признаков в каждом пункте предыдущего БЛОКА, составит 30*2=60. Ниже приводятся 1 пример пунктов данного БЛОКА.

    Построение для каждого из 30 количественных признаков пары графиков в группах признака PR16L. Также вычисляются оценки минимального и максимального значения, среднего, ошибки среднего, стандартного отклонения, медианы, моды, и следующие процентили: 5, 10, 25, 50, 75, 90 и 95%. Анализ производится по всему массиву.

 

БЛОК 6

   В данном БЛОКЕ производится сравнение следующих параметров: среднее, медиана, мода и дисперсия, для каждого из 30 количественного признака в подгруппах одного качественного признака. Важно, что в данном БЛОКЕ используется оценка Монте-Карло для точного теста перепроверкой путём перевода наблюдений БД до 100 тысяч или до 1 миллиона с оценкой 99%-ных интервалов. При сравнении параметров в 3-х и более подгруппах, обязательно производятся и все попарные сравнения. Т.е., например, для 4-х подгрупп дополнительный результат производится в сравнениях 1-2, 1-3, 1-4, 2-3, 2-4 и 3-4. Что и позволяет установить, в каких парах параметр различается, а в каких парах напротив, параметр не различается. В этом БЛОКЕ используется несколько параметрических и непараметрических методов анализа. При этом данные результаты будут полезны не только для БЛОКА по сравнению параметров групп, но и для БЛОКОВ по дискриминантному анализу и логистической регрессии. Таким образом по данному БЛОКУ количество этих графиков будет равно 30*3*18=1620. Можно просмотреть примеры графиков с такими результатами. Причём расположение этих интервалов в графиках наглядно отображают результаты сравнения групповых параметров количественного признака. Ниже приводится 1 пример пунктов данного БЛОКА.

   Проверка гипотез о равенстве групповых средних, медиан, мод и дисперсий  для каждого из 30 количественного признака с помощью критериев Фишера, Ван дер Вардена, Краскела-Валлиса, Манна-Уитни-Вилкоксона, медианного критерия, Сиджела-Тьюки и Ансари-Брэдли, при сравнении распределения количественных признаков в подгруппах, образованных качественным признаком  PR26L. Анализ производится по всему массиву.

 

БЛОК 7

 В этом БЛОКЕ производятся для каждого количественного признака по 3 типа графиков с распределением сравниваемых параметров групповых количественных признаков. В них представляются максимальные и минимальные значения, средние значения, и квартили конкретного признака. Это позволяет улучшить понятие результатов различия или же равенства указанных параметров, полученных в предыдущем БЛОКЕ. В первом графике вводятся названия количественного и качественного признака, и названия сравниваемых подгрупп. И там же отражаются среднее значение, медиана, квартили, и величина статистической значимости критерия Ван дер Вардена по сравнению двух групп. На втором графике также введены названия количественного признака и сравниваемых подгрупп. И в нём отражаются распределения количественного признака в каждой подгруппе, со значениями медианы, и расположения минимального и максимального значения этого признака в каждой подгруппе. Соответственно приводится и величина статистической значимости Z-критерия по сравнению медиан двух групп. Т.е. на этом графике весьма отчётливо видно, является ли распределение данного количественного признака, в каждой подгруппе, нормальным распределением. Или же напротив, весьма ненормальное распределение. Т.е. в этом случае строка медианы расположена примерно не посредине частотного графика, а сугубо внизу, или сугубо вверху этого графика. Общее количество первого и второго графиков данного БЛОКА равно 30*2*18=1080. Наконец в третьем графике производится построение ROC-кривой, отражающей степень признака переводом наблюдения из первой во вторую подгруппу в отдельном группирующем признаке. При этом в данном БЛОКЕ указывается объём площади по ROC-кривой, отражающей интенсивность взаимосвязи каждого количественного признака по отношению к подгруппам конкретного признака. Т.е. чем больше объём этой площади, тем сильнее взаимосвязь конкретного признака с различием подгрупп. Поскольку ROC-кривые производятся для каждого количественного признака, то в пункте данного БЛОКА количество таких графиков будет равно 30*3=90. И для каждого из таких графиков также приводятся таблицы, содержащие доли сравниваемых двух подгрупп, размер площади под  ROC-кривой,  95%-ный интервал доверия этой площади, индекс Юдена, значения чувствительности и специфичности. Однако для малого количества наблюдений, имеющих одновременно значения количественного и группирующего признака, для таких комбинаций этой пары признаков построение ROC-кривой проблематично. Напомним также, что построение ROC-кривой доступно лишь при сравнении только двух подгрупп. Можно просмотреть примеры графиков с такими результатами. Ниже приводится 1 пример пунктов данного БЛОКА.

   Построение трёх типов графиков с расположением параметров распределения, а также ROC-кривых, отражающих уровень взаимосвязи между каждым конкретным из 30 количественным признаков, и группирующим признаком в двух подгруппах, образованных качественным признаком  PR26L. Анализ производится по всему массиву.

 

БЛОК 8

   В данном БЛОКЕ Программы производится многомерный анализ сравнения средних каждого количественного признака как в самих подгруппах 2 качественных признаков, так и в подгруппах сочетания двух качественных признаков. Т.е. реально оцениваются 3 группирующих признака. Например, в признаке PR4L есть 2 подгруппы, а в признаке PR7L - 3 подгруппы. Тогда будут анализироваться сравнения в двух подгруппах по признаку PR4L. Затем в трёх подгруппах по признаку PR7L. А в сочетании PR4L*PR7L будут анализироваться 2*3=6 подгрупп. Эти результаты будут полезны не только для данного БЛОКА по сравнению параметров групп, но и для БЛОКОВ по дискриминантному анализу и логистической регрессии. Также в этом БЛОКЕ производятся графики с распределением сравниваемых параметров групповых количественных признаков. В таких графиках представляются максимальные и минимальные значения, средние значения, и квартили конкретного признака. Можно просмотреть примеры графиков с такими результатами. Причём расположение этих интервалов в графиках наглядно отображают результаты сравнения групповых параметров количественного признака. Ниже приводится 1 пример пунктов данного БЛОКА.

   Проверка гипотез о равенстве групповых средних, медиан, мод и дисперсий  для каждого из 30 количественного признака с помощью параметрического анализа при сравнении распределения количественных признаков в 2-х, 3-х и 6 подгруппах, образованных качественными признаками  PR4L и PR7L. Анализ производится по всему массиву.

 

БЛОК 9

   В данном БЛОКЕ Программы производится линейный дискриминантный анализ для многомерного сравнения групп  по количественным признакам. При этом используются два пошаговых метода выбора количественных признаков, а также и канонический метод анализа. По результатам этих методов создаётся таблица сопряжённости, содержащая исходную принадлежность группирующих наблюдений и отвод этих наблюдений в сравниваемые подгруппы согласно полученному дискриминантному уравнению. В результате этих методов дискриминантного анализа можно упорядочить введённые в дискриминантные уравнения количественные признаки по максимальности влияния на различия сравниваемых групп. А также установить набор количественных признаков, которые в совокупности не оказывают  влияние на различия этих групп. Первоначально данный метод анализа производится по всей БД. Однако с пропуском во многих количественных признаках конкретных значений, изменяются наборы признаков, анализируемых многомерным методом дискриминантного анализа. В этом же БЛОКЕ создаются графики с расположением наблюдений сравниваемых групп в парах вычисляемых осей. В таких графиках отражаются локальность, близость или удалённость друг от друга сравниваемых групп. Можно просмотреть примеры графиков с такими результатами. А также и прочитать пример использования такого метода анализа. Ниже приводится 1 пример пунктов данного БЛОКА.

   Сравнение групп качественного признака  PR14L, применяя два пошаговых методов выбора дискриминантных уравнений, и канонический метод с использованием всех 30 количественных признаков. Анализ производится по всему массиву.

 

БЛОК 10

    В данном БЛОКЕ производится оценка интенсивности корреляционных связей между всеми парами количественных признаков. Количество таких пар равно 30*(30-1)/2 = 15*29 = 435. Поскольку  пары признаков часто не имеют линейного характера связи, или нормального распределения, то в связи с этим производится оценка двух видов коэффициентов корреляции: Пирсона и Спирмена. Тогда для каждой подгруппы наблюдений приводится 435*2=870 коэффициентов корреляции. И все эти коэффициенты корреляции сортируются по уменьшению модуля коэффициента. Т.е. вначале указывается та пара количественных признаков, у которой максимальная взаимосвязь, а у последней пары признаков самая минимальная связь. И по каждой паре признаков приводится статистическая значимость обоих коэффициентов корреляции. Что позволяет выбрать пары признаков, имеющих парную взаимосвязь, и те пары признаков, которые не связаны между собой. Корреляционный анализ первоначально производится во всей БД, а затем раздельно в подгруппах основных качественных признаков. При этом, с учётом объёма наблюдений в этой БД, используется корреляционный анализ не только в подгруппах одного качественного признака, но и в подгруппах образованных двумя качественными признаками. Например, у признака PR5L есть 2 подгруппы, а у признака PR18L есть 3 подгруппы. И тогда, используя сочетания двух этих качественных признаков, производится анализ корреляции в подгруппах 2*3=6. Соответственно в конкретном пункте этого БЛОКА, при использовании этой пары признаков PR5L и PR18L, приводится 870*6=5220 коэффициентов корреляции. Цель этого анализа заключается в поиске ответа на вопрос: влияет ли принадлежность наблюдений к той или иной подгруппе одного конкретного качественного признака, или в сочетании двух качественных признаков, на величину и статистическую значимость парных связей всех количественных признаков. А также и на установку типа парной взаимосвязи. То есть уменьшается или увеличивается коэффициент корреляции для одной и той же пары количественных признаков в зависимости от того, к какой группирующей градации принадлежат анализируемые наблюдения. Можно просмотреть примеры графиков с такими результатами. Ниже приводятся 2 примера пунктов данного БЛОКА.

   Оценка коэффициентов корреляции Пирсона и Спирмена для всех пар 30 количественных признаков. Анализ производится по всему массиву в целом.
   Оценка коэффициентов корреляции Пирсона и Спирмена для всех пар 30  количественных признаков. Анализ производится в подгруппах признака PR1L.

 

БЛОК 11

    В данном БЛОКЕ для отображения вида реальной зависимости количественных признаков в разных подгруппах, вычисляемой в предыдущем БЛОКЕ, создаётся 2 специальных варианта графика с осями парных признаков. В первом варианте размещается один график, в котором специальными метками отображается принадлежность наблюдения к конкретной подгруппе. Т.е. на таком графике видно взаимное расположение этих подгрупп. Если эти точки разных подгрупп располагаются практически раздельно, то это свидетельствует о различии этих подгрупп по данной паре признаков. А во втором варианте графика эти подгруппы размещаются раздельно. И тогда видны структуры зависимостей этой пары признаков в этих подгруппах. Итак, для каждой подгруппы одного или двух качественных признаков, в данном БЛОКЕ будет производиться количество графиков 2*(30*(30-1)/2 = 2*435 = 870. Можно просмотреть примеры графиков с такими результатами. Ниже приводятся 2 примера пунктов данного БЛОКА.

  Создание графиков с осями парных количественных признаков для всех пар 30 количественных признаков. Графики создаются по всему массиву в целом.
. Создание графиков с осями парных количественных признаков для всех пар 30 количественных признаков. Графики создаются в подгруппах признака PR1L.

 

БЛОК 12

      В данном БЛОКЕ производятся оценки взаимосвязей методом канонической корреляции, который будет объяснять наличие корреляции не между парой признаков, а между двумя наборами разных количественных признаков. Например, в первом наборе будут использоваться 5 важных количественных признаков, а во второй набор введены другие 8 важных признаков. В результате вычисляется коэффициенты канонической корреляции с уровнем статистической значимости. При этом данный метод анализа оценивает не один вариант взаимосвязи канонической корреляции, а столько вариантов, число которых равно минимальному количеству признаков в одной из двух этих наборов признаков. Т.е. учитывая, что используются 5 и 8 наборов количественных признаков, то и вычисляются именно 5 вариантов канонической корреляции. Причём первый вариант всегда вычисляется как наиболее важный, чем все последующие варианты. И по каждому из этих вариантов приводится величина канонической корреляции R, значения критерия Хи-квадрат и уровень статистической значимости этого конкретного варианта корреляции. А также ранжируются в каждой подгруппе анализируемые признаки по интенсивности своего ввода на данную корреляцию. Можно просмотреть примеры графиков с такими результатами. Ниже приводится 1 пример пунктов данного БЛОКА.

  Проанализировать каноническую корреляцию с первым набором количественных признаков: PR30 PR31 PR35 PR37 PR38, и вторым набором признаков: PR32 PR34 PR36 PR39 PR41 PR43 PR45 PR46.

 

БЛОК 13

    В данном БЛОКЕ производятся в каждом пункте по 5 графиков распределения анализируемых наблюдений в диаграмме рассеяния двух канонических переменных. И в этих графиках все наблюдения отражаются конкретными подгруппами качественного признака. Для производства этих графиков используются результаты канонической корреляции, полученные в пунктах предыдущего БЛОКА. Ниже приводится 1 пример пунктов данного БЛОКА.

    Создание графиков распределения всех анализируемых наблюдений с канонической осью из количественных признаков PR30 PR31 PR35 PR37 PR38, и со второй канонической из количественных признаков: PR32 PR34 PR36 PR39 PR41 PR43 PR45 PR46. При этом число парных наборы этих канонических осей определяются наборами оптимальных выборов данных признаков.

 

БЛОК 14

      В данном БЛОКЕ  производится метод многомерного факторного анализа, который будет определять раздельные варианты комбинаций всех используемых в факторы признаков. И эти факторы содержат разные матрицы компонентов всех количественных признаков. В первый такой компонент вводятся такие признаки, у которых общая их корреляция создаёт максимальную долю общей дисперсии. При этом обычно количество устанавливаемых факторов почти равно самому количеству признаков. И тогда суммарный процент увеличивается вводом очередного набора всех признаков, с изменением их ввода. Также в таблицах отражаются собственные значения каждого набора признака. Что и позволяет устанавливать достаточно важные несколько компонент признаков. Реально количество компонент принимается до того количества, пока все эти компоненты имеют значения не менее 1. Т.е. не меньше, чем сами все исходные признаки. В данном методе есть несколько вариантов оценки этого результата. При этом можно использовать как исходные значения этих признаков, так и их специальные изменения, которые описаны в предыдущих БЛОКАХ. Можно просмотреть примеры графиков с такими результатами. Ниже приводятся 1 пример пунктов данного БЛОКА.

   Проанализировать методом многомерного прямого факторного анализа с набором всех количественных признаков. Анализ производится по всему массиву БД.

БЛОК 15

      В данном БЛОКЕ  производится построение графиков последовательной интенсивности факторов, вычисляемых в предыдущем БЛОКЕ. Также вычисляются графики расположения анализируемых количественных признаков во всех парах установленных факторов, интенсивность которых не менее 1. Ниже приводятся 1 пример пунктов данного БЛОКА.

   Создать график со значениями интенсивности всех установленных факторов. А  также создать графики конкретной интенсивности каждого количественного признака в паре факторов.

БЛОК 16

    В данном БЛОКЕ производится оценка уравнений линейного регрессионного анализа, отображающие зависимости между конкретным количественным признаком, и набором выбранных в уравнение иных количественных признаков. В этом БЛОКЕ для конкретного зависимого признака потенциальными предикторами уравнения используются указанные самим Исследователем количественные признаки. Также данный метод использует пару разных методов отбора конкретных признаков в уравнение регрессии. В результате устанавливается порядок предикторов, вошедших в уравнение регрессии, по степени их интенсивности на значение зависимого признака. Они отсортированы по своей интенсивности влияния на зависимый признак. Можно просмотреть примеры графиков с такими результатами. Ниже приводятся 2 примера пунктов данного БЛОКА.

   Оценка линейного регрессионного уравнения для зависимой переменной PR31 и вводом потенциальных предикторов из количественных признаков PR32 --PR41. Анализ производится по всему массиву в целом.
   Оценка линейного регрессионного уравнения для зависимой переменной PR31 и выводом непотенциальных предикторов из количественных признаков PR32 --PR41. Анализ производится по всему массиву в целом.

БЛОК 17

    В данном БЛОКЕ по каждому пункту создаётся набор графиков, отражающих оценку уравнений регрессионного анализа, полученных в предыдущем БЛОКЕ. При этом количество графиков, создающихся для каждого уравнения в предыдущем БЛОКЕ, определяется в основном количеством предикторов, вошедших в уравнение. Самый важный график содержит в первой оси фактические значений зависимого признака, а во второй оси значения предсказанные. И в этом графике отдельные точки представляют конкретные наблюдения с этими значениями. И тогда видно, в каких реальных значениях предсказанные значения очень близки к реальным значениям. А в каких значениях предсказанные величины сильно отличаются от реальных. Также оптимально в одной подгруппе таких графиков видеть расположение всех использованных наблюдений в одной оси по разнице между фактическим и предсказанным значением этого признака, и во второй оси по значениям одного предиктора, включённого в уравнение регрессии. Также важно и построение гистограммы распределения всех остатков между фактическим и предсказанным значением этого признака. Следующие графики содержат аналогичные гистограммы по каждому предиктору. Можно просмотреть примеры графиков с такими результатами. Ниже приводятся 1 пример пунктов данного БЛОКА.

    Создание указанных выше графиков с предикторами уравнения для зависимой переменной PR31. Графики создаются по всему массиву в целом.

 

БЛОК 18

    В данном БЛОКЕ производится оценка уравнений полиномиального регрессионного анализа, применяя линейные уравнения между одним зависимым количественным признаком и набором исходных количественных признаков, и набором признаков преобразованных в положительные и отрицательные степени до +3 и до -3. И в этом БЛОКЕ используются совместно исходные значения всех количественных признаков, и эти же признаки преобразованные в разные варианты. Также данный метод использует пару разных методов ввода конкретных признаков в уравнение регрессии. В результате метода устанавливается порядок предикторов, вошедших в уравнение регрессии, по степени их интенсивности на значение зависимого признака. Т.е. все предикторы уравнения отсортированы по своей интенсивности влияния на зависимый признак. Можно просмотреть примеры графиков с такими результатами. Ниже приводятся 2 примера пунктов данного БЛОКА.

  Оценка линейного полиномиального регрессионного уравнения для зависимой переменной PR31 и вводом потенциальных предикторов как из исходных признаков PR32 --PR41, так и из этих признаков, введённых в степени от -3, -2. +2 и +3. Анализ производится по всему массиву в целом.
  Оценка линейного полиномиального регрессионного уравнения для зависимой переменной PR31 и выводом непотенциальных предикторов как из исходных признаков PR32 --PR41, так и из этих признаков, введённых в степени от -3, -2. +2 и +3. Анализ производится по всему массиву в целом.

 

БЛОК 19

    В данном БЛОКЕ создаётся график, отражающий оценку уравнений полиномиального регрессионного анализа, для каждого уравнения полученного в предыдущем БЛОКЕ. При этом количество графиков определяется в основном количеством предикторов, вошедших в уравнение. Самый важный график содержит в первой оси фактические значений зависимого признака, а во второй оси значения предсказанные. И в этом графике отдельные точки представляют отдельные наблюдения с этими значениями. И тогда видно, в каких реальных значениях предсказанные значения очень близки к реальным значениям. А в каких значениях предсказанные величины сильно отличаются от реальных. Также важно и построение гистограммы распределения всех остатков между фактическим и предсказанным значением этого признака. Следующие графики содержат аналогичные гистограммы по каждому предиктору. Можно просмотреть примеры графиков с такими результатами. Ниже приводится 1 пример пунктов данного БЛОКА.

  Создание указанных выше графиков с предикторами уравнения для зависимой переменной PR31. Графики создаются по всему массиву в целом.

 

БЛОК 20

    В данном БЛОКЕ производятся оценки нелинейных уравнений степенного преобразования Бокса-Кокса, для чего известный параметр лямбда используется для количественных признаков со значениями от -2 до +2. При этом значение лямбда равное 0 производит логарифмирование признака. В результате можно оценить порядок предикторов, вошедших в уравнение регрессии, по степени их интенсивности на значение зависимого признака. Ниже приводится 1 пример пунктов данного БЛОКА.

   Оценка нелинейного регрессионного уравнения степенного преобразования Бокса-Кокса для зависимой переменной PR41 и вводом потенциальных предикторов PR42 -- PR45. Параметр лямбда при этом используется в интервале от -2 до +2. Анализ производится по всему массиву в целом.

 

БЛОК 21

    В данном БЛОКЕ  создаются 2 графика для каждого нелинейного уравнения степенного преобразования Бокса-Кокса, полученного в предыдущем БЛОКЕ. В одном графике отражается влияние степени параметра лямбда на значение F-критерия для каждого предиктора. А во втором графике отражаются значения реальные и предсказанные, т.е. демонстрируют степень продуктивности полученного уравнения. Ниже приводится 1 пример пунктов данного БЛОКА.

    Создание указанных выше графиков с предикторами нелинейного регрессионного уравнения степенного преобразования Бокса-Кокса для зависимой переменной PR41 и вводом потенциальных предикторов PR42 -- PR45. Графики создаются по всему массиву в целом.

 

БЛОК 22   

   В данном БЛОКЕ производится оценка логистической регрессии методом многомерных связей между одной группирующей переменной, и набором остальных группирующих и количественных признаков. В данном БЛОКЕ используются методы пошагового включения и исключения предикторов. Результаты такого анализа позволяют установить немало наборов предикторов, влияющих на вероятность перевода конкретного наблюдения из одной в другую анализируемую подгруппу. Важным аспектом данного метода является установка конкретных признаков имеющих малые количества наблюдений. И поскольку реальное использование многих таких признаков имеющих немало пропусков их значений, то совместное использование всех предиктором с такими пропусками, существенно уменьшает общее количество анализируемых наблюдений. Что и ухудшает результат анализа логистической регрессии. Поэтому после установки 1-3-х первых уравнений удаляется 1 или 2-3 признака, содержащих более всего пропусков. Что существенно повышает анализируемый объём наблюдений и улучшает результаты получаемых уравнений логистической регрессии. Фактически данный метод позволяет выбрать 1-3 наиболее важных уравнений, по которым и следует изменять в конкретном направлении качественные и количественные признаки. Чтобы этим повышать вероятность перемещения пациента из групп нежелательного состояния в группу желательного состояния. Данный метод весьма подробно описан в 10 статьях по логистической регрессии (см. http://www.biometrica-tomsk.ru/logit_0.htm http://www.biometrica-tomsk.ru/logit_9.htm ). Там же описано и получение ROC-кривых для уравнений логистической регрессии.  Отметим, что ROC-кривые, отражающие взаимосвязь между чувствительностью и специфичностью, строятся в том случае, когда зависимый признак имеет только 2 подгруппы.

   В данном БЛОКЕ учитывается, что в большинстве реальных признаках имеются некоторое число пропусков. Т.е. отсутствуют значения реального признака. И по этой причине важно производить для каждого зависимого группирующего признака как минимум 3 варианта оценки уравнения логистической регрессии. Так в первом варианте потенциальными предикторами используется согласованный набор только количественных признаков. А во втором варианте потенциальными предикторами используется согласованный набор только качественных признаков. А в третьем варианте потенциальными предикторами используется согласованный набор количественных и качественных признаков. И в каждом из этих 3-х вариантов используются 2 разных метода выбора в уравнение статистически значимых предикторов. Также периодически при этом удаляются из набора потенциальных предикторов те признаки, у которых меньше всего имеющихся значений в одной или во всех сравниваемых подгруппах. Что приводит к увеличению количества анализируемых наблюдений и повышению важности и надёжности получаемых при этом уравнений. Основной целью в данном БЛОКЕ есть ответ на вопрос: имеются ли наборы признаков, объясняющих существенные различия между сравниваемыми подгруппами, например, между больными и здоровыми, которые определяются значениями качественных (неколичественных) переменных. И если они объясняют эти различия, то каков численный показатель надёжности такого объяснения. Кроме того, в случае получения уравнения логит-регрессии со статистически значимыми предикторами, следует провести ранжирование, упорядочение предикторов по силе их взаимосвязи с группирующей переменной. Можно просмотреть примеры графиков с такими результатами. По каждому пункту данного БЛОКА чаще всего оценивается от 3 до 5 уравнений. Однако при наличии достаточно сложных уравнений связей, нередко оцениваются гораздо более 5 уравнений. Чаще всего это до 10-15 уравнений, из которых можно выбирать самые продуктивные 2-3 уравнения. Ниже приводятся 3 примера пунктов данного БЛОКА.

  Проанализировать с помощью метода логистической регрессии взаимосвязь между зависимой переменной PR18L и следующими количественными признаками, имеющими не менее 350 измерений: PR32--PR43. Количество оцениваемых уравнений не менее 3 и не более 5.
  Проанализировать с помощью метода логистической регрессии взаимосвязь между зависимой переменной PR18L и следующими качественными признаками, имеющими не менее 344 измерений: PR3L--PR12L. Количество оцениваемых уравнений не менее 3 и не более 5.
   Проанализировать с помощью метода логистической регрессии взаимосвязь между зависимой переменной PR18L и следующими количественными и качественными признаками, имеющими не менее 340 измерений: PR3L--PR12L, PR19L--PR22L, PR32--PR43. Количество оцениваемых уравнений не менее 3 и не более 5.

 


    В процессе выполнения данной "ПРОГРАММЫ по статистическому анализу" не изменяются значения БД, представленные Исследователем для выполнения этой "ПРОГРАММЫ". Ответственность за достоверность и корректность значений всех признаков в БД, представленных для анализа, несёт сам Исследователь. При необходимости проведения дополнительного статистического анализа этих же данных, либо повторного проведения некоторых видов анализа этой "ПРОГРАММЫ" на новых или дополненных, видоизменённых данных БД, либо проведение иных работ, не предусмотренных данной "ПРОГРАММОЙ" , Исследователь и Исполнитель согласовывают новую "ПРОГРАММУ по статистическому анализу". Длительность выполнения данной "ПРОГРАММЫ" зависит от объёмов согласованных БЛОКОВ, и обычно составляет 1-2 недели.

    Исполнитель обязуется присылать вместе с результатом первого пункта каждого БЛОКА задач, в котором используется один и тот же метод статистического анализа, также и пояснения к данным результатам, имеющим одну и ту же структуру в результатах данного БЛОКА. Кроме того, Исполнитель обязуется перед отправкой первых результатов обеспечить Исследователя необходимым набором в несколько десяток учебных пособий для более полного ознакомления с содержанием используемых в Программе методов статистического анализа. Консультации проводятся в форме диалога в сеансах связи по Скайпу. Перед консультацией Исследователь готовит свои вопросы по схеме: «Имя файла с результатами. Страница в этом файле. Фрагмент результатов. Вопрос по данному фрагменту», «Имя файла с результатами. Страница в этом файле. Фрагмент результатов. Вопрос по данному фрагменту», и т.д., и отправляет файл с этими вопросами Исполнителю.

  В течение 1 месяца со дня отправки последнего результата, сохраняется БД и все полученные результаты анализа по данной Программе. И поэтому в течение этого 1 месяца Исследователь может высылать свои вопросы по этим результатам согласно приведённому выше описанию. А затем по окончании этого месяца все полученные результаты удаляются, и обсуждение этих результатов завершается. Также в течение 2 месяцев сохраняется данная БД, поскольку в течение этой пары месяцев Исследователь может выслать дополнительные предложения по продолжению статистического анализа своей БД. А по истечению 2 месяцев эта БД также удаляется. Исполнитель обязуется не передавать матрицу данных и результаты её анализа по данной Программе третьим лицам. Данный Исследователь в течение месяца после получения последнего результата может стать представителем нашего НЦ БИОМЕТРИКА, получая в этой должности восстановление своих финансовых затрат. Поэтому для данного представителя его БД и все результаты, полученные по этой Программе, не удаляются совсем. И этот представитель может многократно обращаться к нам со своими вопросами.

Мониторинг качества научных    медицинских публикаций     


Обращение межрегионального Общества специалистов доказательной медицины в ВАК РФ


Ответ на письмо Леонова В.П. от  начальника Управления аттестации научных и научно-педагогических работников Федеральной службы по надзору в сфере образования и науки Н.И. Аристера


СТАТИСТИКА УМЕЕТ МНОГО ГИТИК.
С.Е. Бащинский, главный редактор  Международного журнала медицинской практики, 1998; №4, с.13-15.


Примеры оформления Исследователями базы данных, описания признаков и целей статистического анализа этой базы данных

Островок  здоровья

Пример 1    Пример 2  
Пример 3


  НЦ БИОСТАТИСТИКА
выполняет статистический анализ экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Нашими услугами пользуются аспиранты и докторанты по медицине, биологии, социологии, психологии и т.д. (См. далее )


Интересная ссылка

Сравниваем средние, а также и ... В. Леонов.
       Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров.
   
     Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками
.




В. Леонов. «Применение методов статистики в кардиологии (по материалам журнала «Кардиология» за 1993–1995 гг.) Кардиология, 1998, № 1.


Мнения исследователей о продуктивности многих методов статистического анализа. Данные мнения отражены многими исследователями, учёными, начальниками, и студентами по медицине и биологии как в тезисах, так и в диссертациях, статьях, или дипломах. В них и представлены самые продуктивные и сложные методы статистического анализа.


Предложения зарубежных исследователей о важных методах статистического анализа

  Начиная с 2010 года зарубежные исследователи по медицине, биологии, и многим иным направлениям, чаще стали обращаться по своим просьбам статистического анализа в наш НЦ БИОМЕТРИКА. Которые затем часто и упоминают о нас в своих статьях. И поэтому для проведения нами статистического анализа они как раз и поддерживают использование предлагаемых им многих сложных многомерных методов анализа. А также использовать для них и многие стандартные парные методы статистического анализа, но уже по более глубоким аспектам. И получая результаты этих сложных методов статистического анализа, эти исследователи как раз и осознают реально сложными свои технологии. Что и позволяет им обнаруживать и устанавливать детали новых улучшений своих технологий.

В. Леонов. Статистика в кардиологии. 15 лет спустя. 15 лет назад, в 1998 году, в журнале «Кардиология» была опубликована наша статья  «Применение методов статистики в кардиологии (по материалам журнала «Кардиология» за 1993–1995 гг.) В ней были проанализированы 426 статей кардиологической тематики. В новом обзоре проаналированы современные журнальные статьи кардиологической тематики. Учитывая то, что  в настоящее время в России смертность от сердечно-сосудистых заболеваний более чем в 4 раза выше, чем в Европе, США и Японии, актуальной задачей является оценка эффективности использования статистики в российской кардиологии. Журнал "Медицинские технологии. Оценка и выбор", 2014, №1, с. 17-28.  (Весь обзор одним файлом)


Логистическая регрессия.
Леонов В.

В серии 10 статей рассмотрены основы метода логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

Введение.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии



СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ  ДЛЯ МЕДИКОВ И БИОЛОГОВ (время и опыт). Леонов В.П.  Статистика - наука имеющая длительный период развития. Напомним, что название этой науки произошло от латинского слова "status" - состояние дел. При этом у данного термина имеются и иные значения. Самым продуктивным направлением этой науки является раздел математики, посвящённый количественным анализам баз данных, собираемых исследователями по разным целям.

 


Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях. Международный журнал медицинской практики, 1998 г., вып. 4. В.П. Леонов, П.В. Ижевский

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.   ЧАСТЬ 2. ИСТОРИЯ БИОМЕТРИКИ И ЕЁ ПРИМЕНЕНИЯ В РОССИИ. Леонов В.П.

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.  ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П.

Применение статистики в статьях и диссертациях по медицине и биологии. Часть IV. Наукометрия статистической парадигмы экспериментальной биомедицины.     Международный журнал медицинской практики, 2002 г. вып. 3.  Леонов В.П.

Примеры отличных результатов статистического анализа в диссертациях, дипломных работах и статьях, полученных с нашей помощью.

Д.С. Симанков. Применение метода логистической регрессии для факторов риска, влияющих на исход операции в условиях искусственного кровообращения. (статья)

В.В. Половинкин. Тотальная мезоректумэктомия — фактор повышения эффективности лечения среднеампулярного и нижнеампулярного рака прямой кишки.  (диссертация на соискание учёной степени доктора медицинских наук)

Н.Г. Веселовская.  Клиническое и прогностическое значение эпикардиального ожирения у пациентов высокого сердечно-сосудистого риска.  (диссертация на соискание учёной степени доктора медицинских наук)

О.Я. Васильцева. Закономерности возникновения, клинического течения и исходов тромбоэмболии легочной артерии по данным госпитального регистра патологии.  (диссертация на соискание учёной степени доктора медицинских наук)

В.А. Габышев.  Фитопланктон крупных рек Якутии и сопредельных территорий восточной Сибири.  (диссертация на соискание учёной степени доктора биологических наук)

М.И. Антоненко.  Гиперкортицизм без специфических клинических симптомов: эпидемиология, клиника, диагностика.  (диссертация на соискание учёной степени кандидата медицинских наук)

А.Г. Сыркина. Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).

Кривулина Г.Б. Влияние велотренировок различной продолжительности на дисфункцию эндотелия и факторы риска атеросклероза у молодых мужчин (автореферат диссертации на соискание учёной степени кандидата медицинских наук) 


Роль «малых» доз ионизирующего излучения в развитии неонкологических эффектов: гипотеза или реальность? Бюллетень сибирской медицины, № 2, 2005, с. 63-70. Карпов А.Б., Семенова Ю.В., , Тахауов Р.М., Литвиненко Т.М., Попов С.В., Леонов В.П.

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.

Авторский ресурс Зорина Н.А.


После взрыва на СХК в 1993г. в Томске и Северске увеличилась частота рождения детей с пороками развития

Мнения исследователей о продуктивности многих методов статистического анализа. Данные мнения отражены многими исследователями, учёными, начальниками, и студентами по медицине и биологии как в тезисах, так и в диссертациях, статьях, или дипломах. В них и представлены самые продуктивные и сложные методы статистического анализа.


В новый век - с доказательной биомедициной
Газета ПОИСК, № 20 (522)
21 мая 1999
г.

  • В. Леонов. Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента.
  • В. Леонов. Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента (Сравнение 1-й и 4-й стадии злокачественной опухоли яичников) ч.1.
  • В. Леонов. Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента. ч.2.
  • ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК РФ. В.П. Леонов, П.В.Ижевский.
  • Доказательная медицина и отечественная медицинская наука. Фадеев В.В., Леонов В.П., Реброва О.Ю., Мельниченко Г.А.
  • В. Леонов. Наукометрический анализ статистической парадигмы экспериментальной биомедицины (по материалам публикаций).

  • В. П. Леонов. Общие проблемы применения статистики в биомедицине

    ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК, №5 1997 г. В.П. Леонов, П.В. Ижевский.

    В.П. Леонов. Применение разведочного анализа для оценки исходных данных (на примере наблюдений по уролитиазу)

    В.П. Леонов. КЛАССИФИКАЦИЯ ОШИБОК ПРИМЕНЕНИЯ СТАТИСТИКИ В ОТЕЧЕСТВЕННОЙ МЕДИЦИНЕ.

    Леонов В.П. Камуфляжные мемы инфоценоза научных школ. Материалы Международной научной конференции 15-16 июня 2007  г. "Философия математики: Актуальные проблемы." - Московский государственный университет. 

    В.П. Леонов. МЕМЕТИЧЕСКИЙ АНАЛИЗ СТАТИСТИЧЕСКИХ ЗАБЛУЖДЕНИЙ В ПУБЛИКАЦИЯХ НАУЧНЫХ ШКОЛ

    Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009). 

    Леонов В.П. Принципы описания статистики в биомедицинских публикациях. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

    Леонов В.П. Основные понятия ROC-анализа. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

    Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35

    Роль «малых» доз ионизирующего излучения в развитии неонкологических эффектов: гипотеза или реальность? Карпов А.Б., Семенова Ю.В., Тахауов Р.М., Литвиненко Т.М., Попов С.В., Леонов В.П.


    Леонов В.П. Обработка экспериментальных данных на программируемых микрокалькуляторах.

    Учебное пособие (Прикладная статистика на БЗ-34, МК-52, МК-54, МК-56, МК-61). Томск, изд-во ТГУ, 1990, - 376 с.
        В монографии изложены методы прикладной статистики для обработки экспериментальных данных и реализующие их 60 программ. Кроме методов оценки основных статистических характеристик — среднего, дисперсии, ит. д. и корреляционно-регрессионного анализа, дано изложение однофакторного и двухфакторного дисперсионного анализа, а также ковариационного анализа. Несколько глав посвящены методам проверки гипотез о векторах средних, дискриминантному анализу и методу главных компонент.
    Использование методов и программ иллюстрируется более чем 100 задачами с решениями из области биологии, медицины, ботаники, геологии, полупроводниковой электроники, сельского хозяйства, экономики, социологии, гидрометеорологии, химии, психологии и т. д.

    Предисловие.
    Развитие прикладной статистики и ее роль в обработке экспериментальных данных.
    Расчеты на программируемых микрокалькуляторах.
    Описательные статистики выборочных массивов данных.
    Проверка статистических гипотез.
    Анализ статистической связи между качественными переменными.
    Основы дисперсионного анализа наблюдений.
    Анализ связи между количественными переменными (корреляционный анализ).
    Исследование вида зависимости между количественными переменными (линейный регрессионный анализ).
    Нелинейный корреляционно-регрессионный анализ.
    Двухмерное нормальное распределение.
    Множественный линейный корреляционно-регрессионный анализ.
    Основы ковариационного анализа.
    Проверка гипотез о векторах средних.
    Исследование наблюдений методом дискриминантного анализа.
    Применение метода главных компонент (МГК) для анализа наблюдений.
    Заключение.
    Литература.
    Библиотека программ.
    Приложение. Перечень ГОСТов по прикладной статистике.


          На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайтеБИОМЕТРИКА, рекомендую перейти на файл "Поиски методов или результатов статистического анализа"... Можете просматривать все графики по данной тематике...


    Мнения исследователей о продуктивности многих методов статистического анализа. Данные мнения отражены многими исследователями, учёными, начальниками, и студентами по медицине и биологии как в тезисах, так и в диссертациях, статьях, или дипломах. В них и представлены самые продуктивные и сложные методы статистического анализа.


    КУНСТКАМЕРА

       В последнее время автор получает от читателей немало писем, в которых они сообщают о том, что после чтения материалов "Биометрики" стали более внимательно и пристально вчитываться в разделы "Материалы и методы" диссертаций и журнальных статей. Нередко при этом они обнаруживают новые "ляпы", некоторые из которых читатели присылают нам. Я благодарен всем, кто присылает в "Кунсткамеру" такие образцы и пришлёт их в будущем.  


    Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.

    Роль «малых» доз ионизирующего излучения в развитии неонкологических эффектов: гипотеза или реальность? Бюллетень сибирской медицины, № 2, 2005, с. 63-70. Карпов А.Б., Семенова Ю.В., , Тахауов Р.М., Литвиненко Т.М., Попов С.В., Леонов В.П.


    Новые отзывы на проведённый анализ данных

    Хван Н.В., Алматы, Казахстан. Уважаемые диссертанты! Хочу поделиться своим опытом сотрудничества со специалистами Центра «Биостатистика».

    Гражданкина Д.В., НГМУ, Новосибирск
    . Работаю я ассистентом кафедры эндокринологии Новосибирского медуниверситета. Вопрос о том, как и кому выполнять статистический анализ данных для диссертаций, статей по медицине, волновал меня довольно давно...

    Веселовская Н.Г., Алтайский кардиоцентр, Барнаул. Хочется поделиться своими впечатлениями от работы с центром БИОСТАТИСТИКА. Итак, это не первое моё сотрудничество с центром. В 2006 г центром БИОСТАТИСТИКА был проведён анализ материала, который вошёл в мою кандидатскую диссертацию...  

    Веселовская Н.Г. ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ.

    Поддубная О.А., доктор медицинских наук, доцент кафедры Восстановительной медицины, физиотерапии и курортологии Сибирского Государственного медицинского университета

    Медянникова И.В., кандидат медицинских наук, ассистент кафедры акушерства и гинекологии Омской государственной медицинской академии

    Крупская Ю.А. (Ростов-на-Дону)

    Чекмарев А.С., аспирант кафедры дерматовенерологии, микологии и косметологии РМАПО, член совета студентов медицинских и фармацевтических ВУЗов при Министерстве Здравоохранения и Социального развития России (Москва)

    Максимова С.С., с.н.с. НИИ здоровья, Якутск


    Доклад "Почему и как надо учить медиков статистике?" В. Леонов. (Доклад на международной конференции по доказательной медицине
    в Ереване
    18-20.10.2012)

    Зачем нужна статистика в доказательной медицине?  В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193.

    В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

    СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ  ДЛЯ МЕДИКОВ И БИОЛОГОВ (время и опыт). Леонов В.П.  Статистика - наука имеющая длительный период развития. Напомним, что название этой науки произошло от латинского слова "status" - состояние дел. При этом у данного термина имеются и иные значения. Самым продуктивным направлением этой науки является раздел математики, посвящённый количественным анализам баз данных, собираемых исследователями по разным целям.

    Музыка для души ...

    Послушать и скачать...

        При многочисленной работе с описаниями статистических процедур, и т.д., реально появляется усталость. И для улучшения дальнейшей работы можно прослушать хорошие песни и музыку, увидев при этом также интересные видео. В указанной вверху ссылке приведены много разных вариантов видео-песен с сообщениями о Томске и о Томском государственном университете. А также очень много видео-песен с  Анной Герман. И с остальными певцами: Мария Максакова, Лев Лещенко, Юрий Антонов, Игорь Скляр, Валерий Ободзинский, Владимир Трошин, Галина Хомчик, Виктория Иванова, Юрий Кукин, Олег Митяев, Юрий Визбор, Юрий Кукин, и т.д. Можно прослушать и скачать используемые при этом видео-файлы  *.mp4, применив для этого программу Ummy Video Downloader.


    Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях. Международный журнал медицинской практики, 1998 г., вып. 4. В.П. Леонов, П.В. Ижевский

    ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.   ЧАСТЬ 2. ИСТОРИЯ БИОМЕТРИКИ И ЕЁ ПРИМЕНЕНИЯ В РОССИИ. Леонов В.П.

    ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.  ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ  "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П.

    В. Леонов. СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ МЕДИКОВ И БИОЛОГОВ. (время и опыт)

    Леонов В.П. Ошибки статистического анализа биомедицинских данных.  Международный журнал   медицинской практики,  2007, вып. 2, стр.19-35.

    ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК N5 1997 г. В.П.Леонов, П.В.Ижевский.

    Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику". Якутск, (12-13 ноября 2009).

    История биометрики

    Семинары по биометрике.
    Центр БИОСТАТИСТИКА организуют выездные семинары по биометрике. В течение 10 дней читаются лекции и проводятся практические занятия на статистическом пакете. Семинар в Красноярске (28.01.2008 - 07.02.2008), летом 2007 г. в Якутске (28.05.2007 - 8.06.2007), весенний семинар в Якутске (18 - 28) 04. 2005, семинар в Иркутске (12 - 16) 02.2002, Самаре (19 - 24) 04.2004, Новокузнецке (17 - 22) 05.2004), Хинганском заповеднике (25.09 - 03.10) 2000. С предложениями об организации семинаров обращаться к редактору сайта (см. E-mail в нижней части страницы). ВАК-2007: новый председатель и старые проблемы. Кто кого? (Сокращённая версия статьи опубликована в "Независимой газете" от 11 июля 2007 г.)
    Якутская биометрика-2007.
     

    Фоторепортаж о втором семинаре по биометрике в Якутске.

    Впечатления участников второго семинара по биометрике в Якутске.


    БИОМЕТРИКЕ - 16 лет! А что было раньше? И что теперь?  Леонов В.П.
    16 лет... Возраст немалый... Как появился наш сайт? И стал ли он популярным?
    Первоначально наш сайт был разделом на сайте Доктор.Ру, который был создан в Хабаровске. Вот как выглядел этот раздел, например, 20 июля 2001 года. Поскольку в те годы скорость передачи информации в интернете была невысокая, то для облегчения доступа к материалам БИОМЕТРИКИ мы открыли "зеркала" (копии) в таких городах, как Томск, Владивосток, Москва, Киев. Со временем необходимость наличия "зеркал" сайта в других городах отпала, и БИОМЕТРИКА осталась в Томске. Читатели БИОМЕТРИКИ в своих письмах часто задают вопрос о том, каковы были мотивы создания этого сайта? Чтобы немного рассказать об этом,
    вернёмся на 27 лет назад, в прошлое.

    ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК РФ. В.П. Леонов, П.В.Ижевский.

    Фадеев В.В., Леонов В.П., Реброва О.Ю., Мельниченко Г.А. Доказательная медицина и отечественная медицинская наука.

    В. Леонов. Наукометрический анализ статистической парадигмы экспериментальной биомедицины (по материалам публикаций).

    Доклад "Почему и как надо учить медиков статистике?" В. Леонов.

    Зачем нужна статистика в доказательной медицине?  В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193.

    Статистика - это что? Статистика - нужна зачем? Статьи читаем - зачем? Статьи пишем - зачем? Краткая версия лекции для слушателей-медиков в Ереване, прочитанной в 2014 году по Скайпу.


    Мнения исследователей о продуктивности многих методов статистического анализа. Данные мнения отражены многими исследователями, учёными, начальниками, и студентами по медицине и биологии как в тезисах, так и в диссертациях, статьях, или дипломах. В них и представлены самые продуктивные и сложные методы статистического анализа.


    Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35.

    В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).


    НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ   (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). В.П.Леонов. Вестник Томского государственного университета, Серия "Математика. Кибернетика. Информатика", №275. АПРЕЛЬ 2002, стр. 17-24. Cамая читаемая наша статья после отправки более 300 писем авторам статей мед. журналов о наличии в них примитивных и ошибочных методов статистического анализа, и получаемых при этом результатах...


    ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК N5 1997 г. В.П.Леонов, П.В.Ижевский.

    Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику". Якутск, (12-13 ноября 2009).

    История биометрики

    Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях. Международный журнал медицинской практики, 1998 г., вып. 4. В.П. Леонов, П.В. Ижевский

    ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.   ЧАСТЬ 2. ИСТОРИЯ БИОМЕТРИКИ И ЕЁ ПРИМЕНЕНИЯ В РОССИИ. Леонов В.П.

    ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.  ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ  "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П.

    Применение статистики в статьях и диссертациях по медицине и биологии. Часть IV. Наукометрия статистической парадигмы экспериментальной биомедицины.     Международный журнал медицинской практики, 2002 г. вып. 3. Леонов В.

    В.П. Леонов.  Камуфляжные мемы инфоценоза научных школ // Философия математики: актуальные проблемы. Материалы Международной научной конференции 15-16 июня 2007. Москва, Изд. Саван С. А., 2007. - с. 212-216.

    Очередной отзыв о нашем сотрудничестве Корнеевой Н.В., доцента кафедры факультетской терапии ДВГМУ г. Хабаровск.

    ВОЗМОЖНОСТИ БИОМЕТРИЧЕСКОГО АНАЛИЗА ВЗАИМОСВЯЗИ СОМАТИЧЕСКИХ ПОКАЗАТЕЛЕЙ И СИСТЕМАТИКИ ПСИХИЧЕСКИХ РАССТРОЙСТВ.
    Н.П.Гарганеева1, В.П.Леонов2. Сибирский государственный медицинский университет1, Томск 
    Томский государственный университет2. Сибирский медицинский журнал, № 2, 2001, с.25-32.

    Особенности развития органов растений фасоли в условиях освещения и темноты. Л. В. Ивлева, И.Ф. Головацкая, В.П. Леонов.  ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

    ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ. ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ".

          На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайтеБИОМЕТРИКА, рекомендую перейти на файл "Поиски методов или результатов статистического анализа" ...Можете просматривать все графики по данной тематике...


    Наш адрес       Сайт БИОМЕТРИКА создан в 1997 г. © Василий Леонов

    Пример "ПРОГРАММА РАБОТ по статистическому анализу" базы данных Исследователя

    Зачем нужна статистика в доказательной медицине? 

    Доклад "Почему и как надо учить медиков статистике?" В. Леонов.