Что такое ординальные признаки
Типы признаков (переменных)
Исследуемые переменные (признаки) по виду шкалы принимаемых значений подразделяются на количественные, порядковые и классификационные.
Количественные признаки измеряются либо в непрерывной шкале, например температура, длина, либо в интервальной или дискретной шкале — когда об их величине судят по попаданию наблюдения в определенный диапазон (интервал) значений, например измерение времени при усадке материала с точностью до недели.
Порядковые (ординальные) признаки не поддаются количественной оценке. Реальным содержанием их измерений является тот порядок, в котором выстраиваются объекты по степени выраженности измеряемого признака, например уровни музыкальных и математических способностей учащихся; двигательные и умственные способности детей. На сколько или во сколько раз признак более выражен — не имеет значения, действительны лишь операции типа >, или х g (а; b). Взаимный порядок здесь уже не имеет значения. Каждый признак делит группу исследуемых объектов на подгруппы. Например, при обработке социологических анкет признак пола разделяет людей на мужчин и женщин; профессия имеет уже большее число наименований. Для классификации цветов и оттенков в текстильной промышленности, в полиграфии используются альбомы с цветовыми образцами (в России — каталог стандартизованных цветов «Радуга», в США — Pantone). Цвет указывается по соответствующему номеру.
Классификация признаков
Почему важно знать классификацию признаков (иногда говорят шкалы измерения)? Тип признака во многом определяет те статистические методы, которые могут быть применены для обработки данных. В литературе встречаются различные классификации, но все они достаточно близки друг к другу и предлагаемая ниже вполне достаточна для освоения основ биостатистики.
Различают количественные и качественные признаки. Количественные признаки выражаются числами. Значения количественных признаков могут быть непрерывными или дискретными. Дискретные – это признаки, значения которых отличаются не менее чем на единицу измерения признака (число человек в семье, койко-дни). Непрерывные признаки – это признаки, значения которых могут отличаться друг от друга на любую сколь угодно малую величину (рост, вес человека, объем).
Рисунок 5. Классификация признаков
Качественные признаки выражаются категориями. В свою очередь они в зависимости от вида данных делятся на номинальные (классификационные) и ординальные (порядковые). Говорят также, что соответствующие качественные признаки измеряются в номинальной или порядковой шкале. Разница между этими шкалами состоит в следующем.
Признак, измеряемый в номинальной шкале, принимает одно значение из конечного числа заведомо установленных градаций. Примерами признаков, измеряемых в номинальной шкале, являются пол (мужской, женский), цвет глаз (карие, зеленые, серые), классификация животных и т. п. Статистические данные, измеряемые в номинальных шкалах, представляются в виде таблиц, в которых приводятся частоты появления той или иной градации признака. Часто номинальные данные появляются при обработке эпидемиологических данных. Например, может представлять интерес вопрос о частоте встречаемости того или иного признака при том или ином заболевании.
Значения качественных признаков, измеряемых в ординалъной шкале, могут быть упорядочены, т.е. расположены по возрастанию или убыванию. Примерами таких признаков являются качество условий жизни (плохое, удовлетворительное, хорошее, очень хорошее), температура (нормальная, повышенная, высокая, очень высокая), шкала оценки боли. Для признаков, измеряемых в ординальных шкалах, операции сложения и вычитания не имеют смысла. Так, нельзя сказать, что студент, получивший на экзамене «пять» по статистике знает предмет на одну единицу лучше, чем студент, получивший по этому предмету «четыре», поскольку для знаний не существует единицы измерения. Однако можно сказать, что первый студент знает статистику лучше, чем второй.
Для представления значений ординальных признаков в числовой форме используется следующий способ. Все значения признака записываются в порядке возрастания в виде ряда. Каждому значению ставится в соответствие натуральное число, равное его номеру в ряду. Это число называется рангом. Например, качество условий жизни (плохое, удовлетворительное, хорошее, очень хорошее) будет представлено рангами 1, 2, 3, 4. Для ординальных признаков, представленных в виде рангов, разработаны специальные статистические методы, позволяющие измерять степень близости признаков (например, ранговая корреляция), проверять гипотезы о виде распределения, проводить дисперсионный анализ.
Для данных, представленных в номинальной шкале, также не определены операции сложения и вычитания. Эти данные (в отличие от ординальных признаков) не могут быть упорядочены и, следовательно, оцифрованы с помощью рангов. Применяя специальные статистические методы для номинальных признаков, можно проверить гипотезы о независимости признаков и о принаддежности двух или нескольких выборок к одной совокупности.
Контрольное задание 1 (тесты)
1. Как называются признаки, значения которых отличаются не менее чем на единицу измерения
a) дискретные признаки
b) непрерывные признаки
c) ординальные признаки
d) номинальные признаки
e) качественные признаки
2. Какие признаки называются ординальными
a) признаки, значения которых отличаются не менее чем на единицу измерения признака
b) признаки, значения которых могут отличаться на любую сколь угодно малую величину
c) качественные признаки, которые можно упорядочить
d) признак принимает одно значение из конечного числа заведомо установленных градаций, которые невозможно упорядочить
e) качественные признаки
3. Какие из данных являются ординальными признаками
a) национальность рабочих
c) цвет глаз, цвет волос
d) пол, классификация животных
e) количество детей, средняя заработная плата
4. В целях обследования состояния здоровья населения от 18 до 25 лет было охвачено 1000 студентов различных ВУЗов. Какой является совокупность по полноте охвата
Что такое ординальные признаки
Тест: Узнайте в каком году вы должны были родиться на самом деле?
Что вас ждет в старости?
Только те, кто росли в СССР, смогут без труда ответить на все вопросы нашего теста
Если ответите на все вопросы нашего теста без ошибок, то можете считать себя уникумом с высоким IQ
Ваш учитель географии зря ставил вам «5», если вы не сможете ответить правильно хотя бы на 70%
Вас можно назвать ходячей энциклопедией, если сможете набрать восемь правильных ответов
Тест из одного вопроса, ответить на который правильно не может почти никто. Попробуете себя?
Проверьте свой интеллект
Насколько уникальна ваша личность?
Если вы ответите верно на все наши каверзные вопросы, то точно не зря получали высшее образование
Цветовой тест на возраст
Тест на общие знания, который на 11/11 осилит лишь настоящий эрудит
Насколько чиста ваша карма?
Cколько лет вашей душе?
На какое животное вы похожи, когда злитесь?
Цветовой тест: попробуем отгадать ваш возраст всего за 9 вопросов
Угадайте воинские звания России по погонам
Сможете ли вы пройти тест для разведчиков?
Сколько ты можешь выиграть в «Кто хочет стать миллионером?»
Сможете ли вы набрать 10/10 баллов в нашем тесте на общие знания?
Подписывайтесь на наши странички! Обязательно делитесь с друзьями! Впереди много новых интересных тестов! Ежедневные добавления! Страницы: Яндекс Дзен, ВКонтакте, Одноклассники, Facebook
Популярные тесты
Тест: Узнайте в каком году вы должны были родиться на самом деле?
Что вас ждет в старости?
Только те, кто росли в СССР, смогут без труда ответить на все вопросы нашего теста
Если ответите на все вопросы нашего теста без ошибок, то можете считать себя уникумом с высоким IQ
Ваш учитель географии зря ставил вам «5», если вы не сможете ответить правильно хотя бы на 70%
Вас можно назвать ходячей энциклопедией, если сможете набрать восемь правильных ответов
Тест из одного вопроса, ответить на который правильно не может почти никто. Попробуете себя?
Проверьте свой интеллект
Насколько уникальна ваша личность?
Если вы ответите верно на все наши каверзные вопросы, то точно не зря получали высшее образование
Цветовой тест на возраст
Тест на общие знания, который на 11/11 осилит лишь настоящий эрудит
Насколько чиста ваша карма?
Cколько лет вашей душе?
На какое животное вы похожи, когда злитесь?
Цветовой тест: попробуем отгадать ваш возраст всего за 9 вопросов
Угадайте воинские звания России по погонам
Сможете ли вы пройти тест для разведчиков?
Сколько ты можешь выиграть в «Кто хочет стать миллионером?»
Сможете ли вы набрать 10/10 баллов в нашем тесте на общие знания?
Преимущества
Можете встраивать тесты на Ваш сайт. Тест показывается нашем и других сайтах. Гибкие настройки результатов. Возможность поделиться тестом и результатами. Лавинообразный («вирусный») трафик на тест. Русскоязычная аудитория. Без рекламы!
Пользователям
Вам захотелось отдохнуть? Или просто приятно провести время? Выбирайте и проходите онлайн-тесты, делитесь результатом с друзьями. Проверьте, смогут они пройти также как Вы, или может лучше?
Внимание! Наши тесты не претендуют на достоверность – не стоит относиться к ним слишком серьезно!
Классификация признаков
УСЛОВНЫЕ ОБОЗНАЧЕНИЯ
АГ – артериальная гипертония
АД – артериальное давление
ДК – диагностический коэффициент
ДЭ – диагностическая эффективность теста
ИМТ – индекс массы тела
ИО – истинно отрицательный результат
ИП – истинно положительный результат
ЛО – ложноотрицательный результат
ЛП – ложноположительный результат
ЛПВП – липопротеиды высокой плотности
МНК – метод наименьших квадратов
ОР – относительный риск
ОШ – отношение шансов
ППП STATISTICA – пакет прикладных программ STATISTICA
ЧСС – частота середечных сокращений
ПРЕДИСЛОВИЕ
Сегодня уже не стоит вопрос «нужна ли статистика врачу?». В эпоху развития доказательной медицины потребность в применении статистики в медицине и биологии стало необходимостью. В программы до- и послевузовского медицинского образования всех специальностей включена биологическая статистика. Очевидно, что врач не станет специалистом в области статистического анализа, однако, он должен знать основные задачи, которые стоят перед этой областью знаний, и, самое главное, понимать, что статистика помогает дать клиническую оценку результатам исследования эффективности профилактических, диагностических и лечебных мероприятий и процедур. Во–первых, врачу нужно иметь набор статистических знаний, позволяющих ему критически оценивать качество научных публикаций на медицинскую тематику. При этом не требуется достаточно глубоких теоретических знаний по статистике, вполне можно обойтись основами статистического анализа, знать ограничения по их использованию и разумные требования по описанию этих методов в публикациях. Во-вторых, врач может и сам участвовать в научных исследованиях, использовать статистику как средство анализа групповых свойств, при этом он должен владеть определенными навыками подбора методов, оценивать их достоинства и недостатки, уметь работать со статистическими программами, делать правильные выводы из полученных результатов.
Предлагаемое вашему вниманию издание является дополнением к уже выпущенному ранее учебному пособию «Биостатистика: в примерах и задачах». Если первая книга была посвящена в основном методам решения статистических задач, то теперь появилась необходимость изложить простым, «нематематизированным» языком основные цели и задачи биостатистики, теоретические основы статистических методов, показать, как эти методы позволяют решать конкретные медицинские проблемы. Также в книгу включены разделы, которые выходят за рамки додипломного образования, и будут полезны обучающимся в магистратуре и докторантуре при выполнении их научных работ. Надеемся, что книга будет полезна всем, кто хочет приобщиться к миру статистических знаний.
ЗАДАЧИ БИОСТАТИСТИКИ
Ниже приведены наиболее распространенные определения статистики вообще, и биостатистики в частности.
Статистика – отрасль знаний (наука), изучающая методы сбора, систематизации, обработки и интерпретации результатов наблюдений с целью выявления статистических закономерностей.
Биостатистика (биометрика) – отрасль знаний, связанная с разработкой и использованием статистических методов в научных исследованиях в медицине, здравоохранении и эпидемиологии.
Чтобы вникнуть в суть этих определений выясним, в чем была необходимость появления биостатистики, какие задачи она решает?
В своей практической деятельности врач, как правило, имеет дело с одним пациентом (в дальнейшем будем использовать термин биообъект), измеряет какие-то показатели его здоровья (признаки), ставит диагноз и назначает лечение. Это единичное явление, отдельный акт. Например, измерив рост одного человека, мы сразу делаем вывод: высокий, среднего роста он или низкорослый. А как поступить, если нам надо описать группу людей, учитывая, что они все разного роста (рисунок 1).
Рисунок 1. Пример группового свойства
Хср=178 см |
Хср=178 см |
Первое, что приходит на ум – это определить средний рост. Теперь задумайтесь, а что это нам дает, какую информацию о росте людей в данной группе несет среднее значение. Многих такой вопрос ставит в тупик. Давайте обратимся к рисунку 2.
Рисунок 2. Сравнение групповых свойств
Из него видно, что при равенстве средних значений рост людей в двух группах значительно разница. Отсюда можно сделать вывод, что для их сравнения одних только средних недостаточно. По-видимому, нужны еще какие-то показатели.
Еще один пример приведен на рисунке 3. Это результаты измерения артериального давления до и после приема некоторого гипотензивного препарата. В исследовании приняли участие две группы.
Рисунок 3. Изменение артериального давления после приема препарата
Теперь перейдем ко второй задаче биостатистики. Предположим, что в предыдущем примере с гипотензивным препаратом, испытанном на 7 больных, вы сделали вывод о его эффективности. Можем ли мы на этом основании предложить его для массового выпуска, будет ли он помогать и другим, тысячам, страдающим повышенным артериальным давлением? Наверное, многие ответят нет, не можем. Что же в таком случае делать, как проверить это средство, ведь как бы мы не увеличивали количество привлеченных к испытаниям лиц, все равно не сможем охватить всю совокупность гипертоников земного шара (в статистике используют термин генеральная совокупность). А ведь только это нас и интересует, а не результаты какого-то отдельного (выборочного) исследования, ведь мы предполагаем назначать препарат повсеместно. Статистические методы позволяют перенести результаты выборочных исследований на всю генеральную совокупность объектов, но с учетом, что есть вероятность ошибочности нашего утверждения. И если эта вероятность невелика, то мы принимаем сделанные выводы, в противном случае – отвергаем. Вопрос о том велика или невелика ошибка решает сам исследователь, исходя из сути решаемой проблемы. Например, я утверждаю, что данный препарат эффективен во всей генеральной совокупности, при этом вероятность ошибки составляет 0,05 (т.е. 5 %) и это меня вполне устраивает. Возможно, у кого-то другого более жесткие требования и он удовлетвориться только вероятностью ошибки не более 0,01 (1%).
Следующий случай продемонстрирует нам, к каким последствиям может привести незнание законов статистики и неумение ими пользоваться. Случай этот выдуманный, но весьма показательный. Фармкомпания разработала лекарственное средство, позволяющее повысить уровень гемоглобина, и испытало его на выборке из 5 человек. Результаты, приведенные на графике 4А, позволяют говорить о высокой его эффективности, ведь чем выше доза препарата, тем выше уровень Hb.
Рисунок 4. Результаты испытания препарата на выборках различного объема
На основании этих данных было налажено массовое производство, вложены значительные финансовые и людские ресурсы. Однако, время показало, что препарат залежался на складах и его не назначают врачи. Озадачившись, ученые провели повторное, более массовое испытание и вот, что оно дало – одна и та же доза может быть эффективной для одних лиц и неэффективной для других (рисунок 4Б). Отнеся результаты выборочных исследований на всю генеральную совокупность, исследователи не оценили вероятность ошибки полученных результатов, а она была, по-видимому, значительной, т.е. полученная эффективность носила случайный характер.
Таким образом, мы фактически сформулировали вторую задачу биостатистики. Смысл ее в принятии наиболее обоснованного суждения относительно свойств и характеристик генеральной совокупности с опорой на результаты изучения выборки.Эта задача рассматривается в разделе, называемом теорией проверки статистических гипотез.
Статистические методы позволяют также решать задачи выявления взаимозависимостей между признаками, изучения динамики состояния биообъектов во времени, задачи классификации и прогнозирования.
Основные понятия и определения биостатистики
Терминология имеет важное значение в любой области знаний, поскольку, не владея ею, нельзя понять суть излагаемого, и соответственно невозможно использовать знания на практике. Проблема состоит еще в том, что различные авторы или коллективы, научные школы могут использовать различную терминологию. Так, с советских времен в статистике закрепились термины и обозначения, отличающиеся от тех, что приняты в зарубежной литературе. Поэтому нам необходимо определиться с терминологией, которую будем использовать в дальнейшем.
Любой биообъект характеризуется какими-либо признаками. Например: рост, вес, артериальное давление, пульс, уровень гемоглобина, цвет глаз и т.д. При измерении этих признаков у разных объектов получаем статистические данные. Если у каждого объекта измеряется один признак (например, гемоглобин), то получаются одномерные данные, если два признака (гемоглобин и ЧСС) – то данные двумерные, и т.д. – многомерные.
Пусть измерен пульс у разных людей и получены статистические данные: 65, 68, 72, 75, 80, 60, 65, 64, 61, 77, 73, 73, 69, 60…..
С математической точки зрения пульс представляет собой случайную величину. Это одно из основных понятий теории вероятности, на которую во многом опирается статистика. Случайной величинойX (x1, x2, x3 …..xi……xn) называется величина, которая в результате опыта может в определенных пределах принять то или иное значение, неизвестно заранее какое именно.
Как правило (но не всегда), генеральная совокупность имеет очень много элементов (объектов), либо они труднодоступны. Поэтому обследуется некоторая часть генеральной совокупности – выборочная совокупность (выборка). Количество объектов в выборочной совокупности называется объемом выборки (n).
Выборка должна давать правильное, неискаженное представление о генеральной совокупности, или, как говорят, быть репрезентативной. Например, нельзя судить о заболеваемости кишечными инфекциями, обследуя только районы с высокими социально-экономическими условиями.
Как мы уже отмечали, результаты исследования выборки с определенной долей вероятности распространяются на всю генеральную совокупность, т.е. определяется их статистическая значимость.
Классификация признаков
Почему важно знать классификацию признаков (иногда говорят шкалы измерения)? Тип признака во многом определяет те статистические методы, которые могут быть применены для обработки данных. В литературе встречаются различные классификации, но все они достаточно близки друг к другу и предлагаемая ниже вполне достаточна для освоения основ биостатистики.
Различают количественные и качественные признаки. Количественные признаки выражаются числами. Значения количественных признаков могут быть непрерывными или дискретными. Дискретные – это признаки, значения которых отличаются не менее чем на единицу измерения признака (число человек в семье, койко-дни). Непрерывные признаки – это признаки, значения которых могут отличаться друг от друга на любую сколь угодно малую величину (рост, вес человека, объем).
Рисунок 5. Классификация признаков
Качественные признаки выражаются категориями. В свою очередь они в зависимости от вида данных делятся на номинальные (классификационные) и ординальные (порядковые). Говорят также, что соответствующие качественные признаки измеряются в номинальной или порядковой шкале. Разница между этими шкалами состоит в следующем.
Признак, измеряемый в номинальной шкале, принимает одно значение из конечного числа заведомо установленных градаций. Примерами признаков, измеряемых в номинальной шкале, являются пол (мужской, женский), цвет глаз (карие, зеленые, серые), классификация животных и т. п. Статистические данные, измеряемые в номинальных шкалах, представляются в виде таблиц, в которых приводятся частоты появления той или иной градации признака. Часто номинальные данные появляются при обработке эпидемиологических данных. Например, может представлять интерес вопрос о частоте встречаемости того или иного признака при том или ином заболевании.
Значения качественных признаков, измеряемых в ординалъной шкале, могут быть упорядочены, т.е. расположены по возрастанию или убыванию. Примерами таких признаков являются качество условий жизни (плохое, удовлетворительное, хорошее, очень хорошее), температура (нормальная, повышенная, высокая, очень высокая), шкала оценки боли. Для признаков, измеряемых в ординальных шкалах, операции сложения и вычитания не имеют смысла. Так, нельзя сказать, что студент, получивший на экзамене «пять» по статистике знает предмет на одну единицу лучше, чем студент, получивший по этому предмету «четыре», поскольку для знаний не существует единицы измерения. Однако можно сказать, что первый студент знает статистику лучше, чем второй.
Для представления значений ординальных признаков в числовой форме используется следующий способ. Все значения признака записываются в порядке возрастания в виде ряда. Каждому значению ставится в соответствие натуральное число, равное его номеру в ряду. Это число называется рангом. Например, качество условий жизни (плохое, удовлетворительное, хорошее, очень хорошее) будет представлено рангами 1, 2, 3, 4. Для ординальных признаков, представленных в виде рангов, разработаны специальные статистические методы, позволяющие измерять степень близости признаков (например, ранговая корреляция), проверять гипотезы о виде распределения, проводить дисперсионный анализ.
Для данных, представленных в номинальной шкале, также не определены операции сложения и вычитания. Эти данные (в отличие от ординальных признаков) не могут быть упорядочены и, следовательно, оцифрованы с помощью рангов. Применяя специальные статистические методы для номинальных признаков, можно проверить гипотезы о независимости признаков и о принаддежности двух или нескольких выборок к одной совокупности.