Содержание
Биометрия как наука и основные ее понятия — Информатика, информационные технологии
ВВЕДЕНИЕ
Вопросы изучения живых организмов и растительных объектов, а также процессы, происходящие на клеточном, молекулярном и генетическом уровне становятся все более актуальными с каждым днем. С этой целью в научных лабораториях разрабатываются методы по их исследованию и моделируются сложных явлений природы. К наиболее часто используемым методам исследования можно отнести экспериментальные и методы многомерной статистики. Они являются важной и неотъемлемой частью лабораторного эксперимента и позволяют достоверно выявить закономерности происходящих природных процессов, а также найти причинно-следственные связи между ними.
В научных исследованиях для получения достоверных данных эффективно используется метод массовых наблюдений. Данный метод основан на использовании большого количества повторностей в каждой экспериментальной группе. Материал, полученный в ходе лабораторного опыта, обрабатывают и анализируют, далее по полученным данным делают соответствующие выводы и устанавливают те или иные закономерности. Большое значение в достижении наибольшей точности результатов и выводов в ходе эксперимента имеет не только качество экспериментальных методик, но и правильная статистическая обработка, так как полученные результаты могут значительно варьироваться в пределах одной экспериментальной группы. Таким образом, выполнение статистического анализа экспериментально полученных данных расширяет возможности в познании биологических явлений природы, способствует объективной оценке полученных результатов, исключая возможность субъективной точки зрения исследователя, а также методической ошибки, которые возникают при выполнении эксперимента, и дает возможность экспериментатору сделать точные и корректные выводы и заключений в отношении изучаемого явления.
Предмет исследования – компьютерные технологии как способ обработки данных, полученные при лабораторном исследований.
Цель исследования – проанализировать возможности статистических программ при обработке данных, полученных в результате постановки лабораторного эксперимента.
Задачи исследования:
- Оценить методы математической статистики с точки зрения их возможностей и границ применения при планировании и обработки биохимического эксперимента.
- Изучить, имеющиеся статистические пакеты анализа.
- Освоить возможности решения задач прикладной статистики средствами Microsoft Excel (применения стандартных функций и пакета анализа данных) и известных статистических пакетов STATISTICA в области биохимии.
Компьютерные технологии имеют большое значение в статистической обработке данных. Это позволяет не только ускорить данный процесс в несколько раз, но и произвести его на более высоком качественном уровне.
ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ИСПОЛЬЗОВАНИЯ КОМПЬЮТЕРНЫХ ТЕХНОЛОГИЙ ПРИ ПРОВЕДЕНИИ ЛАБОРАТОРНОГО ИССЛЕДОВАНИЯ
Биометрия как наука и основные ее понятия
В последние годы все чаще для решения и моделирования поставленных задач используются компьютерные технологии. В связи с этим возросла потребность в высококвалифицированных специалистах, имеющих хорошую теоретическую базу и имеющие опыт работы с некоторыми программами. На сегодняшний день в учебных учреждениях появляются дисциплины, которые позволяют сформировать устойчивые умения, необходимые для обработки и представления результатов научной деятельности. Наука, которая занимается изучением методов сбора и токованием числовых данных называется статистика. Данная дисциплина имеет важное практическое значение, так как позволяет прогнозировать развития природных, социальных процессов и явлений. Со временем стали появляться более специализированные отрасли данной науки. Таким образом, на стыке двух самостоятельных наук: биология и статистика, — появляется биологическая статистика (или биометрия). Биометрия – эмпирическая наука, изучающая данные, полученные при постановке опыта путем выполнения некоторых математических вычислений. Выполнение данных операций без вычислительной техники и компьютерных технологий занимает очень много времени. Насколько это трудоемкий процесс мы можем убедиться, рассмотрев некоторые наиболее используемые понятия биометрии при характеристики исследуемого признака.
Основные понятия биометрии.
Очень часто в практической деятельности человека и при обработке данных, полученных в ходе научных исследований, используется средняя величина. Данная величина характеризует исследуемый признак и показывает, каким было бы значение переменной, если бы у всех объектов из выборки оно было бы одинаковым. Средне арифметическая вычисляется по формуле:
,
где х1х2, …, xk — варианты совокупности; n— общее количество вариант.
Медиана (граница 50%-ного интервала) — значение, которое делит выборку пополам: в обе стороны от медианы в вариационном ряду располагается одинаковое число вариант. Эта величина зависит от накопления частот. Частоты накапливают до тех пор, пока не будет превышена половина суммы частот. Полученное наибольшее значение и есть медиана. Формула, по которой можно вычислить данное значение имеет следующий вид:
,
где xmin – минимальное значение предела интервала, где находится срединное значение; i — величина интервала; N-объем совокупности; ?n-суммарная численность до интервала, в котором находится срединное значение; Ne-численность интервала, где находится срединное значение.
Еще один статистический показатель это мода. Модой называется такая величина, которая наиболее часто встречается. Моду можно вычислить по формуле Пирсона:
,
где Ме – медиана; М-среднее значение признака.
Среднее квадратичное отклонение, — важнейшая характеристика в биологическом эксперименте. Данная величина является мерой рассеяния ряда распределения и определяется по формуле:
В некоторых экспериментах требуется очень высокая точность опыта. Например, в медико-биологических, токсикометрических и др. Ошибка в данных опытах не должна быть выше 1%, если значение ошибки превышает 1%, то точность результата является неудовлетворительной и нужно увеличивать количество повторностей.
Однако как бы исследователь ни старался точно выполнять все действия методики эксперимента, все равно на практике случаются ошибки, которые необходимо учитывать при обработке данных. Существует несколько типов ошибок.
Ошибка средней (mx) — показатель, на которое отличается среднее значение выборочной (опытной) совокупности от среднего значения генеральной совокупности, если распределение исследуемого параметра будет стремиться к нормальному значению. Основная ошибка среднего рассчитывается по формуле:
Более информативным и приемлемыми для сравнения групп используется коэффициент изменчивости, или вариации. Коэффициент изменчивости – это основное отклонение, выраженное в процентах от среднего значения, которое рассчитывается по формуле:
По полученным результатам делают вывод о характере и степени варьирования признака (таблица 1.1).
Таблица 1.1. Характер изменчивости признаков (по М.Л.Дворецкому)
Коэффициент изменчивости, С | до 5% | 6-10% | 11-20% | 21-50% | более 50% |
Характер изменчивости | слабая | умеренная | значительная | большая | очень большая |
Далее проверяют степень надежности результата:
Если значение t больше четырех, то среднее значение будет достоверным и соответственно можно сформулировать корректные выводы.
Определяют также процент расхождения между выборочной и генеральной средними — точность опыта (р,%), или ошибка наблюдений:
Этот параметр опыта показывает, на сколько процентов можно ошибиться, если утверждать, что генеральная средняя равна полученной выборочной средней.
Встатистике важным является показатель нормирования. Данный показатель используется для оценки вариант относительно к среднему значению данной группы по следующей формуле:
В зависимости от цели исследования значение может колебаться от x: ±0,5? до х±1?. Варианты со значением от 0,67? до 2? являются субнормальными, если значение равно более х± 2?, то такие вариантыследует отнести к категории аномалий.
В биометрии существует такое понятие как ошибка репрезентативности. Эта ошибка, которая возникает не в ходе выполнения измерений или вычислений, а из-за случайного отбора при формировании группы.
При подсчете ошибки средней арифметической в небольших группах количество наблюдений (п) является «числом степеней свободы» — используется выражение (n-1), и тогда формула имеет вид:
Существует огромное количество формул вычисления ошибок эксперимента. Некоторые из них приведены ниже в качестве примера. Формула, по которой вычисляется средняя ошибка среднего квадратического отклонения:
Средняя ошибка коэффициента вариации (С):
Средняя ошибка показателя асимметрии:
, или более точно:
Ошибку коэффициента эксцесса:
, или
Сравнительный анализ полученных результатов сводится к оценке степени достоверности наблюдаемых между ними различий по следующей формуле:
где t — критерий достоверности. Его значение оценивается по таблицам вероятности Стъюдента. Если фактическое t больше табличного tst, то существует разница между двумя исследуемыми группами. Различие существенное, достоверное и его нельзя объяснить случайными причинами.
Для сравнения полученных результатов с ожидаемыми используют критерий хи-квадрат (?2), который находится по формуле:
где, p – эмпирическая частота, p’ – ожидаемая частота. Значение ?2-теста заключается в том, чтобы узнать, подтверждается или опровергается гипотеза экспериментом. Если значений ?2, превышает табличное, то можно утверждать, что разница между фактическими и ожидаемыми результатами будет достоверной.
Так как большинство биологических объектов имеют огромное количество, нередко взаимосвязанных признаков, которые их характеризуют, например, вес, рост, возраст и др., то при исследовании комплекса показателей применяют дисперсионного анализа. Зависимость, при которой на каждое значение независимой переменной приходится только одно значение зависимой, называют функциональной. Однако в природе такая связь бывает очень редко. Обычно исследуемые объекты с одинаковыми значениями одного признака имеют разные значения по другим признакам. Такую связь называется корреляцией. Коэффициент корреляции показывает, насколько один исследуемый признак связан с другим (таблица 2). Коэффициент корреляции вычисляется по формуле:
Таблица 1.2. Характеристика тесноты связи между признаками
Коэффициент корреляции | Теснота связи | Коэффициент корреляции | Теснота связи |
До 0,30 | Слабая | 0,71-0,90 | высокая |
0,31-0,50 | Умеренная | 0,91 и более | очень высокая |
0,51-0,70 | Значительная |
Так же необходимо найти квадратическую ошибку коэффициента корреляции:
Полученные показатели коэффициента корреляции оценивают с помощью критерия достоверности Стьюдента:
или с помощью формулы
При оценке взаимосвязи величин очень важно найти аналитическое уравнение, которое будет соответствовать природе изучаемого явления для предсказания поведения независимой характеристики объекта при изменении зависимого параметра. Взаимосвязь между переменными величинами называется регрессией. Коэффициент регрессии, который определяется по следующим аналогичным формулам:
-коэффициент регрессии Y.X;
коэффициент регрессии X.Y,
и .
Для коэффициента регрессии также находят среднюю квадратическую ошибку:
и
Это основные формулы, применяемые в биометрии, которые используются при обработке данных, полученных в ходе биохимических исследований. Существует еще очень много статистических формул, однако все они, как мы уже убедились, состоят из нескольких математических действий, что осложняет вычисления исследователя и может привести к многочисленным ошибкам в расчетах. Исправление этих ошибок может отнять много времени при обработке большого количества данных. Таким образом, компьютерные технологии упрощают данный рутинный процесс в несколько раз, что позволяет более рационально использовать время, а также уменьшают вероятность ошибки, что дает уверенность в правильности полученных результатов и позволяет сделать корректные выводы.
Планирование и обработка биохимического эксперимента
В настоящее время существует множество информации и довольно сложно ориентироваться в этом бесконечном потоке знаний. Тогда возникает вопрос, каким образом можно получить интересующую информацию и подобрать нужную литературу, затратив при этом минимальное количество времени. Для этого существуют различные поисковые системы, которые значительно сокращают количество потраченного времени на подготовительном этапе. Так как прежде чем приступить к выполнению и планированию исследования, необходимо убедиться, не изучался ли данный вопрос ранее, каковы результаты проведенных исследований и какие критерии уже изучены. Чтобы больше осознать в полной мере необходимость информационных технологий в планировании эксперимента, необходимо понять, что представляет собой данный процесс.
Планированием эксперимента называется комплекс мероприятий, направленных на эффективную постановку опыта, главной целью которого является достижение максимальной точности измерений при проведении минимального количества опытов. При планировании опыта выделяют несколько этапов:
1. Предпланирование – этот этап включает в себя составление плана работы и его утверждение, выбор темы, формулировка рабочей гипотезы, информационная обработка плана и освоение методик.
Этот этап позволяет исключить возможность дублирования исследования, обеспечивает достоверность знаний и оригинальный подход к решению поставленных перед исследователем задач
2. Собственно процесс исследования – на данном этапе производится аналитический обзор литературы по данной проблеме, накопление данных, их систематизация и выработка представлений и проведение эксперимента. Эксперимент – набор действий и наблюдений, выполненных для проверки истинности или ложности выдвинутой гипотезы и установление причинно-следственных связей между изучаемыми феноменами.
Благодаря данному этапу исследователь может осознать насколько новой является данная тема и актуальны полученные результаты, сформулировать научно-практическую значимость.
3. Последний этап заключается в оформление результатов научного поиска – составление отчетов, написание статей.
Любой эксперимент основан на выполнении аналитического метода, Аналитические методы имеют критерии, определяющие пригодность метода:
- Специфичность – способность определить тот компонент, для определения которого данный способ исследования предназначен.
- Точность – качество измерений, отражающих близость полученных результатов, содержащих анализируемое вещество
- Сходимость (воспроизводимость в серии) представление о близости друг к другу результатов исследования выполненных в одних условиях в серии.
- Воспроизводимость – близость результатов, полученных при выполнении лабораторного аналитического исследования пробы в различных условиях. Данный параметр отражает степень разброса данных и позволяет выявить случайные ошибки.
- Правильность и неправильность — отличия от истинного значения
- Чувствительность – способность метода выявлять наименьшее значение анализируемого вещества. Оценивается величина отношения разности между показателями измерений прибора. Чем выше величина отношения, тем выше чувствительность метода.
- Предельная чувствительность – концентрация исследуемого вещества соответствующая минимальному измерению отличному от значения холостой пробы.
Интерпретация полученных результатов исследования производится вручную или с помощью компьютера. Один из способов оценки результатов это построение градуированной (калибровочной) кривой. Калибровочная кривая отображает тесную связь экстинкции, интенсивности излучения света и концентрации вещества в сериях стандартных растворов. Для построения градуированной кривой используются стандартные растворы.
Построение калибровочной кривой:
u Приготовление стандартных растворов
u Приготовление разведение стандартного вещества, который охватывает диапазон исследуемых концентраций и выходит за пределы максимального и минимального значения.
u Из основного готовим маточные растворы
u Для каждой концентрации стандартного раствора делаем 3-5 измерений
u По полученным точкам строим график.
Для большей наглядности и точности лучше всего построить график. График показывает зависимость оптической плотности от концентрации раствора. Это будет более удобно при последующем определении концентрации изучаемого вещества в исследуемых пробах, что поможет рассчитать более правильную концентрацию рабочих растворов.
Лекция 1.4. Основные термины и понятия
Биометрия как наука
ВВЕДЕНИЕ
В лесном хозяйстве широко применяются
методы лесной биометрии. Без математико-статистической
обработки сегодня немыслимо проведение лесоводственных
исследований. Подавляющее большинство
нормативов, применяемых в лесном хозяйстве,
разработано с использованием биометрических
методов.
Широкое применение компьютеров в лесоустройстве
и в лесхозах сделало биометрические методы
доступными широкому кругу лесоводов.
В то же время лесовод не может быть бездумным
пользователем компьютерных результатов
биометрических измерений и вычислений.
Он дол жен понимать суть изучаемого явления
или процесса, разбираться в алгоритме
и механизме вычислений, которые выполнил
компьютер по заданной про грамме.
БИОМЕТРИЯ КАК НАУКА
Явления жизни, как и вообще все явления материального
мира, имеют две неразрывно связанные
стороны: качественную, воспринимаемую
непосредственно органами чувств, и количественную,
выражаемую числами при помощи счета и
меры.
При исследовании различных явлений природы применяют одновременно
и качественные, и количественные показатели.
Несомненно, что толь ко в единстве качественной
и количественной сторон наиболее полно
раскрывается сущность изучаемых явлений.
Однако в действительности приходится
пользоваться, смотря по обстоятельствам,
либо качественны ми, либо преимущественно
количественными показателями, памятуя
о том, что качество и количество материи
находятся в диалектическом единстве,
взаимно переходят друг в друга.
Несомненно, что количественные методы
как более объективные и точные имеют преимущество
перед качественной характеристикой предметов.
Недаром еще в древности достоверность
познания природы связывалась с математикой
— наукой точной, изучающей количественные
от ношения и пространственные формы реальной
действительности. Опираясь на количественные
показатели, можно получить более достоверную
информацию о предметах, что позволяет
глубже постигнуть их качественное своеобразие.
Количественные методы не ограничиваются
одними лишь измерениями или учетом живых
существ и продуктов их жизнедеятельности.
Сами по себе результаты измерений, хотя
и имеют известное значение, еще недостаточны
для того, чтобы сделать из них необходимые
выводы.
Цифровые данные, собранные в процессе массовых испытаний, т.е. измерений
или учета изучаемого объекта, — это всего
лишь сырой фактический материал, который
нуждается в соответствующей математической
обработке. Без обработки — упорядочения
и систематизации цифровых данных — не
удается извлечь заключенную в них информацию,
оценить надежность отдельных суммарных
показателей, убедиться в достоверности
или недостоверности наблюдаемых между
ними различий. Эта работа требует от специалистов
определенных знаний, умения правильно
обобщать и анализировать собранные в
опыте данные. Система этих знаний и составляет
содержание б и о м е т р и и — науки, занимающейся
главным образом вопросами статистического
анализа результатов исследований как
в области теоретической, так и прикладной
биологии, в том числе и в лесном хозяйстве.
Особенности биометрии как науки и ее
место в ряду других наук.
Одна из характерных особенностей биометрии
как науки состоит в том, что она не имеет прямого и непосредственного
отношения к вопросам техники измерений
или учета живых существ. Это дело частных
наук — таких как ботаника, зоология, антропология,
лесоведение, дендрология, энтомология,
агрономия и др. Они имеют свои объекты
исследования и применительно к ним разрабатывают
методику измерений и количественного
учета изучаемых объектов. В настоящее
время широко применяются биометрические
способы планирования биологических экспериментов,
опытов, полевых исследований. Но главной
задачей биометрии по-прежнему остается
обработка результатов измерений и учета
результатов опытов для того, чтобы по
немногим числовым показателям судить
о существе изучаемых явлений. Поэтому
с чисто формальной стороны биометрия
представляет совокупность математических
методов, применяемых к обработке результатов
биологических исследований. Эти методы
она заимствует преимущественно из области
математической статистики и теории вероятностей,
составляющих техническую основу биометрии.
Следовательно, биометрия — это математическая
статистика в приложении к явлениям живой
природы.
Сопоставляя названные науки, надо иметь
в виду, что математическая статистика
и теория вероятностей являются науками
сугубо теоретическими, абстрактными.
Они изучают статистические совокупности
безотносительно к специфике входящих
в их состав элементов. Методы ма тематической
статистики и лежащей в ее основе теории
вероятностей могут быть приложены к самым
различным областям знания, включая и
гуманитарные науки. Биометрия же — наука
эмпирическая, конкретная: она исследует
исключительно биологические совокупности,
преследуя не математические, а биологические
цели.
На этом основании нельзя ставить знак равенства между биометрией
и математической статистикой, полностью
их отождествлять. Биометрия имеет свой
объект исследования, свое место в системе
биологических наук: теория вероятностей
и математическая статистика — разделы
современной математики, а биометрия относится
к числу биологических наук. Отношение
биометрии к математике аналогично тому,
какое существует между биологией и методикой
ее преподавания. Не имея собственных
методов исследования, которые она заимствует
из математики, биометрия занимает особое
положение, являясь относительно самостоятельным
разделом биологии, возникшим на стыке
математических и биологических наук.
Биометрия является следствием развития
теории вероятностей и математической
статистики. Ее часто называют вариационной
статистикой.
Теория вероятности имеет дело со случайными
явлениями. В научных исследованиях, технике
и массовом производстве часто приходится
встречаться с явлениями, которые при
неоднократном воспроизведении одного
и того же опыта в неизменных условиях протекают каждый раз несколько
по-иному. Такие явления называют случайными.
Например, при стрельбе результат каждого
отдельного выстрела будет случайным.
Проводя экспериментальное изучение какого-либо явления и систематизируя
результаты исследования (тех же результатов
стрельбы) в виде графической зависимости,
мы убеждаемся в том, что при достаточно
большом количестве экспериментальных
точек получается не кривая, а некоторая
полоса, т.е. имеет место случайный разброс
экспериментальных точек.
Измеряя диаметры и высоты в лесу и нанося полученные
значения на график, мы тоже увидим набор
точек, но при достаточно большом числе
наблюдений вырисовывается некоторая
линия, близкая к параболе или к другой
функции, имеющей схожий график.
При решении многих практических задач случайными отклонениями
точек от кривой можно пренебречь, предполагая,
что в данных условиях опыта явление протекает
вполне определенно. Выявляется основная
закономерность, свойственная данному
явлению. По этой закономерности, применяя
тот или иной математический аппарат,
можно предсказать результат опыта по
его заданным условиям.
По мере развития различных отраслей
науки становится необходимым изучать
случайные явления, с тем чтобы научиться
предвидеть действия случайных факторов
и учитывать их в практическом решении задач. В лес
ном хозяйстве такая потребность появилась
в конце XIX века, что дало толчок к использованию
методов математической статистики и
положило начало развитию лесной биометрии.
Математическая наука, изучающая общие
закономерности случайных явлений независимо
от их конкретной природы и дающая методы
количественной оценки влияния случайных
факторов на различные явления, называется
теорией вероятностей. Основой научного
исследования в теории вероятностей является
опыт и наблюдение. На теории вероятностей
базируется вся статистика — и математическая,
и экономическая, и социальная.
Математическая статистика — это строгая
наука и, как любая наука, она объективна
и беспристрастна.
В целом и теория вероятностей, и математическая
статистика — это разделы математики. Связи
современной биологии и лесного хозяйства
с математикой многосторонни, они все
больше расширяются. Но не вся кие количественные
методы, используемые в биологии, составляют
со держание биометрии. Нельзя, например,
отождествлять биометрию с кибернетикой
и с так называемой “математической биологией”,
у которых имеются свои, особые задачи,
не совпадающие с задачами биометрического
анализа совокупностей.
Другой характерной особенностью биометрии
как науки является то, что ее методы могут быть приложены не к единичным
объектам, не к отдельным результатам
наблюдений, а к их совокупности, т.е. к
явлениям массового характера. Если мы
рассматриваем, например, отдельно взятую
особь и сравниваем ее с популяцией, к
которой она принадлежит, то можем сказать,
что между данной особью и популяцией,
как равно и между результатами единичных
измерений и всей их совокупности в целом,
существует самая тесная связь. Иначе
говоря, общее и единичные явления не просто
“сосуществуют”, они взаимно обусловливают
друг друга. Нельзя представить совокупность
без ее членов, как невозможен лес без
деревьев определенного ботанического
вида или определенной древесной породы.
Древесными породами в лесоводстве принято
называть древесные виды. Каждый лесовод
знает, что некоторая сумма деревьев –
это еще не лес. Лес отличается от совокупности
деревьев не толь ко количественно, но
и качественно. Вот это качественное отличие
и должны отражать законы биометрии.
Наконец, нельзя не отметить еще одну
характерную черту биометрии — ее своеобразный язык знаков,
символов, уравнений, графиков и формул.
Все эти условные обозначения, предназначенные
для “экономного” выражения мысли, биометрия
заимствует из математики. Известно, что
математическая логика отличается краткостью
и точностью доказательных формулировок,
убедительностью выводов. Благодаря символике
удается сравнительно простыми и точными
средствами выражать содержание сложных
и многообразных явлений природы, что
значительно облегчает понимание присущих
им закономерностей.
Разумеется, любые схемы и модели дают
лишь некоторое подобие реальной действительности.
Но именно в этом и заключаются их боль
шие методические возможности. Достаточно
облечь мысли в форму символов и знаков,
геометрических фигур и уравнений, как
это дает широкие возможности для глубокого
и всестороннего познания явлений, быстрого
движения на пути к истине.
Но символы и вообще биометрические показатели
приобретают определенный смысл лишь
тогда, когда они соответствуют содержанию
выражаемого ими процесса, находятся в тесной связи с конкретными
задачами биологического исследования.
В противном случае биометрическая символика
не только не оправдывает себя, но может
привести исследователя к ошибкам и заблуждениям.
Дело в том, что в краткости и точности
числовых характеристик, в удобстве выражать
биологические явления языком математических
фор мул и уравнений заключены не только
большие методические возможности, но
и опасность отрыва от конкретных явлений,
а это ведет к ошибкам, создает видимость
истины там, где ее на самом деле нет. Не
следует выражать математическими формулами
или графиками то, что очевидно само по
себе. Во многих случаях биометрические
данные, сведенные в статистические таблицы,
оказываются настолько убедительными,
что не нуждаются ни в какой дополнительной
обработке.
История возникновения и развития математической
статистики и биометрии.
Биометрия сама по себе наука относительно
молодая. Первые опыты ее применения относятся к работам
Борелли, который на рубеже XVII и XVIII веков
делал математические расчеты движения
животных.
В начале XVIII века французский ученый
Реомюр (1683-1757) (вспомним, что есть температурная
шкала Реомюра) искал математические законы
строения пчелиных сотов.
Но как полноценная наука биометрия появилась
лишь к концу XIX века. Термин “биометрия” был введен
в науку английским ученым антропологом
Фр. Гальтоном (1822-1911) в 1889 году для обозначения
количественных методов, применяемых
в области биологических исследований.
В дальнейшем Дункер (1899) предложил другое
название — “вариационная статистика”,
которое тоже вошло в обиход как выражающее
более точное содержание данного предмета.
В настоящее время употребляются оба эти
термина, хотя буквальный смысл их неодинаков.
Слово “биометрия” (от лат. bios — жизнь,
metron — мера) означает производство биологических
измерений, а термин “вариационная статистика”
(от лат. слов variatio — изменение, колебание
и status — состояние, положение вещей) понимается
как описание наблюдений, их математическая
обработка. Гораздо более длительную историю
имеет как общая статистика, так и математическая
или вариационная статистика.
Развитие статистики началось в эпоху
античности, т.е. эта наука имеет древние
корни. Например, использование среднего
значения было хорошо известно еще при
жизни Пифагора (VI в. до н.э.), а упоминания о статистических
обследованиях встречаются и в библейские
времена.
Статистика постепенно развивалась там,
где в ней возникала необходимость. В первую
очередь статистические методы начали
применяться для анализа экономики и явлений общественной жизни, и лишь
позже они проникли в биологию. Так, Исаак
Ньютон (1642-1727), чей вклад в открытие дифференциального
и интегрального исчисления был выдающимся
событием в математике, а его теория всемирного
тяготения и «ньютоново яблоко» известны
любому старшекласснику, является, возможно,
наиболее заметной фигурой в области развития
современной статистики, хотя сам Ньютон
вряд ли слышал когда-либо о существовании
этой науки. Другие математики, чьи имена
известны прежде всего благодаря работам
в области чистой математики, косвенно
сделали для развития статистики больше,
чем многие из тех ученых, которые непосредственно
специализировались на этой науке. Двумя
наиболее выдающимися представителями
таких ученых-математиков являются Абрахам
де Муавр (1667-1754) и Карл Гаусс (1777-1855).
В двадцатом веке статистические методы
официально введены в Со единенных Штатах
для обучения во всех колледжах. Там читались
не большие курсы статистики. В течение
первых тридцати лет этого века постепенно
возрастало значение статистики в исследовании
проблем психологии. При этом отметим,
что в данный период психология как наука
не была самостоятельной и часто рассматривалась
лишь как один из разделов философии.
Исследование показало, что взрослое население США имеет контекстно-зависимые взгляды на использование биометрических технологий
Инженерное дело
Недавно опубликованные результаты исследований показывают, что репрезентативная выборка взрослых американцев имеет разные уровни комфорта при использовании различных типов биометрических технологий. Кредит: Adobe Stock/@bearsky23. Все права защищены.
22 ноября 2021 г.
Саманта Чаваник
УНИВЕРСИТЕТСКИЙ ПАРК, Пенсильвания — По мере расширения применения технологий распознавания лиц и ДНК в различных отраслях и областях возникают вопросы, касающиеся комфорта населения с биометрическими модальностями, приемлемости использования биометрии в различные социальные контексты и доверие общественности к государственным и частным организациям, использующим биометрические технологии. Международная группа исследователей поставила перед собой цель понять точки зрения на биометрические технологии, представленные репрезентативной выборкой взрослых в Соединенных Штатах.
В течение двух недель в конце 2020 года исследовательская группа опросила 4048 взрослых. Выборка отражала население США по географическому региону, возрасту, полу, расовому и этническому происхождению, уровню образования, доходу домохозяйства и политическим взглядам. Команда попросила участников ранжировать шесть типов биометрических данных — отпечаток пальца, образец голоса, изображение лица, сканирование глаз, геометрию руки и ДНК — указав, что им удобно использовать в организациях для любых целей.
Команда опубликовала результаты в IEEE Transactions on Technology and Society . Почти 41% респондентов назвали отпечатки пальцев биометрическими данными, которые им наиболее удобны для широкого использования. Как команда и ожидала, результаты опроса показали корреляцию между предыдущим опытом работы с биометрическими технологиями и повышением комфорта, хотя невозможно сделать вывод, повлиял ли комфорт на этот предыдущий опыт или наоборот. Когда их попросили ранжировать биометрические технологии на основе уровня комфорта, большинство участников опроса указали, что они очень или в некоторой степени довольны всеми технологиями — 74,8 % для использования отпечатков пальцев, 66,2 % для образцов голоса, 63 % для использования геометрии руки, 61,1 % для изображения лица и 60,6% для сканирования глаз. Самый низкий процент очень или несколько комфортной оценки был отмечен для ДНК — 55,6%. Демографические данные практически не повлияли на сообщаемый уровень комфорта.
Те, кто сказал, что они не очень или полностью недовольны широким использованием биометрии, назвали причины, в том числе вторжение в частную жизнь, желание знать, как будет использоваться информация, какие политики существуют в отношении хранения информации, а также боязнь правительственного надзора.
«Было несколько удивительно, что перспективы, похоже, не сильно зависят от демографических данных, таких как пол, расовая и этническая принадлежность, несмотря на растущее осознание предвзятости технологий распознавания лиц и их приложений», — сказала старший автор Дженнифер К. Вагнер, доцент права, политики и инженерии в Университете штата Пенсильвания. «Нам интересно, как разнообразие точек зрения может быть замаскировано из-за различных информационных потребностей (по биометрическим технологиям), которые мы не учитывали в этом исследовании».
В дополнение к этим общим вопросам, половине участников опроса было предложено оценить определенные биометрические данные, используемые для выполнения конкретных задач, таких как отпечатки пальцев или распознавание лиц для разблокировки смартфонов, по шкале удобства. Большинство, 67,1%, указали на комфорт при выполнении биометрической задачи, которая становится все более распространенной. Из семи сценариев, представленных участникам, большинство указало, что им не нравится биометрическая технология, используемая розничными магазинами для отслеживания движения магазина и последующего применения в таргетированной рекламе, в сценариях повторного подключения, выполненных компаниями по поиску людей, ассоциациями домовладельцев, применяющими технологию для отслеживания тротуаров и улиц. движения и приложения программы лояльности клиентов.
«Политика часто работает, чтобы идти в ногу с развитием технологий и науки», — сказала первый автор Сара Хьюстон Кацанис, руководитель лаборатории генетики и справедливости в детской больнице Энн и Роберта Х. Лурье в Чикаго и доцент кафедры педиатрии в Северо-Западном университете. Медицинский факультет Университета Файнберга. «Часто технологические разработки продолжаются тогда, когда они осуществимы, без паузы для разветвлений этой технологии. То, что мы можем что-то сделать, не означает, что мы можем что-то сделать.0027 должен . Биометрические технологии обладают огромным потенциалом одновременно приносить пользу и вред отдельным лицам и группам. Наша цель — понять, каковы эти преимущества и риски в различных приложениях, чтобы общественность могла принимать обоснованные решения в зависимости от контекста о том, что считается приемлемым использованием появляющейся биометрии».
Команда обнаружила, что конкретный тип биометрии, будь то изображение лица или ДНК, по-видимому, не влиял на предполагаемое доверие к использованию биометрии государственными и частными организациями, но контекст имел значение. Небольшое большинство респондентов доверяли правоохранительным органам, спецслужбам, исследователям, ученым и работникам здравоохранения сбор и использование двух типов биометрических данных, но незначительное большинство респондентов не доверяло рекламодателям, технологическим компаниям, розничным торговцам и правительствам.
По словам Вагнера, исследователи планируют изучить, как контекстуальные факторы помогают формировать перспективы.
«Учитывая, насколько широко биометрические технологии в целом и аналитика лица в частности используются в обществе, удивительно, что так мало известно о взглядах на них взрослых в Соединенных Штатах», — сказал Вагнер. «Мы должны попытаться убедиться, что биометрические технологии, практика и политика, связанные с биометрическими данными, учитывают более тонкие аспекты».
Дополнительное исследование , выполненное командой, специально для медицинских и исследовательских учреждений, недавно было опубликовано в PLOS ONE.
Последнее обновление 22 ноября 2021 г.
Лаборатория анализа данных, ориентированных на человека » Лаборатория анализа данных, ориентированных на человека, с использованием биометрической безопасности
Обзор проекта: При разработке систем безопасности технические требования и требования безопасности обычно определяют решения, но в реальном мире безопасность зависит от сложной сети человеческих и технических ресурсов. Недостаточное внимание к человеческим проблемам, начиная от удобства использования и заканчивая организационным контекстом, может сделать даже самую тщательно спроектированную систему безопасности бесполезной или еще хуже.
Мы изучаем технологию биометрической безопасности с точки зрения человека. Биометрия может снизить нагрузку на удобство использования, связанную с механизмами безопасности на основе памяти, такими как пароли. Мы спроектировали и создали прототипы пользовательских интерфейсов для экспериментальных систем биометрической аутентификации и оценили их удобство использования. Благодаря раннему рассмотрению удобства использования и приемлемости этих технологий мы надеемся повысить осведомленность о потребностях и ограничениях людей и организаций в сообществах, изучающих новые биометрические технологии.
Об исследовании: Многие современные технологии безопасности имеют серьезные проблемы с удобством использования. Как часто вы забываете, записываете или повторно используете пароль? Сколько раз вы теряли ключи? Биометрические системы могут решить некоторые из этих проблем, но часто все еще уязвимы для простых атак. Их также иногда считают социально неприемлемыми, например, из соображений конфиденциальности. Срочно необходимы безопасные, простые в использовании и приемлемые системы безопасности.
При поддержке Национального института стандартов и технологий (NIST) мы использовали итеративный, ориентированный на человека процесс проектирования для создания прототипов интерфейсов для нового метода биометрической аутентификации, который идентифицирует людей на основе уникальной физической структуры глаза. Используя устройство отслеживания глаз, можно распознавать закономерности в движении глаза, которые можно использовать для определения ряда анатомических характеристик глазного яблока, мышц и сухожилий, которые в совокупности называются глазодвигательными растениями.
На основе этой экспериментальной технологии мы разработали концептуальный, бумажный, а затем работающий прототип системы аутентификации, предназначенной для использования в банкомате. Мы оценили несколько вариантов нашего дизайна в лабораторных исследованиях юзабилити и опросили участников о том, как они воспринимают эту незнакомую технологию. Наша работа предполагает, что биометрические данные, подобные этой, могут найти широкое признание, но существуют некоторые культурные и социальные барьеры. Также были проблемы с использованием айтрекинга, так как он работает не со всеми потенциальными пользователями. Наша работа демонстрирует, как раннее вовлечение пользователей в оценку новой биометрической технологии, еще до того, как она будет готова для живого пользовательского тестирования, может дать полезную информацию для концентрации и направления исследований и разработок.
Исследователи
Майкл Брукс, аспирант, HCDE, UW
Cecilia Aragon, доцент, HCDE, UW
Oleg Komogortsev, доцент профессора, Университет штата Техас, Home -Page