Голосовая биометрия. Биометрия не вышла голосом. Идентификации по сетчатке глаза

Фонограммы, записанные с использованием цифровых диктофонов «Гном Р» и «Гном 2М» удовлетворяют требованиям, предъявляемым к фонограммам, поступающим для проведения фоноскопических экспертиз, и пригодны для идентификации личности по голосу и речи...

Первый заместитель начальника

Диктофон «Гном 2М» неоднократно применялся для записи конференций и семинаров в сложной акустической обстановке, записанные фонограммы отличаются высоким качеством. Встроенная функция шумоочистки позволяет улучшить качество воспроизведения фонограмм...

Ведущий инженер ИПК БНТУ

Институт повышения квалификации и переподготовки кадров БНТУ

За срок эксплуатации «Гном Р» зарекомендовал себя с положительной стороны. Высокое качество записи при минимальных габаритах, большая продолжительность звукозаписи, оперативная передача накопленной информации из встроенной памяти диктофона в ПЭВМ...

Старший офицер 3-го отдела седьмого управления

Генерального штаба Вооруженных Сил РБ

Фонограммы, записанные с использованием системы «Незабудка II», удовлетворяют требованиям, предъявляемым к многоканальным цифровым комплексам регистрации речевых сообщений по телефонным каналам связи, и пригодны для идентификации личности по голосу и речи...

Начальник центра

Государственный экспертно-криминалистический центр

Неограниченное количество оповещаемых абонентов, большое количество одновременно обрабатываемых заданий сделает «Рупор» незаменимым помощником в работе сотрудников кредитного отдела филиала № 524 ОАО «АСБ Беларусбанка...

Заместитель директора – начальник центра розничного бизнеса

Филиал № 524 ОАО «АСБ Беларусбанк»

Система автоматического оповещения «Рупор» работала по аналоговым телефонным линиям и опробовалась с целью оповещения личного состава. Система обслуживала 100 абонентов, работала стабильно и не требовала постоянного технического обслуживания...

Исполняющий обязанности военного комиссара

Военный комиссариат г. Минска

Система записи «Незабудка II» обеспечивает прием голосовых сообщений жильцов, качественную запись их на компьютер, возможность прослушивания записанных сообщений и занесения информации в текстовую базу данных. Система оповещения «Рупор» производит автоматическое оповещение должников...

Начальник отдела АСУ

УП «ЖРЭО Советского района г. Минска»

Система «Рупор» обеспечивает оповещение большого количества абонентов в сжатые сроки в соответствии с установленными параметрами с предоставлением отчёта по проведённому оповещению, работает надёжно, полностью соответствует предъявленным к ней требованиям...

Директор департамента розничного бизнеса

В мобильную систему записи и документирования речи «Протокол» входит цифровой диктофон «Гном 2М» и компьютерный транскрайбер «Цезарь». Диктофон «Гном 2М» позволяет получать качественную запись совещаний и заседаний, а транскрайбер «Цезарь» значительно увеличивает скорость работы по переводу звуковой информации в текстовый документ...

Ведущий специалист

Институт государства и права Академии наук РБ

Голосовая биометрия как наиболее естественный и выгодный способ идентификации личности

Надежное распознавание и подтверждение личности стали необходимым и привычным атрибутом современной жизни. Поэтому сегодня мы все чаще слышим о применении биометрии в той или иной сфере деятельности, все громче заявляют о себе разнообразные биометрические технологии. Биометрия незаменима там, где необходимо обеспечить безопасность доступа к физическим объектам и информационным ресурсам. Биометрические технологии находят успешное применение в правоохранительной деятельности, гражданской регистрации, в области безопасности банковских обращений, инвестирования, в вопросах охраны здоровья и многих других сферах деятельности.

Что же подразумевается под «биометрией»? Общий термин «биометрия» используется в двух различных значениях: как характеристика и как процесс. Так, биометрия как «характеристика» – это уникальные физиологические или поведенческие характеристики человека, которые используются при автоматическом распознавании личности. Биометрия как «процесс» подразумевает совокупность автоматических методов распознавания личности по физиологическим или поведенческим характеристикам.

Наиболее часто используемыми биометрическими характеристиками являются отпечатки пальцев, форма лица, радужная оболочка глаза, голос, подпись, геометрия руки. Нельзя сказать, что та или иная характеристика является лучше остальных. При выборе подходящего биометрического метода идентификации следует учитывать такие факторы, как область его применения, требуемый уровень безопасности, целевую установку (верификация или идентификация), ожидаемое число пользователей, практичность и другие.

Рассмотрим кратко основные методы идентификации:

  • По отпечатку пальца. Данный метод основан на уникальности узоров на пальцах у каждого человека. Пользователям больше не нужно набирать пароль, доступ обеспечивает одно касание до сканирующего устройства. Этот метод является наиболее распространенным по отношению к остальным методам.
  • По радужной оболочке глаза. При сканировании глаза выделяется рисунок радужной оболочки, который впоследствии используется для идентификации человека.
  • По форме лица. Данный метод основан на распознавании трехмерного образа лица человека, т.е. система идентифицирует человека по расположению на его лице глаз, бровей, носа и расстоянию между ними.
  • По подписи. Идентификация осуществляется по динамическим характеристикам почерка человека.
  • По голосу. Система распознает человека по частотным и статическим характеристикам его голоса. В настоящее время технология распознавания по голосу активно развивается, ей прочат большое будущее и широкое применение.
  • По геометрии руки. Человек идентифицируется по трехмерному образу кисти руки.

Рассмотрим подробнее метод идентификации личности по голосу. В последнее время увеличение числа «краж личности», террористических атак вызвали огромный скачок в развитии голосовой биометрии. Использование усовершенствованных систем идентификации по голосу является наиболее удобным для пользователя способом аутентификации, который обеспечивает распознавание на более высоком уровне и позволяет снизить расходы за счет автоматизации процесса.

Сегодня для того, чтобы обеспечить надежную защиту доступа к информации, необходимо использовать такие методы идентификации личности, которые позволили бы определить «Действительно ли он/ она является тем, за кого себя выдает?», опираясь на три фактора:

  • то, что человек ЗНАЕТ (пароль, PIN-код);
  • то, что человек ИМЕЕТ (удостоверение личности, ключ);
  • каким человек ЯВЛЯЕТСЯ (физиологические характеристики).

Голос является единственной биометрической характеристикой человека, которая отвечает трем вышеперечисленным условиям. Из всех существующих вариантов, идентификация личности по голосу является наименее навязчивой, наиболее доступной для человека, а также может осуществляться отдаленно, например, по телефону. Более того, голосовая биометрия – это единственная технология, которая, помимо микрофона, не требует дополнительного специального оборудования. Из всех биометрических характеристик только голос можно передать посредством любой сети связи: по стационарному или мобильному телефону, по проводной и беспроводной виртуальной частной сети, по IP-сетям, радиосети.

Благодаря высокому уровню точности распознавания совместно с простотой использования, метод идентификации по голосу становится выбором номер один при разработке как одномодальных, так и многомодальных приложений.

Голосовую биометрию, включающую в себя технологии идентификации и верификации личности, не следует путать с технологиями распознавания речи. Применяя технологии распознавания речи можно распознать, что человек говорит, но не кем он является. Следовательно, использование технологий распознавания речи ограничены в сфере обеспечения безопасности. Напротив, технологии идентификации и верификации личности по голосу находят свое применение тогда, когда необходимо подтвердить, является ли человек тем, кем он представляется.

  1. входных данных;
  2. математических алгоритмов;
  3. вычислительной мощности.

Под входными данными подразумевается биометрический образец, или голосовой отпечаток, хранящийся в базе данных. Качество биометрического образца во многом зависит от типа устройства ввода (например, профессиональный микрофон или мобильный телефон) и окружающей среды (шумная улица или тихое помещение). Существуют технологии, которые автоматически определяют качество голосового отпечатка, затем очищают его от шума, чтобы получить более качественный образец.

Алгоритмы в биометрических системах используются для того, чтобы сравнить полученный голосовой отпечаток с образцом в базе данных. Чем совершеннее алгоритм, тем точнее результат сравнения.

Под вычислительной мощностью понимают скорость и качество обработки биометрических признаков пользователя.

На рисунке 1 представлен пример применения системы распознавания личности по голосу в одном из call-центров.


Рисунок 1 – Применение системы распознавания личности

Учитывая простоту использования, возможность идентифицировать пользователя отдаленно и высокую точность распознавания, голосовая биометрия чаще всего находит свое применение в компаниях, осуществляющих свою деятельность через сети связи и заинтересованных в защите идентификационной информации своих клиентов. Так, голосовая биометрия эффективно используется в сферах, где необходимо удостоверение личности человека, например:

  • голосовой контроль доступа;
  • контроль доступа в call-центрах;
  • регистрация в Интернет;
  • изменение пароля;
  • домашний арест;
  • безопасная конференц-связь;
  • криминалистические экспертизы и опознание по голосу;
  • скрытая авторизация в call-центрах;
  • борьба с терроризмом;
  • борьба с наркоманией;
  • банковское обслуживание;
  • телекоммуникация;
  • функция «черный список».

На сегодняшний день разработаны системы, которые совмещают несколько биометрических технологий, например, технологию верификации личности по голосу и отпечаткам пальцев. Сочетание двух биометрических технологий позволяет преимуществам одной технологии компенсировать недостатки другой, и наоборот, а также позволяет оператору контролировать уровень безопасности.

В прошлом голосовая биометрия уступала место таким биометрическим методам, как идентификация и верификация по отпечаткам пальцев, форме лица и радужной оболочке глаза. Однако новые алгоритмы и высокая производительность компьютера по обработке данных позволили существенно повысить точность распознавания личности по голосу, что делает голосовую биометрию сильным конкурентом для менее удобных традиционных методов идентификации и верификации.
К тому же, необходимость в более высоком уровне защиты информации в коммерческой деятельности делают голосовую биометрию отличным недорогим решением для многих компаний.

Из доступных сегодня видов биометрических технологий голосовая биометрия является наиболее выгодной и удобной для пользователя, поэтому в скором времени решения с использованием голосовой биометрии станут применяться повсеместно. PIN-коды могут быть забыты, магнитные карты – утеряны или украдены, а специальные сканирующие устройства требуют вложения немалых денег. Напротив, голосовая биометрия делает идентификацию возможной в любом месте в любое время. Все что Вам нужно – это воспользоваться мобильным или стационарным телефоном, или микрофоном.

Компания «Речевые Технологии» является одним из лидеров в создании систем голосовой биометрии. Собственная технология верификации личности по голосу позволяет компаниям организовать регламентированный доступ пользователей к материальным и информационным ресурсам, телефонным и Web-сервисам, а также значительно повысить качество обслуживания клиентов. Эффективно технология применяется в системах информационной безопасности предприятий, системах электронного банкинга, электронной коммерции, электронных подписных изданий и др.

Решение позволит Вам установить доступ к мобильному устройству с помощью голосового пароля. Преимуществами использования от ООО «Речевые технологии» являются обеспечение надежной защиты мобильного устройства в случае его утери или кражи, применении надежного алгоритма верификации пользователя, устойчивости к внешнему шуму и многие другие.

Технологии компании позволяют организовать бимодальные биометрические системы, что значительно позволяет расширить границы применимости.

Все материалы, размещенные на даннном сайте, разрешены к публикации и печати на других ресурсах и печатных издания только при наличии письменного разрешения компании ООО "Речевые Технологии"

Редакция Единого портала Электронной подписи предлагает вниманию читателей авторский материал доктора технических наук, профессора Савченко Владимира Васильевича о проблеме речевой вариативности устной речи применительно к введению в эксплуатацию Единой биометрической системы.

Scopus Author ID: 56927771300

ORCID: 0000-0003-3045-3337

Скоро исполнится год со дня выхода в свет приказа Минкомсвязи России от 25 июня 2018 г. № 321 "Об утверждении порядка обработки, включая сбор и хранение, параметров биометрических персональных данных в целях идентификации, порядка размещения и обновления биометрических персональных данных в Единой биометрической системе, а также требований к информационным технологиям и техническим средствам, предназначенным для обработки биометрических персональных данных в целях проведения идентификации" (зарегистрирован в Минюсте России 04.07.2018 под номером № 51532), и это явный повод оценить текущую ситуацию с точки зрения его выполнения.

Единая биометрическая система (далее - ЕБС) создается в стране в целях, если говорить об экономике, создания технических условий и возможностей для автоматической верификации и обслуживания российскими банками своих клиентов в режиме удаленного доступа (через смартфоны).

Согласно данным "Ростелекома", как официального оператора ЕБС в России, более 140 банков на сегодняшний день собирают биометрию в своих 5 тысячах с лишним отделениях по всей стране. К концу года в этот процесс должны включиться все сколько-нибудь крупные российские кредитные учреждения, обладающие универсальной лицензией Центробанка РФ. Однако уже на первом этапе создания и использования ЕБС в работе банков стали возникать проблемы . Так, нередко клиенты испытывают сложности с регистрацией биометрии в банках. Известны случаи, когда записывать голоса клиентов приходилось по несколько раз подряд, а длительность процедуры возрастала с 2-3-х нормативных минут до 30—40 минут и более. Об этом, в частности, подробно сказано в газете "Коммерсант" от 31 мая 2019 в статье "Биометрия лицом не вышла ". Одновременно в этой статье освещается инициатива Минкомсвязи по введению в практику работы банков регулярных дополнительных проверок качества биометрических данных с целью отбраковки непригодных для использования образцов.

Логика такой инициативы представляется очевидной, если вслед за специалистами "Ростелекома" главной причиной вышеупомянутых проблем с наполнением ЕБС считать низкое качество биометрических данных, поступающих в систему из банков. Но это не единственная проблема, и даже не главная, если говорить не только о наполнении, но и о дальнейшем использовании ЕБС в работе банков с клиентами. С указанной точки зрения на первый план выходит известная из лингвистики проблема внутридикторской вариативности устной речи . Отметим, она никак не связана с применяемыми банками информационными технологиями и техническими средствами.

Согласно п. 13 (предпоследний абзац) приложения 1 к приказу Минкомсвязи № 321 сбор биометрических образцов записи голоса каждого отдельного субъекта биометрии должен производиться исключительно при условии его нормального, т.е. невозбужденного "эмоционально-психологического состояния, без явных признаков заболеваний, препятствующих произнесению сообщений или способных нарушить тембр и звучание голоса". Легко сказать: "при условии нормального состояния субъекта". А где гарантия, что оно нормальное на подсознательном уровне? Даже в банке на этот вопрос не добиться ответа. Тогда что можно сказать определенного о состоянии клиента при обращении в банк через смартфон? И как тогда его контролировать?

Проблема вариативности устной речи проявляется в непредсказуемом и зачастую весьма значительном изменении тонкой структуры речевого сигнала в динамике: в зависимости от даты и времени обращения клиента в банк, а также от его текущего эмоционально-психологического состояния. При этом отнюдь не гарантируется соответствие его сиюминутного речевого сигнала хранящемуся в ЕБС биометрическому образцу. А это каждый раз будет означать ошибочный отказ банка в обслуживании своего клиента. Вероятность таких отказов на практике может приближаться к единице , что многократно затянет процедуру удаленного доступа и даже может перечеркнуть на как ошибочную саму идею ЕБС. Группа разработчиков программного обеспечения под научным руководством профессора В.В. Савченко (URL), с такой перспективой не согласна. Напротив, входящие в нее эксперты полагают, что данный проект - реальный шаг в цифровую экономику. Только сделать его надо максимально ответственно и квалифицированно.

Автономные, малозатратные и одновременно высокоэффективные технические решения для преодоления проблемы внутридикторской вариативности устной речи в науке давно известны и широко реализованы в разнообразных отечественных и зарубежных IT-разработках. К ним, в частности, относятся системы голосового самоанализа (от англ. "voice self-analysis", пример доступен по ссылке). Установив любую из подобных систем на смартфон в качестве бесплатного приложения, каждый клиент получит возможность не только проконтролировать акустические качества своего речевого сигнала в момент его обращения в банк, но и отрегулировать эти качества на должном уровне путем голосового тренинга в режиме on-line.

Нижний Новгород, июнь 2019 года

Работающие с биометрией специалисты в случае заинтересованности в представленном решении и других разработках, связанных с внутридикторской вариативностью речи, могут направить свои контактные данные с сопроводительным письмом на редакционную почту Единого портала Электронной подписи [email protected] . Информация будет передана автору статьи.

Понятие «аутентификация» характеризует проверку на подлинность, например: является ли Вася Пупкин действительно Васей или же это, возможно, Петя какой-нибудь? Является ли он тем, за кого себя выдает? Процесс аутентификации может быть выполнен одним из трех возможных способов:

  • основан на том, что Вам известно, например, кодовая комбинация (пароль);
  • основан на том, что у Вас есть: ключ, магнитная карта, брелок;
  • то, что есть Вы: папиллярные узоры, геометрия лица, строение глаза.

Именно третий пункт заключает в себе биометрическую аутентификацию, которая с развитием технологий становится все более актуальной. Как она работает, какие существуют достоинства, недостатки и насколько это безопасно, давайте рассмотрим подробнее...


Краткая история биометрии

Упуская множество фактов, исторических событий и деталей, применение биометрических параметров человека началось еще задолго до появления технических средств. Еще 100 г. до н. э. некий китайский император ставил свой отпечаток пальца, как печать на особо-важных доисторических артефактах. В 1800-х годах, Альфонс Бертильон, разработал систему распознавания преступников по их анатомическим характеристикам.

С течением времени, полиция Великобритании, Франции, США, начали отслеживать злоумышленников и подозреваемых в преступлениях по их отпечаткам пальцев. В дальнейшем, технология нашла свое применение в ФБР. Отпечатки пальцев стали первой полноценной системой распознавания человека.

В нынешнее время, биометрия стала более обширной и являются средством дополнительной защиты для технических средств или же элементом безопасности, который применяется в , для пропуска на охраняемую территорию, помещения и т.д.


Разновидности биометрической аутентификации

В настоящее время широко используются: пальцы человека, лицо и его глаза, а также голос - это «три кита» на которых держится современная биометрическая проверка подлинности пользователей:

Существует их довольно много, однако, сегодня используются три основных типа сканеров отпечатков пальцев:

  • емкостные - измеряют электрические сигналы, поступающие от наших пальцев. Анализируют емкостную разницу между приподнятой частью отпечатка и его впадиной, после чего формируется «карта» отпечатка и сравнивается с исходной;
  • ультразвуковые - сканируют поверхность пальца путем звуковых волн, которые посылаются на палец, отражаются и обрабатываются;
  • оптические - фотографируют отпечаток пальца и выполняют сравнивание на соответствие.

Трудности при сканировании могут возникнуть, если мокрые или грязные руки, если травма (порезы, ожоги), если человек является инвалидом (отсутствуют руки, кисти, пальцы).

  1. Аутентификация по радужной оболочки глаза

Другая и довольно распространенная биометрическая форма аутентификации - сканеры радужной оболочки. Узоры в наших глазах является уникальным и не меняется в течении жизни человека, что позволяет выполнить проверку подлинности того или иного человека. Процесс проверки является довольно сложным, так как анализируется большое количество точек, по сравнению со сканерами отпечатков пальцев, что свидетельствует о надежности системы.

Однако, в этом случае, могут возникнуть трудности у людей с очками или контактными линзами - их нужно будет снимать для корректной работы сканера.

  1. Аутентификация по сетчатке глаза

Альтернативный способ использовать человеческий глаз для биометрической аутентификации - сканирование сетчатки. Сканер светит в глазное яблоко и отображает структуру кровеносных сосудов, которые так же, как и оболочка - являются уникальными у каждого из нас.

Биометрическая проверка подлинности по голосу внедряется в потребительские технологии и также имеет большие перспективы. Распознавание голоса сейчас реализовано у Google Assistant на устройствах Android или у Siri на устройствах iOS, или у Alexa на Amazon Echo. В основном сейчас, это реализовано так:

Т.е. никакой проверки на подлинность пользователя не осуществляется, однако, с развитием технологий - кушать пойдет только подлинный пользователь устройства. Тем не менее, технология аутентификации по голосу существует и в процессе проверки подлинности анализируется интонация, тембр, модуляция и другие биометрические параметры человека.

Трудности здесь могут возникать из-за фоновых шумов, настроения человека, возраста, здоровья, что, как следствие, снижает качество метода, из-за этого он не имеет столь широкого распространения.

  1. Аутентификация по геометрии лица человека

Последней в данной статье и одна из распространенных форм биометрической аутентификации - распознавание лица. Технология довольно простая: фотографируется лицо человека и сравнивается с исходным изображением лица пользователя, имеющего доступ к устройству или на охраняемую территорию. Подобную технологию, именуемой, как «FaceID» мы можем наблюдать реализованной в iPhone от Apple.

Мы немного похожи на маму, папу или более раннего поколения родственников, а кто-то и на соседа... Как бы там ни было - каждый из нас имеет уникальные черты лица, за исключением близнецов (хотя и у них могут быть родинки в разных местах).

Несмотря на то, что технология простая по своей сути, она довольно сложная в процессе обработки изображения, поскольку осуществляется построение трехмерной модели головы, выделяются контуры, рассчитывается расстояние между элементами лица: глазами, губами, бровями и др.

Метод активно развивается, поскольку его можно использовать не только для биометрической аутентификации пользователей или сотрудников, но и для поимки преступников и злоумышленников. Ряд из камер, в общественных местах (вокзалах, аэропортах, площадях, людных улицах и т.д.) устанавливают в сочетании с данной технологией, где сканер имеет довольно высокую скорость работы и точность распознавания.


Как злоумышленник может обмануть биометрическую аутентификацию?

Нужно понимать, что при сканировании определенных параметров возможно возникновение ошибок в алгоритме распознавания. И в то же время, имея определенные знания, навыки и ресурсы, злоумышленник, может уклониться от тех или иных методов проверки подлинности.

В случае со сканером отпечатков пальцев, некоторые из них можно обмануть путем:

  • изготовления трехмерной модели пальца из специального материала (выбирается исходя из принципа работы сканера);
  • использования пальцев спящего человека, без сознания или мертвого;

Сканеры радужной оболочки и сетчатки глаза можно, с легкостью, обмануть качественной фотографией человека распечатанной на цветной бумаге. Однако, большинство современных сканеров умеет распознавать 2D модель и отличать ее от 3D, в таком случае, на снимок необходимо положить контактную линзу, что сымитирует блик (отражение света). Посмотрите наглядный видеоролик демонстрирующий процесс обхода сканера глаза на устройстве Samsung Galaxy S8:

Голосовые сканеры также имеют свои слабые места, которые возникают вследствие существования искусственного интеллекта и нейронных сетей способных имитировать голоса людей - такие системы имеют возможность скопировать любой человеческий голос и воспроизвести его за считанные секунды.

Сканеры лица человека не уступают по степени уязвимости, поскольку некоторые из таких систем, злоумышленник может обмануть использованием фотографии человека, как, например, в случае с Samsung Galaxy Note 8:

Получить доступ через сканер лица, не составит трудностей и у близнецов, на примере Face ID в iPhone - это выглядит вот так:


Основное достоинство и недостаток биометрической аутентификации

Явное преимущество системы - удобство, по причине того, что у Вас отсутствует необходимость запоминать кодовую комбинацию (пароль) или последовательность графического ключа, думать о том,

Явный недостаток - безопасность, в силу того, что существует масса уязвимостей и система распознавания не является надежной на все 100%. В то же время биометрические параметры (отпечаток пальца или рисунок радужной оболочки) нельзя изменить, в отличие от пароля или ПИН-кода. Это существенный недостаток, поскольку, если единожды данные попадут к злоумышленнику мы подвергаем себя серьезным рискам.

Учитывая, насколько сейчас распространена биометрическая технология распознавания в современных смартфонах, есть несколько рекомендаций, позволяющих в некоторой степени повысить уровень защиты:

  • большинство отпечатков, которые мы оставляем на поверхности - это большого пальца и указательного, поэтому для Вашей аутентификации на смартфоне лучше всего использовать другие пальцы;
  • несмотря на наличие биометрической проверки, применения или ПИН-кода - обязательное условие для полноценной безопасности.

Всем привет.
Недавно я написал вот такую про распознавание слитной речи, а сейчас хотел бы написать про голосовую биометрию, т.е. подтверждение личности человека по голосу и узнавание человека по голосу.

Опять же, т.к. моя работа связана с контактными центрами (КЦ), то говорить я буду о них. Это еще связано с тем, что сейчас именно они активно интересуются голосовой биометрией, что не удивительно, т.к. телефонный канал – это идеальное ее применение.
- вы не видите абонента на другом конце провода;
- вы не можете использовать другие модальности для подтверждения личности: по лицу, по сетчатке глаза, по отпечатку пальца.
- не нужны дополнительные сканирующие устройства, типа тех, куда надо приложить свой палец или кому показать свой глаз.
- это самый дешевый способ биометрии, хоть и слегка уступает по надежности другим способам. Но так как другие модальности технически не применимы по телефону в массовом использовании, то выбора по факту нет.
Вы, конечно, можете возразить про вариант подтверждения личности абонента «основанном на знаниях» - это пароли, секретные слова, TPIN коды (банки), паспортные данные и т.д. – но все это не надежно с точки зрения безопасности и требует запоминания информации у абонента или всегда держать информацию под рукой, что не очень удобно для абонента и не эффективно (затратно) для КЦ.

Для начала определимся с понятиями, что входит в понятие голосовой биометрии:
- Это идентификация , т.е. установление личности человека по голосу. Это когда вам звонит старый приятель по телефону с неизвестного номера и говорит: «Угадай кто это?» и вы пытаетесь в голове среди всех известных (знакомых) голосов найти наилучшее совпадение. Когда сканирование памяти закончилось и вы нашли более менее подходящее совпадение, то вы можете уже сказать: «Ага, это мой одноклассник Серега с которым я не говорил 10 лет». Но гарантии в том, что это именно он, у вас нет, и тут приходит время верификации.
- Верификация – это подтверждение личности по голосу, т.е. однозначное удостоверение личности. Для этого мы можем попросить доказать, что Серега именно тот, за кого себя выдает. Мы можем спросить у него: «Скажи, где мы были в 6 утра на выпускном» - эта информация позволит нам подтвердить личность Сереги, т.к. только он может являться носителем этой информации (аналогично паролю о котором я писал выше).

Если хотите более умное определение, то:
Идентификация - Проверяет совпадение одного образца голоса со многими из базы голосов. В качестве результата идентификации система показывает список личностей с похожими голосами в процентном отношении. 100% совпадение означает, что образец голоса полностью совпадает с голосом из базы данных и личность установлена достоверно.
Верификация - Производит сличение двух образцов голоса: голос человека, чью личность необходимо подтвердить, с голосом, который храниться в базе данных системы и чья личность уже достоверно установлена. В качестве результата верификации система показывает степень совпадения одного голоса с другим в процентном отношении.
Есть еще такое понятие как аутентификация . Однозначно сказать, чем она отличается от верификации сказать трудно. У некоторых наших сотрудников есть мнение, что это некий процесс подтверждения биологической (!) личности, когда трудно отделить процесс идентификации от верификации, т.е. это обобщенный процесс.

Какая бывает верификация?

- Текстонезависимая
Когда подтверждение личности происходит по спонтанной речи абонента, т.е. нам не важно, что говорит человек. Это самый долгий метод подтверждения – чистой речи абонента должно накопиться минимум 6-8 сек. Обычно этот способ применяется непосредственно во время общения абонента с оператором КЦ, когда последнему нужно однозначно удостовериться, что абонент именно тот, за кого себя выдает. Самое интересное, что данный способ верификации можно применять скрытно от самого абонента. На рабочем месте оператора КЦ виден вот такой рабочий инструмент.

Рис 1. Часть интерфейса рабочего места оператора КЦ для проведения верификации клиента.

- Текстозависимая по статической парольной фразе
Когда подтверждение личности происходит по парольной фразе, которую на момент регистрации придумал абонент. Длительность парольной фразы должна быть не менее 3 сек. Обычно мы предлагаем говорить свое ФИО и название компании. Парольная фраза всегда одинаковая.
- Текстозависимая по динамической парольной фразе
Когда подтверждение личности происходит по парольной фразе, которую предлагает сама система в момент звонка для верификации, т.е. каждый раз парольная фраза разная! Обычно мы предлагаем динамическую парольную фразу из последовательности цифр. Абонент повторяет за системой числа до тех пор, пока она не примет однозначного решения «свой/чужой». Это может быть и одно число типа «32» или целый набор «32 58 64 25». Интересно то, то произнесение разных цифр дает разный объем информации для сличения: самая «полезная» цифра «восемь» – она больше всего содержит полезной речевой информации, самая бесполезная «два».

Шаг 1.
Что бы мы могли провести верификацию по голосу, нам нужно в своей базе уже иметь образец голоса (слепок голоса), хозяин которого достоверно известен. Поэтому первый шаг – это накопление базы слепками голосов, для этого мы просим абонентов (клиентов) пройти процесс регистрации в системе.
Регистрация в системе абонента означает, что он добровольно оставляет свой слепок голоса, который потом мы будем использовать для верификации. Обычно мы просим оставить подряд 3 слепка голоса, что бы была вариативность – три раза произнести свой пароль. Затем, когда верификация будет успешно пройдена, мы заменим наиболее старый слепок голоса новым, таким образом, происходит постоянное обновление слепков, если абонент часто пользуется системой. Так мы решаем проблему старения голоса.
Если мы применяем верификацию по динамической парольной фразе, то мы просим произнести абонента цифры от 0 до 9 три раза. В результате у нас будет 30 образцов голоса.

Желательно, что бы клиент оставлял свой слепок голоса (регистрировался) по тому каналу связи, по которому потом будет верифицироваться, иначе вероятность ошибок возрастает. Бывают случаи, когда проходят регистрацию с гарнитуры в скайпе, а потом верифицируются по домашнему телефону – здесь фактор канала связи будет играть большую роль в надежности сервиса. При построении сервиса можно учитывать, что каналы связи могут быть разные - это отрабатывается и тестируется отдельно под конкретный случай и нивелировать влияния канала связи можно практически полностью. Но не подумав об этом сразу и с наскока внедрить - будут сложности.

Важно, что бы клиент самостоятельно и осознано прошел регистрацию (знал зачем это нужно и как это ему потом поможет), т.к. пройти потом верификацию может только лояльный абонент, которому нужен результат и который принимает «правила игры».
Если клиента вынуждать проходить верификацию к месту и не к месту, то он может подсознательно изменять голос, дурачиться (быть не дружелюбным к сервису) - это будет приводить к ошибкам и лояльность клиента будет падать, хотя он сам в этом косвенно будет виноват.

Как проходит регистрация абонента в системе? (статическая парольная фраза)

Рис 2. Схема регистрации человека в биометрической системе.

1.Абонент звонит в биометрическую систему, которая предлагает ему придумать и произнести парольную фразу. Произнести 3 раза.
2.Голос обрабатывается сервером биометрии и на выход мы получаем 3 модели голоса. По одной на каждый произнесенный пароль.
3.На сервере мы заводим карточку клиента (Юрий Гагарин) к которой прицепляем полученные 3 модели голоса.

Что такое модель голоса?
- это уникальные характеристики голоса человека отраженные в матрице цифр, т.е. это файл размером 18Кбайт (для статической п.ф.). Это как отпечаток пальца. Именно эти модели голоса мы потом и сравниваем. В общей сложности модель голоса фиксирует 74 (!) разных параметра голоса.

Как получают модели голоса?
Мы используем 4 независимых метода:
- анализ статистики основного тона;
- метод смеси гауссовых распределений и SVM;
- спектрально-формантный;
- метод полной изменчивости.
Описывать их подробно я здесь не возьмусь – это сложно даже для меня и в курс «для чайников» точно не входит. Этому всему мы учим на нашей кафедре РИС в ИТМО (Санкт-Петербург).

Шаг 2.
Это непосредственно сама верификация. То есть у нас есть абонент на том конце провода, который утверждает, что он Юрий Гагарин. А у нас в базе, соответственно, есть карточка клиента Юрия Гагарина, где хранятся слепки его голоса, поэтому, все, что нам нужно сделать – это сравнить голос человека, который утверждает, что он Юрий Гагарин с голосом настоящего Юрия Гагарина.

Как проходит верификация абонента в системе? (статическая парольная фраза)

Рис 3. Схема верификации человека в биометрической системе.

1.Сначала мы поступаем как при регистрации, т.е. у нас есть произнесенный клиентом пароль, который мы отправляем в сервер биометрии и строим модель голоса «якобы» Юрия Гагарина.
2.Затем мы берем 3 модели голоса настоящего Юрия Гагарина, делаем хитрым способом усредненную модель и тоже отправляем ее в сервер биометрии.
3.Просто сравниваем 2 разные модели. На выходе мы получаем процент соответствия одной модели к другой.
4.Дальше нам нужно что-то делать с этим числом (на рисунке 92%). Много это или мало, можем мы однозначно сказать, что это Юрий Гагарин или это обманщик?

Рис 4. Порог доверия «свой/чужой».

В системе у нас есть такой параметр как «порог доверия» - это некий процент соответствия. Допустим, мы его сами задали в 60%. Таким образом, если процент соответствия модели голоса «якобы» Юрия Гагарина не доходит до «порога доверия», то нам позвонил обманщик. Если больше «порога доверия», то нам позвонил настоящий Юрий Гагарин. «Порог доверия» мы можем задавать сами, обычно это от 50 до 70% в зависимости от задачи верификации.

Здесь мне нужно было бы вам рассказать про ошибки первого (FR) и второго рода (FA), а также обобщенной ошибки (EER), но я это делать не буду – это сильно усложнит и увеличит текст. Если интересно, то я попробую уговорить, кого ни будь из научного отдела это популярно описать и размещу здесь отдельно.

Скажу просто, что в зависимости от задачи верификации, нам бывает полезней с большей долей вероятности пропустить «своего», чем не пропустить «чужого». И наоборот, иногда бывает важнее не пропустить «чужого», чем пропустить «своего».
Уверен, что с первого раза эти 2 предложения из вас никто не понял, и вам пришлось еще раз вдумчиво их прочитать, что бы осознать смысл.

Интеграция сервера биометрии в контактный центр.

Рис 5. Блок-схема продукта VoiceKey.

Честно говоря, здесь все очень просто: на вход мы подаем голос в формате wave или PCM по http, на выходе получаем результат сравнения. Больше подробнее на этом останавливаться не хочу.

Процесс верификации занимает в среднем 0.8 сек. Есть возможность работать одновременно со многими потоками.

У нас на сайте все подробно описано, а главное есть проработанные сценарии использования для контактных центров. За последние годы я достаточно много общался с различными крупными КЦ в России, в первую очередь это финансовый сектор и понимание целей и задач у меня сформировалось.

Теперь затронем такой вопрос: насколько вообще технология голосовой биометрии пригодна к массовому использованию? Надежна ли она?

Если кратко, то ДА, она реально круто работает. У нас в компании есть телефонные демонстрационные стенды. Если интересно, то каждый из вас может позвонить и лично попробовать, как и что работает. Телефонный номер и инструкцию по тестированию даю по запросу с этой страницы. Просто для статистики интереса к этой теме и оценки нагрузки на сервер.

Для справки: разработки Российских ученых в области голосовой биометрии занимают если не первое место в мире, то точно делят его с другими. Это подтверждено независимыми исследованиями, например NIST (Национальный Институт Стандартов и Технологий, США), где наша компания попала в тройку лучших по всем пяти тестам среди коммерческих компаний. Или то, что наш продукт «VoiceKey» победил в номинации «Лучший продукт года для КЦ» в 2013 году в международном конкурсе «Хрустальная гарнитура ».
Также можно отметить, что нашей компании принадлежит реализация самого крупного в мире на сегодняшний день проекта по голосовой биометрии в телефонном канале.

Вкратце, вот такой ликбез. Готов отвечать на вопросы в комментах.