• Герман Зубов

О методике "Диалект"

Обновлено: авг. 21

В этом году исполняется 21 год с момента публикации методики идентификации русскоязычных дикторов «Диалект»*, которая и сейчас является основным инструментом профильных лабораторий государственных судебно-экспертных учреждений России (за исключением Минюста).

методика идентификации "Диалект"

Те, кто начинал работать с «Диалектом» в середине 90-х, уже по большей части на пенсии. Вероятно, должно смениться несколько поколений экспертов, чтобы стало понятно, что наука и технологии голосовой биометрии не стоят на месте, и современные, даже полностью автоматические и языконезависимые, системы идентификации работают с меньшим уровнем ошибок (судя по экспертным заключениям, с которыми к нам обращаются для получения помощи в их оценке).


По результатам ведомственных испытаний системы «Диалект»**, проведенным 17 лет назад: «Средний уровень ошибок идентификации говорящих по акустическим признакам, характеризующим отдельные звуки, составил 0.11», или 11%; «Средний уровень ошибок идентификации говорящих по акустическим признакам, характеризующим речевой поток, составил 0.17», или 17%, а «Средний уровень ошибок идентификации говорящих по акустическим признакам, характеризующим отдельные фразы и слова с одинаковым контекстом, составил 0.13 и 0.38 соответственно», или 13 и 38%. Самое поразительное, что самым эффективным методом анализа оказался наиболее субъективный, лингвистический, со средним уровнем ошибки 0.08 или 8% (при условии его выполнения в полном объеме).

Следует отметить, что никто в мире ни до, ни после не достигал подобных результатов в открытых испытаниях. Так, на испытаниях, проведенных в том же 2000 г. во Франции и в 2010 г. в США, ошибка измерялась десятками (!) процентов***.


Столь высокая декларируемая надежность результатов лингвистического анализа сыграла с пользователями методики «Диалект» злую шутку. В большинстве заключений, представленных нам сторонами процесса, эксперты вообще игнорируют проведение микроанализа при том, что данный вид анализа формально, в соответствии с результатами ведомственных испытаний, является вторым по значимости. В этом году примерно из десятка виденных нами заключений только в одном были изложены результаты микроанализа, который, с точки зрения наших экспертов, является наиболее объективным.

Как-то в разговоре один из преданных пользователей «Диалекта» и известный разработчик экспертного ПО следующим образом охарактеризовал работу эксперта с системой «Диалект»: на этапе лингвистического анализа эксперт приходит к заключению о принадлежности звучащей речи определенному лицу, затем идет подгонка результатов интегрального и микроанализа (если такой делается) под уже принятое решение ... После чего спросил: «А разве вы делаете иначе?». Хотелось, чтобы "иначе" удивляло нас чаще.

* Идентификация лиц по фонограммам русской речи на автоматизированной системе «Диалект»: пособие для экспертов / Авторы: Попов Н.Ф., Линьков А.Н., и др.; под ред. А.В. Фесенко. М.: Войсковая часть 34435, 1996 – 102 с. ** Результаты экспериментальных испытаний автоматизированной системы идентификации говорящего по фонограммам устной речи «Фонекси», работающей на принципах методики идентификации лиц по устной речи «Диалект», проведенных экспертами в/ч 34435 : [Электронный ресурс] / официальный интернет-сайт ООО «Целевые технологии» - URL http://aimtech.ru/approbations/download. *** В.Н. Сорокин, В.В. Вьюгин и А.А. Тананыкин. Распознавание личности по голосу: Аналитический обзор [Электронный ресурс] / Информационные процессы, Том 12, №1. URL - C. 1-30 Craig S. Greenberg, Alvin F. Martin, Mark A. Przybocki. Human Assisted Speaker Recognition [Электронный ресурс] / NATIONAL INSTITUTE OF STANDARDS AND TECHNOLOGY, INFORMATION TECHNOLOGYLABORATORY, INFORMATION ACCESS DIVISION URL https://www.nist.gov/.../8-Greenberg_Craig-Human-Assisted...

Просмотров: 1Комментариев: 0

Недавние посты

Смотреть все