Опознание по голосу.
Риски применения.

Г.Н. Зубов, П.И. Зубова.

В связи с развитием партнерских связей с казахстанскими коллегами мы нашли время для изучения процессуального законодательства Республики Казахстан и вот что обнаружили. В ст. 230 действующего с 2014 г. УПК Республики Казахстан указано, что: «При невозможности предъявления лица опознание может быть произведено … по звукозаписи».

По причине того, что в законе не приводится никаких разъяснений о порядке и условиях проведения подобного опознания, последствия его применения могут вызвать тревогу у любого специалиста в области судебной фоноскопии. 

Слуховой, или аудитивный, анализ голоса и речи является субъективным методом, основанным на индивидуальном восприятии слушателем особенностей голоса и речи идентифицируемого лица. В процессе опознания по голосу и речи у опознающего нет возможности опереться на какие-либо объективизирующие, инструментальные, методы исследования. 
При опознании на слух, как показывают многочисленные эксперименты, проводимые специалистами на протяжении последних 150 лет, опознающий опирается на четыре основные группы признаков: основной тон голоса, его тембр, темп речи и артикуляционные особенности. При этом необходимо особенно подчеркнуть, что результаты с минимальным количеством ошибок достигались при специальном отборе и подготовке слушателей к максимально объективному восприятию различных проявлений индивидуальности в речевом сигнале. 
Исходя из вышесказанного можно выделить ряд факторов, которые могут повлиять на надежность опознания человека по голосу и звучащей речи:

  • Степень подготовки опознающего к объективному восприятию индивидуальных особенностей голоса и речи.

  • Длительность речевого сообщения (достоверные результаты при идентификации по голосу и речи, проводимой опытным экспертом, могут быть получены при длительности речевого сигнала не менее 10 сек, в редких и исключительных случаях – до нескольких секунд).

  • Форма и содержание речевого сообщения (чем более лексически, грамматически, синтаксически и интонационно представительно речевое сообщение, тем выше вероятность верного опознания).

  • Возможность изменения голоса (например, во время совершения преступления или опознаваемым во время опознания, то же верно и для случаев идентификации – например, эксперт, принимая решение о пригодности фонограммы речи неизвестного лица и фонограммы образцов голоса и речи для идентификации, в обязательном порядке исследует представленные фонограммы на предмет имитации голоса и преднамеренного изменения голоса).

  • Ситуационные факторы, связанные с разницей звучания голосов во времени (например, заболевания сравниваемых дикторов: простудные заболевания, связанные с изменением формы и структуры органов, участвующих в голосо- и речеобразовании; зубное протезирование и т.п.).

  • Эмоциональное состояние говорящих (разница в эмоциональном состоянии говорящих сказывается, прежде всего, на основном тоне голоса, который и является одним из наиболее значимых опорных признаков при опознании, при этом чем короче речевое сообщение, тем разница в эмоциональном состоянии говорящих становится существенней).

  • Различие условий прослушивания, а также наличие факторов, препятствующих выделению и оценке индивидуализирующих признаков голоса и речи: наличие маскирующих речь шумов; реверберационные искажения, возникающие в «гулком» помещении.

 

По данным Института криминалистики ФСБ, даже в лабораторных условиях подготовленный эксперт ошибается в 8 случаях из ста при принятии решения о принадлежности голоса и речи конкретному лицу на основе результатов аудитивно-лингвистического анализа (в соответствии с методикой «Диалект»). Наш опыт (и не только) показывает, что указанная вероятность ошибки занижена. Так, в аналитическом обзоре «Распознавание личности по голосу»* указано: «решение об идентичности голосов, основанное только на сравнении перехваченных записей речевого сигнала и голоса подозреваемого, без сравнения с голосами множества других дикторов, содержит высокий риск ошибки. «Специальный тест с парным сравнением речевых сигналов длительностью 5 с показал 53% правильного распознавания фонетистами, которым было разрешено пользоваться любыми техническими средствами, и 46% - не фонетистами. В других тестах диапазон составлял 38 -76%». Несмотря на то, что авторы приводят данные о надежности распознавания дикторов 16-летней давности (2000 г.), они кардинально не отличаются от результатов тестирования экспертных методов идентификации, проведенных NIST** в 2010 г***.  

Необходимо также отметить, что на возможность опознания и надежность его результатов оказывает влияние и способность самого опознающего воспринимать особенности голоса и речи опознаваемого, особенности слуха опознающего и особенности его восприятия (которые изучаются и описываются с точки зрения судебной психологии). На слух опознающего могут оказывать влияние самые различные факторы: особенности строения слухового аппарата; натренированность слуха; дефекты слуха; заболевания, оказывающие влияние на нормальное функционирование органов слуха, и т.п.

Важно также обратить внимание на то, что между моментом, когда опознающий слышал речь преступника, и опознанием может пройти достаточно много времени, что также отражается на результатах опознания. 
Продолжительность идентификационного периода зависит от устойчивости и изменяемости идентификационных параметров голоса и речи конкретного человека. Устойчивость и изменяемость голоса, в свою очередь, зависят от возраста и физического состояния лица, которому принадлежит голос. 
Речевые особенности, как уже отмечалось выше, могут изменяться под влиянием ситуативных факторов (эмоциональное состояние, заболевание и т.п.), а также в результате преднамеренного изменения голоса. Если исключить преднамеренное изменение голоса, а также исходить из нормального восприятия опознающим голосовых и речевых особенностей опознаваемого лица, то длительность идентификационного периода (http://www.klad.media/voice-samples), как правило, составляет: около одного года для подростка в возрасте от 12 до 18 лет и 5-10 лет для взрослого (но не пожилого) человека. Естественно, длительность идентификационного периода конкретного взрослого человека может отличаться от средней и зависит не только от возрастных изменений, но и от состояния органов, участвующих в речеобразовании. Например, любое изменение геометрии и объемов органов голосового аппарата в результате болезней, травм, протезирования и т.п. отражается на идентификационных признаках голоса и речи, а, следовательно, на длительности идентификационного периода.

Отмечу, что российским УПК возможность опознания по фонограммам устной речи не предусмотрена, при том что есть юристы, считающие что это «препятствует расширению доказательственной базы за счет получения значимой информации». Встречаются суды и следовали, незаконно проводящие подобные опознания и использующие их результаты в доказывании: «При изучении уголовных дел было выявлено, что при расследовании преступлений применяется опознание по признакам голоса и речи, хотя встречается достаточно редко и составляет всего 4,5% от всего количества изученных уголовных дел, в которых применялось опознание личности» (там же). 

И в нашей практике был случай, когда пострадавшая в суде «опознала» по голосу налетчика через 10 лет после совершения преступления, во время которого преступник произнес, а точнее, прокричал только три слова.

Литература по теме:

  1. Идентификация лиц по фонограммам русской речи на автоматизированной системе «Диалект»: пособие для экспертов. Под ред. А.В. Фесенко. - М.: Войсковая часть 34435, 1996. – 102 с.

  2. Результаты экспериментальных испытаний автоматизированной системы идентификации говорящего по фонограммам устной речи «Фонекси», работающей на принципах методики идентификации лиц по устной речи «Диалект», проведенных экспертами в/ч 34435 (2000 г.): [Электронный ресурс]. Официальный интернет-сайт ООО «Целевые технологии». - Доступ: http://aimtech.ru/ approbations/download/34, свободный.

  3. Е.Н. Тимофеев, Т.И. Голощапова, И.В. Докучаев. Применение автоматизированной системы «Диалект» на базе компьютерной речевой лаборатории CSL (США) при решении задач идентификации дикторов: методические рекомендации. - М.: ЭКЦ МВД РФ, 2000. – 74 с.

  4. Г.Л. Грановский [и др.]. Идентификация человека по магнитной записи его речи: методическое пособие для экспертов, следователей и судей – М.: РФЦСЭ, 1995 г. – 129 с.

  5. Современные методы, технические и программные средства, используемые в криминалистической экспертизе звукозаписей: методическое пособие для экспертов. Под ред. А.Ш. Каганова. - М.: МЮ РФ, ГУ РФЦСЭ, 2003. - 255 с.

  6. А.Ш. Каганов. Криминалистическая экспертиза звукозаписей – М.: Юрлитинформ, 2005. – 267 с.

  7. П.И. Зубова, С.Л. Коваль. Идентификация личности по голосу и звучащей речи на основе комплексного анализа фонограмм.   Теория и практика судебной экспертизы: Научно-практический журнал. – М.: РФЦСЭ, 2007, №3 (7). – С. 68-76.

  8. С.Л. Коваль, М.В. Хитров. Идентификация дикторов при анализе разноязычных фонограмм на основе сравнения формантных спектров. Сборник трудов XII Международной конференции «Информатизация и информационная безопасность правоохранительных органов» (Москва, 20-21 мая 2003 г.). – М.: Академия управления МВД РФ, ГИЦ МВД РФ, ГУ ЭКЦ МВД РФ, 2003. -  С. 348-349.

  9. Сборник научно-методических рекомендаций по выполнению криминалистических экспертиз звукозаписей речи. Под ред. С.Л. Коваля. – СПб.: Центр речевых технологий, STC-D 106.2 – 174 c.

  10. Г.С. Рамишвили, Г.Б. Чикоидзе. Криминалистическое исследование фонограмм речи и идентификация личности говорящего.  АН Грузии, МЮ Грузии, Тбилиси, "Мецниереба", 1991. - 205 с.

  11. Галяшина Е.И. Судебная фоноскопическая экспертиза. М., 2001. – 304.

  12. В.О. Хуртилов [и др.]. Криминалистическое исследование фонограмм ограниченного объема и низкого качества записи: учебное пособие. – М.: ЭКЦ МВД РФ, 2007. – 82 с.

  13. Ю.М. Овчинникоа, В.П. Гамов. Болезни носа, глотки, гортани и уха: учебник для вузов. – М.: Медицина, 2003. – 336 с.

  14. И. Алдошина. Основы психоакустики: серия статей [Электронный ресурс] / журнал «Звукорежиссер». - Режим доступа: http://625-net.ru/, свободный.

  15. Г.С. Рамишвили. Автоматическое опознавание говорящего по голосу. – М.: «Радио и связь», 1981.

  16. Р.С. Белкин. Криминалистическая энциклопедия. М.: «Мегатрон XXI», 2000.

  17. Stevens K.N., Williams C.E., Carbonell L.R. et al. Speaker authentication and identification. A comparison of spectrographic and auditory presentations of speech materials. – JASA, 1971, v. 44, №6.

  18. Voiers W.D. Perceptual base of identity. – JASA, 1964, v. 36, № 6.

  19. Compton A.J. Effects of filtering and vocal duration upon the identification of speakers, aurally. – JASA, 1963, v. 35, № 11.

* В.Н. Сорокин, В.В. Вьюгин и А.А. Тананыкин Информационные процессы, Том 12, №1, с. 1-30 [Электронный ресурс] URL http://www.jip.ru/2012/1-30-2012.pdf

** Национальный институт стандартов США.

*** [Электронный ресурс] URL https://www.nist.gov/sites/default/files/documents/oles/8-Greenberg_Craig-Human-Assisted-Speaker-Recognition.pdf