Поиск
  • Герман Зубов

ПЕРВАЯ МЕЖДУНАРОДНАЯ СИСТЕМА ФОНОУЧЕТА!

О проекте SIIP

Важной вехой в создании международной информационно-поисковой системы, использующей признаки голоса и речи (далее – Система фоноучета), стало успешное завершение в июне 2018 г. «Интеграционного проекта по идентификации дикторов» (Speaker Identification Integrated Project - SIIP).

В ближайшем будущем результаты SIIP должны стать составной частью биометрических учетов INTERPOL и использоваться для предотвращения и раскрытия преступлений, а также для сбора и подготовки судебных доказательств.

Кроме установления личности диктора по имеющимся в базе образцам речи, Система фоноучета способна определять пол, возраст и акцент говорящего, а также выявлять признаки имитации голоса. Основным источником пополнения базы голосов известных дикторов являются при этом интернет-сервисы и национальные базы 192 членов организации.

SIIP проводился в течение 4 лет международным консорциумом в составе 17 (19)[1] партнеров, включая конечных пользователей, представителей науки и промышленности разных стран (российских в их числе я не обнаружил). Координатором проекта являлась израильская компания Verint. Основной источник финансирования – грант ЕС.

В процессе разработки посредством опроса были учтены пожелания национальных бюро INTERPOL из более чем 100 стран мира. Результаты опроса, «INTERPOL survey of the use of speaker identification by law enforcement agencies» были опубликованы в апрельском номере Forensics Science International Journal за 2016 г.[2]


В июне 2016 г. Проводилось обсуждение концепции SIIP с участием сотрудников полиции из 20 стран на базе Школы карабинеров в Риме.

Совместно с INTERPOL в тестировании системы принимали участие: Carabinieri-Italy; Metropolitan Police -UK; PJ-Protugal и BKA-Germany.

В марте 2017 г. в Лиссабоне консорциум SIIP продемонстрировал работающую Систему фоноучета 130 судебным экспертам и специалистам в области голосовой биометрии, а также 40 сотрудникам правоохранительных органов разных стран.


Об алгоритмах автоматической идентификации


Участники SIIP заявляют, что используемые алгоритмы идентификации являются языко- и каналонезависимыми и по шкале «ложное-положительное/ложно-отрицательное обнаружение» превосходят используемые на практике. Следует отметить, что в настоящее время методы автоматической идентификации говорящих используются в более чем половине из 91 опрошенных департаментов правоохранительных органов в 69 странах.[3] Их надежность не уступает надежности экспертных методов и не зависит от квалификации тех, кто их применяет.

Несмотря на то, что на сайте Еврокомиссии[4] указано: «сильной стороной SIIP является объединение нескольких алгоритмов анализа речи, связанных с моделью говорящего, полом, возрастом, языком и акцентом, предоставляемыми различными поставщиками (технологий)», я склонен считать, что они были представлены американской компанией NUANCE (один из участников проекта), которая, в свою очередь, получила их после поглощения в 2011 г. итальянского разработчика Loquendo. В 2010-2011 гг. мне и коллегам по ООО «Форенэкс» удалось протестировать систему Loquendo Voice Investigation System (LVIS) на нашей собственной базе фонограмм речи на языках народов России и СНГ. Результаты были весьма обнадеживающие: система самостоятельно разделяла речь дикторов в диалогах и полилогах, и уверенно находила наиболее близких людей по имеющимся образцам их речи. Естественно, случались и ошибки, но их количество не вызывало сомнений в работоспособности алгоритмов. LVIS также была способна диагностировать пол, возраст, национальную принадлежность говорящего (на ограниченном списке языков). В 2011 г. LVIS была представлена руководству МВД Казахстана и продемонстрировала хорошие результаты на имеющейся у МВД РК базе голосов. Но дальше слов дело тогда не пошло.

В заключение следует отметить, что первая система фоноучета национального уровня была создана в Мексике. Проект был реализован российской компанией «Центр речевых технологий» в 2010 г.[5] (на нижнем фото - испытания системы фоноучета ЦРТ в Прокуратуре штата Сонора)


Источники (DOI):

· https://cordis.europa.eu/project/rcn/188607/brief/en

· https://www.interpol.int/Who-we-are/Legal-framework/Information-communications-and-technology-ICT-law-projects/Speaker-Identification-Integrated-Project-SIIP

· https://vimeo.com/219362794

· https://theintercept.com/2018/06/25/interpol-voice-identification-database/

[1] Число участников в разных источниках различается.

[2] DOI: https://www.sciencedirect.com/science/article/pii/S0379073816301311?via%3Dihub

[3] DOI: https://theintercept.com/2018/06/25/interpol-voice-identification-database/

[4] DOI: https://cordis.europa.eu/project/rcn/188607/brief/en

[5] DOI: https://speechpro-usa.com/media/news/2010-06-03

#фоноучет

#КримналистическийУчет

#ИнформационноПоисковаяСистема

#АвтоматическаяИдентификация

#ИдентификацияПоГолосу

Просмотров: 28