Отвечай
Есть что спросить или ответить?
Или, может, Вы ищете новых друзей?
Или просто хотите пообщаться?
Заходите!
Посты
Список блогов
Популярные
Новые
Мои подписки
Картинка загружается...

Технология диаризации и распознавания речи, созданная группой компаний ЦРТ (входит в экосистему Сбербанка), признана лучшей на международном конкурсе CHiME Speech Separation and Recognition Challenge (CHiME-6). Высокое признание технология получила за распознавание английской речи с нескольких микрофонов в условиях естественной обстановки. Группа ЦРТ показала наилучшие результаты тестов в самой сложной задаче конкурса, значительно превзойдя конкурентов.

Организаторы CHiME предлагают сильнейшим командам со всего мира различные задачи, которые с каждым новым конкурсом усложняются. На CHiME-5, конкурсанты решали так называемую cocktail party problem — распознавание спонтанной речи нескольких дикторов в условиях частичного наложения речи и шума, то есть в типичной ситуации общения на вечеринке. Этот блок требовал работы с сегментированной (уже выделенной) речью. Новизна и особенность CHiME-6 заключалась в том, что впервые в истории конкурсантам было предложено решить аналогичную проблему, но работая с несегментированной речью, при этом — с перекрытием речи до 20%. Именно на решении этой, самой сложной, задачи сфокусировалась команда ЦРТ.

Записи для конкурса были сделаны на 20 ужинах в реальных домах на вечеринках, где люди готовили, ели, мыли посуду, свободно и эмоционально общались, шутили и смеялись. Для распознавания здесь сложны одновременная речь 2-4 человек, реверберация и интенсивный шум — звон приборов, льющаяся из крана вода, гул кондиционера, шаги, смех. Цель участников — создать систему распознавания, которая «прослушает» записи и выдаст полную расшифровку с наименьшим количеством ошибок. Команда группы ЦРТ заняла первое место.
На графике: результаты конкурса, в столбцах — количество допущенных ошибок. Источник: https://chimech...e6/results.html
Картинка загружается...

Кроме группы ЦРТ, в конкурсе участвовали научные команды со всего мира: и известные IT-компании — Toshiba и ряд других, и крупные университеты-лидеры в области речевых технологий: Университет Джонса Хопкинса (США), Университет науки и технологии Китая, Технический университет Брно (Чехия) и др.
Группа компаний ЦРТ (входит в экосистему Сбербанка) — глобальный разработчик интеллектуальных речевых технологий, распознавания лиц, технологический эксперт в области искусственного интеллекта и машинного обучения. Одна из немногих компаний в мире, которая создает и развивает обе биометрические модальности: лицо и голос. Технологии выявления подделок голоса и распознавание речи от группы ЦРТ занимают лидирующие позиции в мировых рейтингах NIST, ASVspoof Challenge, VOiCES, CHiME Challenge. Решения ЦРТ востребованы в 70 странах мира.
Warning Присоединяйтесь!
Ιακώβ и другие наши пользователи
ждут Ваших ответов, вопросов и комментариев!
Зарегистрируйтесь на сайте в 1 касание - просто выберите почту или социальную сеть ниже.
Yandexндекс
MailRumail
Googleoogle
Odnoklassniki
VK
Заходя на сайт Вы подтверждаете своё согласие с
правилами и политикой конфиденциальности
норм чё
Like 0
Когда у нас в России это протестируют?
Like 0
И что ?
Like 0
Ещё комментарии
Читайте также:
Warning Присоединяйтесь!
Зарегистрировавшись Вы сможете просматривать
размещенные на сайте картинки и видео, слушать музыку,
Просматривать и оставлять комментарии
Задавать вопросы и отвечать на них.
Зарегистрируйтесь на сайте в 1 касание - просто выберите почту или социальную сеть ниже.
Yandexндекс
MailRumail
Googleoogle
Odnoklassniki
VK
Заходя на сайт Вы подтверждаете своё согласие с
правилами и политикой конфиденциальности
close