Словоискатель - сервис поиска слов в аудиозаписях.
На нашем форуме рассматриваются предложения по использованию технологии распознавания речи.
Пример работы
Оператор создает поисковый запрос, выбирая интересующие его слова и определяя период, во время которого
были записаны разговоры. После обработки запроса оператор просматривает результат поиска, прослушивает найденные в аудиозаписях
звуковые фрагменты со словами и сохраняет заинтересовавшие его результаты.
Рисунок 1. Общий принцип работы Словоискателя
Система выдает пользователю список найденных фрагментов, среди которых есть как верно обнаруженные ключевые слова,
так и ложные срабатывания. Оператору предстоит работа по отделению ложных срабатываний. На это будет уходить
примерно 1,5 секунды на одно срабатывание. Таким образом, даже при одновременном поиске 10 слов система в несколько раз
эффективнее сплошной отслушки.
Показатели качества
Качество поиска ключевых слов и фраз Словоискателем
зависит от характеристик записанного звука, длины искомого ключевого слова (или фразы) и фонетического состава слова.
Ниже приводятся статистические данные, полученные на реальных записях пользователей систем SpRecord.
1. Для половины проверенных слов процент обнаружений составляет не менее 60%, а уровень ложных срабатываний не
превышает 30 штук в час.
2. Для 90% проверенных слов можно достичь не менее 70% обнаружения за счет настройки в
программе 'уровня доверия' (конфиденса).
Чтобы подобрать оптимальное значение конфиденса обычно достаточно 20
случаев произнесения искомого слова в записях. После коррекции конфиденса в некоторых случаях количество ложных срабатываний
может превысить 30 штук в час.
Использование технологии
Обратитесь к нам, если вы заинтересованы в
использовании технологии Словоискатель. Проект реализуется индивидуально под заказчика. Возможна точная настройка поиска слов,
обеспечивая высокое качество обнаружения.
Цены указаны без НДС. Сарапульские Системы и часть дилеров работают по упрощенному налогу