Заказы по номерам
(+37493) 77-77-05  (моб.)
(+37410) 566-288 (Ереван)
Армения

info@sprecords.am
SpRecord - системы записи телефонных разговоров

Словоискатель - сервис поиска слов в аудиозаписях.

На нашем форуме рассматриваются предложения по использованию технологии распознавания речи.

Назначение
Система позволяет сократить время на поиск нужной информации, содержащейся в аудиозаписях.

Особенности:
  • шумоустойчивость;
  • дикторонезависимость;
  • лингвистические алгоритмы, учитывающие особенности русского языка: фонетика, морфология, правила произношения, вариативность;
  • возможность точной настройки параметров системы для работы с избранным списком слов;
  • открытый пользовательский словарь.

Пример работы
Оператор создает поисковый запрос, выбирая интересующие его слова и определяя период, во время которого были записаны разговоры. После обработки запроса оператор просматривает результат поиска, прослушивает найденные в аудиозаписях звуковые фрагменты со словами и сохраняет заинтересовавшие его результаты.


Рисунок 1. Общий принцип работы Словоискателя

Система выдает пользователю список найденных фрагментов, среди которых есть как верно обнаруженные ключевые слова, так и ложные срабатывания. Оператору предстоит работа по отделению ложных срабатываний. На это будет уходить примерно 1,5 секунды на одно срабатывание. Таким образом, даже при одновременном поиске 10 слов система в несколько раз эффективнее сплошной отслушки.

Показатели качества
Качество поиска ключевых слов и фраз Словоискателем зависит от характеристик записанного звука, длины искомого ключевого слова (или фразы) и фонетического состава слова. Ниже приводятся статистические данные, полученные на реальных записях пользователей систем SpRecord.
1. Для половины проверенных слов процент обнаружений составляет не менее 60%, а уровень ложных срабатываний не превышает 30 штук в час.
2. Для 90% проверенных слов можно достичь не менее 70% обнаружения за счет настройки в программе 'уровня доверия' (конфиденса).
Чтобы подобрать оптимальное значение конфиденса обычно достаточно 20 случаев произнесения искомого слова в записях. После коррекции конфиденса в некоторых случаях количество ложных срабатываний может превысить 30 штук в час.

Использование технологии
Обратитесь к нам, если вы заинтересованы в использовании технологии Словоискатель. Проект реализуется индивидуально под заказчика. Возможна точная настройка поиска слов, обеспечивая высокое качество обнаружения.

Цены указаны без НДС. Сарапульские Системы и часть дилеров работают по упрощенному налогу