Настройка распознавания текста и речи
Сервер Распознавания является опциональным бесплатным дополнением к Локальной версии СпрутМонитор. Не рекомендуется устанавливать Сервер СпрутМонитор и Сервер Распознавания на одну машину.
Распознавание текста
Технология OCR позволяет извлекать текст из скриншотов и файлов изображений. Доступны два режима:
-
Tesseract - бесплатный свободно распространяемый движок OCR, поставляется вместе с словарями русских и английских слов. Бесплатный и не имеет ограничений. Качество распознавания - среднеее.
-
ABBYY OCR - облачный сервис распознавания изображений. Оплата взымается за каждое распознаное изображение. Высокое качество распознавания.
Распознавание речи
СпрутМонитор записывает аудио с микрофона или гарнитуры, подключенной к компьютеру. Технология AR поволяет извлечь текст из аудио-записей. Доступны два режима:
-
Wit.Ai - бесплатный облачный движок распознавания речи от Facebook.
-
Яндекс.SpeechKit - движок от Яндекса. Требует оплаты доступа к облаку Яндекс.
Принцип работы
Изображения и аудио-записи поступают с Грабберов на Сервер СпрутМонитор. Сервер Распознавания загружает их с Сервера СпрутМонитор и распознает в порядке очереди. Вы можете регулировать нагрузку на Сервер Распознавания, ограничивая количество потоков. Значение по-умолчанию для изображений - 5, для аудио - 1. По завершении процесса Сервер Распознавания отправляет текст на Сервер СпрутМонитор, который сохраняет его и индексирует. На ключевые слова можно настроить Правила.Настройка
-
Скачайте и установите Сервер распознавания. Он доступен по ссылке https://sprutmonitor.ru/SMRecognitionServerSetup.exe
-
Укажите адрес сервера на котором установлен СпрутМонитор и порт (Консоль Администратора - Настройки системы - Адрес HTTP сервера).
-
Укажите адрес сервера распознавания и порт.
-
Укажите логин и емейл аккаунта администратора системы СпрутМонитор.
-
Нажмите Сохранить и перезапустить. После этого окно управления Сервером Распознавания можно закрыть. Он будет получать настройки из Консоли Администратора СпрутМонитор.
-
Перейдите в Консоль Администратора и задайте настройки по аналогии, указав адрес и порт Сервера распознавания.
-
Укажите параметры распознавания. Опция Tesseract работает локально и не требует настроек, поэтому для первого запуска рекомендуем выбрать только ее. Нажмите Сохранить и перезапустить.
-
Откройте Вьюер, перейдите на вкладку Пользователи. Отредактируйте Профиль настроек, включив опции распознавания. Можно назначать разные Профили пользователям или группам.
-
Вернитесь в Консоль Администратора и нажмите кнопку Обновить на вкладке Распознавания. Должна появиться информация об очереди изображений.
-
Распознавание успешно настроено. Через некоторое время вернитесь в Консоль Администратора и оцените положение дел очереди изображений на распознавание.