# Зачем в видеосвязи ИИ?

ПО TrueConf AI Server — это решение на базе ИИ (машинного обучения) для протоколирования (распознавания речи) в конференциях от компании Труконф. Оно позволяет в автоматическом режиме распознать аудио с ваших мероприятий, проведённых в TrueConf Server, и сохранить его в текстовом виде с разбиением по спикерам.

Благодаря бесшовной интеграции с решениями TrueConf Server и TrueConf Enterprise пользователи могут получить доступ к протоколам через свой сервер видеосвязи без необходимости авторизовываться в отдельном сервисе. Это повышает удобство использования и уменьшает число разных веб-страниц, на которые надо входить пользователю. Мы рекомендуем использовать личный кабинет сервера видеосвязи для работы с протоколами, хотя остаётся возможность входа также через личный кабинет TrueConf AI Server.

Решение предоставляется в виде готового к установке в серверную стойку программно-аппаратного комплекса (ПАК) с развёрнутым ИИ сервером.

В дальнейшем понятия расшифровка, протоколирование, распознавание речи — одно и то же, и обозначают процесс анализа аудио конференции для получения её стенограммы (протокола).

# Основные возможности

  • Автоматическое определение выступающего для корректного сохранения авторства каждой реплики.

  • Формирование полной стенограммы конференции с разделением фраз по каждому из участников конференции (включая терминалы в переговорных комнатах).

  • Возможность выбрать основной язык для распознавания аудиодорожек конференции.

  • Отображение на протоколе таймкодов (относительного времени) для отдельных фраз.

  • Автоматическое проставление пунктуации.

  • Автоматическое проставление больших букв в начале предложений (капитализация).

  • Корректное распознавание речи при использовании докладчиками разных языков.

  • Корректное распознавание не только распространённых в речи слов, но и редко используемых.

  • Распознавание известных аббревиатур.

  • Корректное распознавание чисел и дат и запись их в цифровом формате.

  • Успешное распознавание аудиодорожки в сложных акустических условиях: шум, тихая речь, одновременное выступление нескольких участников.

  • Хранение аудиодорожки конференции и распознанного протокола.

  • Возможность ручного удаления любой аудиозаписи вместе с результатом её транскрибации.

  • Отсутствие ограничений на количество распознаваемых конференций за счет формирования очереди задач.

  • Поддержка обработки аудио на системах как с одним, так и с несколькими GPU NVIDIA.

  • Наличие веб-интерфейса для работы с распознанными конференциями.

  • Авторизация на сервере ИИ с помощью учетной записи пользователя сервера видеоконференцсвязи, в том числе если на стороне заказчика используется служба каталогов LDAP, например, Active Directory.

  • Возможность интеграции ИИ сервера с одним или несколькими серверами видеоконференцсвязи.

  • Отображение данных об обрабатываемых конференциях, как минимум: название, уникальный идентификатор, время начала и длительность.

  • Наличие встроенного в веб-интерфейс плеера для воспроизведения аудиофайла конференции или звонка.

  • Возможность настройки доступа к расшифровке как для участников конференции, так и для произвольного пользователя сервера видеоконференцсвязи.

  • Отображение в реальном времени статуса распознавания конференции.

  • Экспорт результатов расшифровки в текстовом виде (в формате .txt) или в табличном виде (в формате .csv).

  • Экспорт общей аудиодорожки конференции.

  • Уведомление модератора конференции об успешном сохранении её записи на стороне сервера транскрибации.

  • Уведомление модератора конференции об успешном окончании процесса транскрибации и предоставление ссылки на результат.

  • Уведомление пользователей сервера видеоконференцсвязи о том, что им предоставлен доступ к просмотру транскрибации конференции.

# Принцип работы

Для полноценного использования совместно с TrueConf AI Server требуется TrueConf Server версии 5.5.0 и выше. Имеется возможность подключения в режиме чтения TrueConf Server версии 5.4.5 и старше.

Возможность интеграции в режиме полного доступа с ИИ сервером регулируется:

  • дополнительным лицензированием расширения для TrueConf Server;

  • своей лицензией на TrueConf AI Server, которая регулирует количество серверов видеосвязи, которые можно подключить к ИИ, а также зависит от мощности приобретённого ПАК.

Используется следующий алгоритм:

  1. Устанавливается на физическую или виртуальную машину TrueConf Server (или TrueConf Enterprise в случае крупных заказчиков).

  2. В серверную стойку заказчика (или в арендованном ЦОД) устанавливается ПАК TrueConf AI Server.
  3. Устанавливается связь сервера видеосвязи с ИИ сервером с помощью ключа интеграции. При этом можно подключить несколько TrueConf Server к одному экземпляру ИИ сервера.

  4. В соответствии с настройками TrueConf Server аудиозапись конференции отправляется на TrueConf AI Server.

  5. Происходит распознавание речи и создание стенограммы. Это может быть автоматическое распознавание сразу после окончания мероприятия или запускаться вручную владельцем конференции в личном кабинете ИИ сервера. Также владелец может поделиться исходным аудио и полученным текстом с любым участником и даже другим пользователем своего или федеративного TrueConf Server.