В эпоху, когда технологии становятся неотъемлемой частью нашей жизни, искусственный интеллект (ИИ) открывает новые горизонты. Нейросети проникли и в бизнес-сферу, и в этой статье мы рассмотрим сервис «Таймлист», который использует ИИ для создания стенограмм и автопротоколов на основе аудиозаписей встреч и совещаний, предоставляя эффективное решение для современного бизнеса.Особый метод разработки ИИВажно отметить, что "Таймлист" не просто использует ChatGPT, а разрабатывает собственные ИИ-решения. Зависимость от сторонних платформ ограничивает контроль над продуктом. Хотя это более трудоемкий процесс, он позволяет создать более надежное и инновационное решениние для для клиентов.
ИИ "Таймлист" основывается на open-source моделях для расшифровки аудио и видео и языковых моделях для обработки текста. Команда постоянно улучшает эти модели и разрабатывает новые, обучая их на оригинальных записях встреч на русском языке. Технология доступна в двух форматах: облачном (online) и локальном (on-premise).
Как работает ИИ «Таймлист»?Команда «Таймлист» постоянно совершенствует алгоритмы для повышения качества транскрибации и разработала несколько специализированных модулей:
- Модуль проверки ошибок: тщательно проверяет текст на наличие ошибок после первичной транскрибации.
- Модуль проверки специфических терминов: корректирует терминологию и выбирает подходящие термины в зависимости от контекста.
- Модуль оценки и улучшения качества аудио: автоматически оценивает пригодность записи для расшифровки и применяет нормализацию для улучшения качества.
- Модуль детоксификации: по запросу заменяет ненормативную лексику и токсичные выражения.
- Модуль разделения текста на абзацы: разбивает текст спикеров на короткие фрагменты, учитывая смысл.
- Модуль диаризации: разделяет одноканальную запись на реплики разных спикеров.
Генеративная языковая модель "Таймлист" обучена на тысячах реальных кейсов встреч российских компаний и продолжает совершенствоваться на основе обратной связи от пользователей и экспертных знаний команды.