TAD Development запустила AI-приложение для расшифровки аудио
ИТ-компания TAD Development разработала сервис для расшифровки аудио «AI-Секретарь». Новое приложение на базе искусственного интеллекта преобразует в текст аудиозаписи интервью, переговоров, лекций и не только. Оно актуально для журналистов и копирайтеров, участников совещаний и встреч, а также для всех, кто не привык упускать важную информацию.
Главная задача сервиса “AI-Секретарь” – упростить процедуру транскрибирования аудиозаписей. Вместо нескольких часов ручной работы можно запустить распознавание дорожки и через несколько минут получить качественный текст, в котором соблюдена орфография и пунктуация. Если на записи звучит несколько голосов, достаточно указать число участников встречи, и финальный текст будет разделён на реплики. Пользователям уже доступно распознавание речи на русском и английском, планируется поддержка и других языков.
“AI-Секретарь” поддерживает почти все аудиоформаты, а также видео в формате mp4 и mov. Загруженные аудиозаписи и результаты расшифровки хранятся в облаке – они доступны с мобильных устройств iOS, Android и на сайте. Получившийся документ можно скачать в формате docx.
AI-платформа будет полезна при расшифровке интервью, ведении конспектов, подготовке протоколов встреч и выступлений. Авторам видеоблогов и подкастов она поможет составлять текстовые версии выпусков и нарезки таймкодов. Сервис уже доступен как на сайте, так и в App Store и Google Play. Функционал приложения остаётся бесплатным, так как для распознавания не используются сторонние SaaS-решения (спичкиты), этим “AI-Секретарь” отличается от большинства конкурентов, не уступая при это в качестве распознавания.
«Сервис ”AI Секретарь” спроектирован так, чтобы удовлетворять запросам как отдельных пользователей, так и бизнеса. Корпоративным заказчикам мы предлагаем возможность развернуть сервис во внутреннем контуре компании без доступа к интернету или же использовать распознавание в качестве SaaS-решения, – комментирует Тарас Фёдоров, генеральный директор TAD Development. – Приложение построено на микросервисной архитектуре, что позволяет в несколько потоков обрабатывать записи от разных пользователей и выдерживать нагрузку enterprise-уровня».
В числе ближайших обновлений команда называет добавление испанского языка, интеграцию с сервисом коммуникаций Zoom, а в более глобальной перспективе – функцию распознавания в реальном времени, формулировку ключевых тезисов встречи.