Часто задаваемые вопросы
У вас есть вопросы о Proxem, наших решениях, технологиях и методиках? Ниже представлены ответы на часто задаваемые вопросы. Для получения дополнительной информации свяжитесь с нами.
Сбор данных и обработка
Все типы текстовых данных совместимы с Proxem Studio: обычный текст, веб-страницы, сообщения эл. почты, файлы PDF, документы Word и т. д.
В зависимости от требований в Proxem Studio можно применять к данным предварительную обработку для очистки тегов HTML на страницах и в сообщениях эл. почты.
Существует три режима импорта данных:
- импорт данных напрямую из модуля Connect Files (импорт из электронных таблиц и файлов PDF, Word и др.);
- сбор данных веб-ресурсов с помощью модуля Connect Web;
- импорт через API-интерфейсы существующей информационной системы.
Proxem Studio по умолчанию интегрируется с несколькими решениями для управления отзывами потребителей, например Mediatech-cx, Satisfactory, Critizr, WizVille и др.
В настоящий момент решение Proxem Studio совместимо с более чем 27 языками, включая английский, венгерский, датский, испанский, итальянский, китайский, немецкий, португальский, русский, французский, японский и др.
В Proxem Studio легко можно добавить миллионы высказываний.
Для эффективной работы алгоритмов автоматизации рекомендаций на основе машинного обучения требуется ввести по крайней мере 2000 примеров. Тем не менее, Proxem Studio также работает и с небольшими объемами данных благодаря лингвистическим ресурсам и мощному механизму семантических правил.
В Proxem Studio интегрирован модуль сбора информации с веб-ресурсов для сопоставления рынков и обзора технологий.
Proxem не предоставляет решение для сбора информации в социальных сетях, но позволяет подключить ваше избранное ПО для мониторинга социальных сетей к Proxem Studio, чтобы анализировать высказывания на веб-ресурсах. Также можно использовать API-интерфейс Google My Business для интеграции данных Google Avis. Решение Proxem Studio по умолчанию подключено ко многим средствам управления отзывами, например Critizr, Mediatech-CX, WizVille, Satisfactory и др.
Компания Proxem заботится о безопасности и конфиденциальности данных.
Мы не рекомендуем использовать персональные данные в Proxem Studio. В большинстве случаев информация, идентифицирующая автора высказывания или документа, не требуется.
Proxem советует настраивать ваш проект для защиты персональных данных, представленных на платформе SaaS, в соответствии с регламентом ЕС №°2016/679 (GDPR) и с учетом следующих требований:
- использование только необходимых для анализа метаданных;
- использование обозначений, которые только клиенты могут связать с реальным человеком;
- использование псевдонимов в текстах (по желанию): Proxem Studio позволяет обезличить данные путем удаления имени, адреса эл. почты, адреса проживания и номера телефона из предоставляемой информации.
Анализ и классификация
Надежность анализа зависит от нескольких параметров и установленной цели. Ниже представлены два основных показателя семантического анализа, которые мы хотим оптимизировать.
- Напоминание: все ли высказывания и документы классифицирует система? Все ли мнения правильно категоризируются как положительные, отрицательные или нейтральные? Напоминание очень трудно подвести под абсолютный термин, поскольку в начале классификации всех данных человеком необходимо знать, может ли система что-то "забыть". Один из способов решить эту проблему — примерно измерить объем рассматриваемых источников: как много документов автоматически классифицируются? Мы можем получить эффективное на 100% напоминание с помощью классификации всех документов во всех категориях, но в этом случае мы не можем быть уверены в релевантности системы. Именно поэтому необходимо объединить напоминание с точностью.
- Точность: правильно ли классифицируются высказывания в системе? Точность обычно измеряется по образцам: мы экспортируем подмножество результатов анализа, затем отправляем эксперту, который будет оценивать каждое решение машины как правильное или неправильное.
На основе требований проекта будет выбрана одна система измерения.
Объединение напоминания и точности позволяет получить общую оценку эффективности анализа, характеристику точности классификации (F-показатель), выраженную в процентах. В лучших случаях мы получали до 95% F-показателя. Стоит помнить, что он зависит от источников, количества классов или концептов, которые необходимо определить в тексте, а также от бюджета.
Качество результатов анализа является главным приоритетом. Proxem Studio включает в себя модули измерения и мониторинга для проведения качественного семантического анализа с функциями контроля и постоянного улучшения результатов в ходе работы над проектами.
Разработка плана классификации различается для каждого проекта и зависит от следующих факторов:
- количество обрабатываемых источников;
- количество открытых вопросов;
- общий объем данных для обработки (предпочтительно большие объемы, повышающие качество неконтролируемого машинного обучения);
- количество языков.
Обычно первоначальная настройка занимает в среднем несколько недель, что позволяет перейти к работе в производственной среде менее чем за 3 месяца.
Решение Proxem Studio разработано для обработки любого типа и формата базы текстов. Возможность неконтролируемого машинного обучения позволяет быстро и эффективно обрабатывать данные для любой отрасли.
В настоящий момент мы обрабатываем текстовые данные для всех сфер деятельности: банковского дела, страхования, массовой дистрибуции, электронной коммерции, энергетики, здравоохранения, транспорта, телекоммуникаций, управления кадрами и др.
Да!
Обычно клиенты говорят на многие темы, важно определить суть.
Конечно, даже может приготовить кофе ;-)
Если серьезно, в большинстве случаем иронию или сарказм очень трудно определить: например, является высказывание "Браво, Макрон" саркастическим или аутентичным?
Proxem Studio позволяет в некоторых случаях определять иронию, но при условии, что в целом высказывании содержится больше информации, чем в одном обороте. Обычно в проекте потребительской лояльности ставится оценка 0, если в нем содержится высказывание "спасибо за опоздание", т. е. опоздание критикуется, а "спасибо" рассматривается как ирония, не благодарность.
План классификации совершенствуется в Proxem Studio: мы ежедневно оказываем поддержку в рамках его реализации в соответствии с вашими отзывами, новыми темами и потребностями.
В целом, в соответствии с целями различных отделов организаций очень часто разрабатывается несколько планов классификации. Помимо плана пословной классификации Proxem Studio также предоставляет полный тезаурус запрашиваемых тем, что позволяет получить информацию с перекрестными ссылками для специального исследования по теме, которая, возможно, не рассматривалась в изначальном плане классификации.
Отчетность
Модуль Report в Proxem Studio позволяет создавать независимые таблицы и визуализации данных.
Благодаря множеству полностью настраиваемых виджетов можно настраивать информационные панели в соответствии с вашими потребностями, а также легко обмениваться ими внутри компании. Все визуализации можно экспортировать для интеграции с вашими представлениями. Также можно создавать готовые отчеты в формате PDF для обмена по электронной почте.
Все данные, созданные в Proxem Studio, можно экспортировать в Excel или CSV с помощью специальных функций, доступных в модулях Explore и Report, или с помощью REST API для идеальной интеграции с вашей информационной системой.
Технологии
Решение Proxem Studio разработано преимущественно с использованием технологий Microsoft .NET и базируется на поисковом механизме ElasticSearch.
Алгоритмы обработки языка являются результатом исследований Proxem. Они полностью разработаны компанией Proxem.
Модуль Dialog для развертывания чат-ботов и ассистентов ответов по эл. почте частично основан на платформе Microsoft Bot Framework.
Благодаря мощному механизму семантических правил в Proxem Studio одновременно используются искусственный интеллект, машинное обучение и профессиональные системы.
Таким образом, Proxem Studio интегрирует алгоритмы машинного обучения на разных уровнях для автоматизации обработки языка, в частности, машинное обучение для моделей языков на основе нейронных сетей и моделей дистрибутивного анализа. Сюда входят неконтролируемое обучение для обнаружения запрашиваемых тем в базе текстов (векторное представление слов и кластеризация), а также алгоритмы контролируемого обучения.
Чтобы узнать больше о наших исследованиях и разработках, нажмите здесь.
Обслуживание и поддержка
Да. В ваших проектах и при использовании Proxem Studio вам будет помогать менеджер проектов.
Менеджер по работе с клиентами будет регулярно предлагать семинары и программы обучения для поддержки вашего развития, применения передовых методик и учета потребностей в разработке ПО.
Для каждого проекта мы предлагаем обучение по работе с ПО и различными модулями.
Мы также предлагаем обучение для опытных пользователей, которое позволит вам самостоятельно работать над проектами семантического анализа.
Услуги поддержки уровня 1 доступны по уникальному адресу электронной почты в рабочие дни с 09:00 до 18:30.
Вне зависимости от проекта вы можете консультироваться с менеджером проектов и вам доступна поддержка уровня 1.
В зависимости от ваших потребностей и сложности проекта можно получить дополнительную поддержку, например:
- несколько дней обучения в течение года;
- непрерывное улучшение семантических анализов;
- персональные консультации в соответствии с потребностями (ИТ-поддержка, поддержка работы с информационными панелями, настраиваемые исследования и пр.).
Свяжитесь с нами для получения персонального коммерческого предложения.
Цены
Цена подписки на Proxem Studio зависит от разных параметров:
- Общий объем данных для обработки в месяц/год.
- Количество пользователей платформы в соответствии с профилями: опытные пользователи имеют доступ ко всем функциям, включая модули для настройки семантического анализа; аналитики могут использовать модули Explore и Report, чтобы проводить анализ данных и создавать информационные панели; читатели получают доступ только к модулю Report для ознакомления с информационными панелями.
- Количество доступных языков.
- Объем предлагаемой поддержки и обучения.
Для получения персонального коммерческого предложения свяжитесь с нами.
Да, если вы не выберете лицензии Power User и не настроите семантический анализ самостоятельно.
Стоимость настройки зависит от количества источников, открытых вопросов и сложности реализации плана классификации.
Для получения персонального коммерческого предложения свяжитесь с нами.