FAQ
Vous vous posez des questions sur Proxem, nos outils, notre technologie, nos méthodes ? Voici les réponses aux questions qui nous sont le plus fréquemment posées. Si vous ne trouvez pas votre bonheur, contactez-nous !
Collecte et traitement des données
Tous les types de données textuelles sont compatibles avec Proxem Studio : texte brut, pages web, emails, documents PDF, Word etc.
En fonction des besoins, des pré-traitements intégrés dans Proxem Studio peuvent être appliqués sur les données, comme par exemple du nettoyage des balises HTML pour des pages ou des emails.
Trois modes d'imports de données sont possibles :
- Importez directement vos données depuis le module Connect Files : import de feuille Excel ou de document bureautique (pdf, word...)
- Collecte de pages web via le module Connect Web
- Import via nos API depuis un SI existant
Proxem Studio est nativement intégré à de nombreuses solutions de feed-back management du marché comme Mediatech-cx, Satisfactory, Critizr, WizzVill...
Proxem Studio peut intégrer des millions de verbatim sans difficulté.
Pour que les algorithmes de suggestions automatiques basés sur le machine learning fonctionnent parfaitement, il est recommandé de disposer d'au moins 2 000 exemples en entrée. Toutefois, Proxem Studio fonctionne également sur de faibles volumes grâce à nos ressources linguistiques et au puissant moteur de règle sémantique.
Proxem Studio intègre un module de collecte de page web pour des usages de type cartographie marché ou de veille technologique.
Proxem Studio est nativement connecté aux solutions NETVIBES de collecte de flux d’informations et des réseaux sociaux, ce qui vous permet d’exploiter pleinement ces contenus pour une analyse fine du marché, tendances technologiques ou veille sectorielle. Plus d’information sur les solutions de veilles Social Business Analyst et Explorer ici. Il est également possible d'utiliser les API Google My Business pour intégrer les données de Google Avis. Proxem Studio est nativement connecté à de nombreuses solutions de feedback management telles que Critizr, Mediatech-cx, WizVille, Satisfactory, etc.
La sécurité et la confidentialité des données est une préoccupation majeure chez Proxem.
De façon générale, nous recommandons de ne pas intégrer des données personnelles dans Proxem Studio : dans la plupart des cas, nous n'avons pas besoin d'avoir d'information permettant d'identifier le rédacteur d'un verbatim ou d'un document.
Proxem vous conseillera dans la mise en place de votre projet pour protéger les données à caractère personnel présentes dans la plateforme SaaS tel que le préconise le règlement UE n°2016/679 (dit « RGPD »), notamment via trois axes de travail :
- En incluant uniquement les métadonnées nécessaires aux besoins d’analyse.
- En favorisant l’usage de clé que seul le Client pourra associer à la Personne Concernée.
- En appliquant une pseudonymisation sur les contenus textuels (en option) : Proxem Studio permet en effet d'anonymiser les données en supprimant des verbatims collectés les informations comme les noms, emails, adresse, numéro de téléphone...
Analyse et classement
La fiabilité de l'analyse dépend de plusieurs paramètres, et de l'objectif que l'on se fixe. Les deux principales mesures que l'on va chercher à optimiser en analyse sémantique sont
1/ Le rappel : est ce que le système classe tout les verbatims ou tout les documents ? Est ce que toutes les opinions sont bien catégorisées en positif, négatif ou neutre ? En général, le rappel est très difficile à mesurer dans l'absolu, car il faudrait disposer au départ de l'ensemble des données classées par un humain pour savoir si le système "oublie" quelque chose. Une manière de résoudre cette difficulté est de faire une approximation avec le taux de couverture : quel est la part de mes documents qui sont classés automatiquement ? On peut avoir 100% de rappel en classant tous les documents dans toutes les catégories, mais on ne peut pas dire que dans ce cas le système soit pertinent... c'est pourquoi il faut combiner le rappel avec la précision
2/ La précision : lorsque le système classe, le fait il correctement ? La précision se mesure généralement en faisant de l’échantillonnage : on exporte un sous-ensemble des résultats de l'analyse que l'on soumet à un expert humain qui jugera sur chaque décision de la machine si elle est correcte ou non.
Suivant les besoins du projet, on favorisera l'une ou l'autre des métriques.
La combinaison du rappel et de la précision donne un score global de performance de l'analyse : la F-mesure, qui s'exprime en pourcentage. Dans les meilleurs cas, nous avons obtenus des scores allant jusqu'à 95% de F-mesure. Mais il faut garder en tête que cela reste dépendant des sources, du nombre de classe ou de concepts à détecter dans le texte, et... du budget.
La qualité de nos livrables est notre priorité numéro 1 et Proxem Studio intègre un module de mesure et de suivi de la qualité de l'analyse sémantique pour permettre le suivi et l'amélioration continue tout au long de vos projets.
La mise au point d'un plan de classement est très variable suivant les projets, et est notamment dépendant
- Du nombres de sources à traiter
- Du nombre de questions ouvertes
- Du volume global de données à traiter (nous préférons un volume important qui rend l'apprentissage automatique non supervisé meilleur)
- Du nombre de langues
- De la complexité d'analyse souhaitée
De façon générale, le paramétrage initial d'un projet standard est en moyenne de quelques semaines ce qui permet une mise en production en moins de 2 mois.
Proxem Studio est pensé pour traiter tout type de corpus et de format. Sa capacité d'apprentissage automatique non supervisé lui permet d'être rapidement efficace pour tout type de secteur d'activité.
Aujourd'hui, nous traitons des données textuelles dans tous les domaines d'activités : banque, assurance, retail, e-commerce, énergie, santé, transports, télécommunication, ressources-humaines...
Oui et c'est même généralement le cas !
Les clients s'expriment en général sur de nombreux sujets, et il est fondamental de pouvoir en capturer toute la substance. Cette multi-catégorisation rend possible la mise en évidence de corrélations comme par exemple des liens entre des familles de problèmes et une typologie de produits.
Bien sûr, et il fait même le café
Plus sérieusement, l'ironie ou le sarcasme est très difficile à détecter en général (même pour des humains) : un verbatim qui dit "bravo Macron" est il sarcastique ou est-ce une félicitation ?
Proxem Studio permet, dans certains cas, de comprendre l'ironie mais à condition de disposer de plus d'informations en général que le verbatim seul. Typiquement, dans un projet NPS où la note est de 0 et le verbatim "merci pour le retard", le motif détecté sera bien une critique concernant le retard, le merci étant détecté alors comme une ironie et non comme une félicitation.
Le plan de classement est évolutif dans Proxem Studio : nous vous accompagnons au quotidien pour le faire vivre en fonction de vos retours, des nouvelles thématiques qui apparaissent et des nouveaux besoins.
Plus généralement, il est également fréquent de disposer de plusieurs plans de classement suivant les objectifs de différents départements dans vos organisations. En plus du plan de classement général des verbatims, Proxem Studio fournit également un thésaurus complet des thèmes abordés permettant de croiser l'information pour une étude sur-mesure sur toute thématique qui ne serait pas explicitée dans le plan de classement initial.
Livrables
Le module Report de Proxem Studio vous permet de créer vos tableaux et visualisations de données en toute autonomie.
Grâce aux nombreux widgets totalement configurables, vous pouvez mettre en place autant de tableaux de bords que souhaité et les diffuser au sein de votre entreprise en toute simplicité. Toutes les visualisations sont également exportables pour les intégrer dans vos présentations, et vous pouvez également générer des rapports PDF prêt pour les partager ou les recevoir par email.
Technologie
Proxem Studio est développé principalement avec les technologies Microsoft .NET et s'appuie également sur le moteur de recherche ElasticSearch.
Les algorithmes de traitement du langage sont le fruit de la R&D Proxem et sont intégralement développés par Proxem.
Le module Dialog permettant de déployer des chatbots et des assistants de réponses aux emails s'appuie également en partie sur Microsoft Bot Framework.
Proxem Studio exploite en même temps de l'intelligence artificielle par apprentissage (ML) et des systèmes experts grâce à son puissant moteur de règles sémantiques.
Proxem Studio intègre ainsi des algorithmes de machine learning à différents niveaux pour le traitement automatique du langage, notamment de l'apprentissage automatique pour les modèles de langues à bases de réseaux de neurones et de modèles d'analyse distributionnelle, de l'apprentissage non supervisé pour la découverte des thématiques abordés dans un corpus (word-embedding et clustering) et des algorithmes d'apprentissages supervisés.
Pour en savoir plus sur notre R&D
Assistance et accompagnement
Oui ! Pour vos projets, un(e) chef(fe) de projet vous accompagnera tout au long de votre utilisation et prise en main de Proxem Studio.
Pour faciliter votre prise en main, un(e) customer success manager vous proposera également des ateliers et formations régulièrement pour vous accompagner dans le déploiement dans votre organisation, la mise en place des bonnes pratiques et la prise en compte de vos besoins d'évolutions du logiciel.
Pour chaque projet, nous vous proposons une formation à la prise en main du logiciel et des différents modules.
Deux niveaux de formations sont proposés en fonction de vos profils utilisateurs :
1/ Formation Analyste pour apprendre à exploiter les modules Explore et Report (1/2 journée de formation et accompagnement)
2/ Formation Power-User pour apprendre à paramétrer vos analyseurs sémantiques vous même et à déployer des projets au sein de votre organisation (2 jours)
Quel que soit votre projet, vous bénéficiez à minima d'un interlocuteur unique en tant que chef(fe) de projet et de l'accès au support niveau 1.
En fonction de vos besoins et de la complexité du projet, du support supplémentaire peut être inclus, notamment
- Des jours de formations tout au long de l'année
- De l'amélioration continue sur vos analyses sémantique
- Du consulting personnalisé en fonction de vos besoins (support IT, accompagnement pour la réalisation de vos tableaux de bords, études sur mesure...)
Tarifs
Le prix de l'abonnement à Proxem Studio dépend de différents paramètres :
1/ L'abonnement au logiciel :
- Le volume global de données à traiter par mois / année
- Le nombre d'utilisateurs de la plateforme suivant les profils : les power-users accèdent à l'ensemble des fonctionnalités, notamment les modules permettant de paramétrer l'analyse sémantique ; les analystes accèdent aux modules Explore et Report leur permettant de mener des analyses de données, créer et diffuser des tableaux de bords etc. ; les lecteurs accèdent uniquement au module Report pour consulter les tableaux de bords
2/ Le niveau de service
- support, gestion de projet et formation demandé
- niveau de maintenance et d'amélioration continue du paramétrage du projet