• INTUITIVE : Les requêtes vocales sont faites en langage naturel .
• RAPIDE : en moyenne, sur une minute, un individu saisira sur clavier 33 mots de texte, tandis que la conversation est tenue à 200 mots environ.
• MULTIMODALITÉ : permet de passer de la voix au clavier ou au tactile dans la même conversation, selon le contexte et le confort d’utilisation ;
• MULTITASKING : répond au fait d’opérer plusieurs activités en même temps, notamment en ayant les mains occupées, par exemple, pendant la préparation d’un repas ou en voiture ;
• ACCESSIBILITÉ : permet l’opérabilité sans proximité immédiate de l’objet d’interface. Tout devient « à portée de voix ». »
Le marché mondial des enceintes connectées a dépassé les 200 millions d"unité fin 2019 c'est un marché en croissance de 50% par an. La part de marché d’Amazon est de 50% en 2019, mais Google rattrapera son retard d’ici 2022.
En france on estime que 18%* des internautes possèdent au moins une enceinte connectée à commande vocale , et 46 % **déclare avoir déjà fait l’usage d’un assistant vocal
*Etude HOMESERVE / CSA : 2020Le profil type est un utilisateur CSP+ (53%) dans la tranche d'âge 25-49 ans (69%) vivant dans un foyer d'au moins 3 personnes (53%) avec une forte appétence dans la consommation d’offre de contenus payants (77% des utilisateurs)
Étude médiamétrie- enceintes a commande vocale décembre 2018 – internautes 15 et plus
Une application vocale (appeler aussi voice app et parfois voice bot) est un service tiers permettant d’enrichir l’expérience des assistants vocaux.
On peut les comparer aux applications sur le mobile avec 2 écosystèmes :
On peut aussi trouver des applications vocales sur d'autres devices , ordinateur, telephone mobile, borne intéractive, montre, télévision, casque audio, box internet, voiture, ...
Les applications vocales peuvent répondres à plusieurs problématiques :
SERVICIELLE
Aider les clients à résoudre leurs problèmes,
Proposer une application servicielle et agnostique.Suggérer que votre marque est une solution potentielle.
CHOISR UN PRDUIT
Aider les clients à choisir le bon produit ou l’option qui leur correspond le mieux.Les inciter à passer à la phase suivante du parcours via des coupons d’achat par exemple.
TRANSACTIONELLE
La transaction via une application est le Saint Graal du commerce. Juste quelques mots et votre commande est passée : pas besoin d'ouvrir un ordinateur, de trouver un téléphone pour naviguer sur un site ou une application.
ENRICHIR L’EXPÉRIENCE CLIENT
Une fois la transaction effectuée, un client doit pouvoir obtenir facilement des informations pour utiliser votre produit et contacter le support technique. C’est historiquement les premières applications vocales téléphoniques. Une application vocale permet d’enrichir cette expérience.
OFFRIR DE NOUVEAUX SERVICES
La dernière étape du parcours client consiste à fidéliser et à renouveler une commande, un abonnement ou à poursuivre l’engagement de la marque.
Les applications vocales permettent d’augmenter l’engagement et de découvrir de nouveaux services sur un canal multi-modal.
Les applications « first party » font généralement partie de l’écosystème de la plateforme, et sont lancées par défaut si elle correspond à l’invocation explicite. Par exemple lorque vous demandez la météo a votre assistant c'est l'application first part developpée par Amazon ou Google qui repondra sans que vous avez à l'invoquer explicitement. En revanche si vous voulez connaitre les horaires de la SNCF vous devez invoquer explicitement l'application de la SNCF. On parlera ici d'application third part.
Dans l'univers d'Alexa, dans certain cas certaines applications third part sont developpées par des tiers. C'est le cas par exemple de l'application maconjugaison (developpée par shirkalab). Quand vous demander "alexa conjugue moi le verbe prendre au présent" c'est l'application ma conjugaison qui va répondre sans avoir été invoquée explicitement.
Les applications vocales sont utilisées pour dans de multiples contextes et pour repondre à plusieurs problématiques. Les utilisateurs utilisents les assitants vocaux pour :
Les applications vocales sont accessibles sur tous les appareils disposant d’un assistant vocal. Dans le cas de Google et Amazon les 2 leaders d’assistant dans le monde on peut interagir avec une application vocale sur les diverses enceintes connectées (smart speaker) de ces 2 marques, la Game écho et écho show pour Amazon et nest Audio et nest Hub pour Google.
On retrouve aussi ces assistants dans une multitude d’appareils, tous les téléphones android pour Google assistant, mais aussi dans les télévisions, les casques audio, les box internet les voitures, les montres, et même des cafetières !
Pour accéder à une application vocale, il est nécessaire de "réveiller" l'appareil et d’activer le micro hote en utilianst une "Wake Word". Par exemple "ok Google", "Alexa", "Dit siri", "hey Mercedes" ,...
Une application ne s'installe pas mais "s'invoque". Pour lancer une application vocale, il suffit de demander à l'assistant vocal de la lancer.
Par exemple pour google « ok Google Parler avec OUI.sncf pour voir tous les prix disponibles » pour lancer l'application oui sncf sur l'assistant Google (l'action Oui SNCF) ou "Alexa, demande à Oui SNCF un train pour Lyon" pour lancer l'application sur Alexa (la skill Oui SNCF )
Comme pour les applications mobiles il existe des stores qui regroupes l'ensemble des applications. Les 2 principaux sont celui d’Amazon qui regroupe l'ensemble des skill alexa et celui de Google qui regroupe l'ensemble des actions Google.
Comme dans l'univers du mobile les stores sont organisés par catégories avec un système de notes et d’évaluation set un système de ranking en fonction de différents critères.
Pour avoir une vision complète des applications et leurs organisations en France et dans le monde rdv sur le site appperf qui regroupe toutes les applications présentent sur les stores en France et dans le monde.
Il n’y a pas de chiffre officiel. Le site appperf présente en temps réels le nombre d’applications présente sur les stores en France et dans le monde. On estime à plus de 200 000 le nb d’applications vocales présentes sur les 2 plateformes.
En février 2021 le nombre d’applications vocales par pays était le suivant :
DE | IT | ES | FR | UK | US | |
ALEXA | 10888 | 4578 | 5653 | 3078 | 39212 | 70587 |
1368 | 928 | 1363 | 1540 | 23195 | 23240 |
Une application et est pas à proprement parler « intelligente».
Pour converser elle doit suivre une suivre un schéma conversationnel (dialog flow) et trouver ses éléments de connaissance dans des sources tierces.
L'intelligence artificielle est utilisée pour, pour comprendre les requetes de l'utilisateur et génerer une réponse vocale. On parle ici de NLP "Natural Language Processing"
IL y a 6 étapes pour repondre à une question d'un utilisateur. Les étapes 1,2 ,3,7, & 8 sont realisés par les enceintes connectées et utilisent L'IA de Google ou Amazon. Les étapes 4,5,6 sont réalisées par l'application vocale.
1/Invocation
Pour lancer une application vocale il faut l’invoquer avec un « nom d’invocation ». C’est le nom de l’action (Google) ou de la skill (Alexa).
On peut ajouter une question ou une requête au nom d’invocation
2/Captation
GOOGLE HOME / ECHO
Capte les sons avec ses micros et es envoie sur leurs serveurs.
3/speech to text
Le moteur de reconnaissance vocale retranscrit les sons en mots.
4/Extraction du sens
5/Schéma conversationnel ou dialog flow
recherche de la réponse
6/Calcul de la réponse
en fonction des paramètres et des règles de gestion
7/Text to speech
Création du message vocaleA partir du texte envoyé.
Envoie de la réponse au device
8/Réponse
Lecture de la réponse par ledevice
« le schéma conversationnel » défini l’organisation et les interactions pour que l’utilisateur puisse obtenir rapidement l’information qu’il recherche.
L’intention (ou intent) est ce que souhaite savoir ou faire l’utilisateur.
un prompts est « ce que dit l’assistant »
une uttérance est « ce que dit l’utilisateur »
Les slots/entités sont « les variables de la discussions »
Google & Alexa se basent sur des approches de type plateforme pour héberger des applications tierces. En pratique, il est généralement nécessaire de respecter les contraintes de développement imposées par le concepteur de l’assistant.
Toutefois, de bonnes pratiques de développement peuvent également être observées. Ci-dessous quelques bonnes pratiques recommandées par la CNIL.
• Être transparent et expliquer les différentes étapes du traitement
• Ne collecter que les seules données nécessaires à la réalisation de l’application.
• Vérifier que la collecte de données pour l’application ne déclenche pas d’autres collectes de données par le concepteur ou des tiers associés.
• Contrôler et sécuriser les données personnelles transmises de l’application à l’utilisateur par le biais de son assistant vocal
• Préciser de façon claire la chaîne de responsabilité impliquant le concepteur de l’assistant et le développeur de l’application.
• Utiliser au mieux les possibilités laissées par le concepteur du SDK pour délivrer une information claire et proposer des mécanismes d’authentification appropriés lors des premiers paramétrages