Détection d’un répondeur lors des émissions d’appels par des robots.

 

Ce sujet n’est pas encore évoqué sur la toile en France en 2020 car pour arriver à cette problématique, il faut comprendre qu’il n’est pas toujours facile pour un robot de détecter que le robot s’adresse à un répondeur classique avec des touches DTMF ou pourquoi pas un autre robot ( dans le cas des secrétaires virtuelles que nous avons mis en place ).  Lorsqu’un humain décroche au téléphone, en général, il va parler mais de manière très courte : “Allô” ou “oui bonjour” en encore “qui est à l’appareil” ? etc… Quand au contraire c’est le répondeur qui se déclenche, on va avoir une plus ou moins longue tirade et la possibilité de pouvoir laisser un message à notre interlocuteur par la suite.

Comment détecter de manière efficace que nous avons à faire à un répondeur et une messagerie vocale ?
L’outil est adapté afin de comprendre la voix et la durée du premier message et son contenu et aussi l’environnement qui peut être bruité. On peut donc mesurer avec précision la durée de la parole de cette première interaction qui sera en générale plus longue qu’un humain.  On peut aussi détecter une petite tonalité ou BIP juste avant de pouvoir laisser un message. Ce signal repéré est un indicateur de poids  dans le choix du scénario pour clôturer la conversation.

il est possible de laisser un message par exemple mais là encore, on doit pouvoir l’enregistrer et il faut utiliser des petites ruses dont personne n’imagine l’existence. tout cela est préconfiguré dans notre plateforme afin de vous éviter ce type de question : Que faire quand on rencontre un répondeur ?
Nous profitons de nos moteurs de reconnaissance vocale pour détecter la tonalité du répondeur et de la transcription avant d’indiquer que vous pouvez laisser le message. Cela garantit que le message complet est remis avec succès ou bien de pouvoir relancer l’appel de manière automatique à un autre moment.

Plus de 70 % des appels inconnus sont redirigés vers des boites vocales car  les personnes n’aiment pas parler avec  des inconnus. Grâce au deeplearning et à la modélisation acoustique, les techniques du traitement du signal numérique permettent de savoir si une personne a réellement décroché. L’analyse des audios est toujours intéressante car elle permet d’enrichir les bases de connaissances sur la partie “répondeur” . La compréhension des spectres audios permet aussi de détecter d’autres échantillons sonores et bruits environnants : La télévision, le train,  la voiture pour ne citer qu’eux ou bien des oiseaux. Il est probable que des législations puissent dans le futur interdire une communication entre un robot et une personne en voiture par exemple.

 

On doit se méfier toutefois des faux positifs ou le robot penserait qu’il tombe sur un répondeur ou l’inverse. L’humain parfois décroche  mais ne parle pas immédiatement et attend ou bien il ne parle pas assez fort et il y a un long silence. On a calculé que tout se passe dans les première secondes de l’appel et que certains répondeurs sont impossible à détecter. Ce qui est le plus important c’est de pouvoir couper la conversation lorsque l’on comprend que c’est un répondeur qui répond ou bien une musique d’attente juste après la numérotation de l’appelé.

 

Dans le cadre des transferts d’appels il faut aussi imaginer des scénarios plus complexe dans le cas ou on tombe aussi sur un répondeur et donc il faut pouvoir revenir dans la conversation. je vous le dis : c’est complexe et les situations ne sont jamais identiques.