A peine démocratisés dans les smartphones, les progrès de la technologie de reconnaissance vocale sont peut-être en train de se faire dépasser. En effet, ce type d’interface a le défaut de ne pas être silencieux. Pourtant, les ergonomes du travail y voyaient un moyen de s’affranchir du clavier et de la souris dont l’usage prolongé génère des troubles musculosquelettiques. Qu’ils en soient rassurés ! En effet, des chercheurs du Massachusetts Institute of Technology (MIT) développent un nouveau système appelé AlterEgo qui permet aux utilisateurs d’ordinateurs et de smartphones de parler à leurs machines… sans parler ! Et de les écouter sans utiliser leurs oreilles ! Au premier coup d’œil, le casque AlterEgo n’a rien de la combinaison familière d’un écouteur et d’un microphone. L’appareil prend la forme d’une courbe en plastique blanc plutôt imposante, partant de l’oreille du porteur et s’enroulant le long de la mâchoire jusqu’au menton.
Captation des signaux neuromusculaires et transmission osseuse du son
Pourtant, cet engin se base sur une technologie assez sophistiquée. À l’intérieur de l’AlterEgo se trouvent des micro-électrodes qui scannent la mâchoire et le visage à partir de signaux neuromusculaires produits lorsque le porteur pense à verbaliser des mots sans les prononcer à haute voix. C’est ce qu’on appelle la subvocalisation. Cette machine agit comme un microphone pour un ordinateur mais sans capter aucun son. En parallèle, elle se conduit également comme un casque audio à conduction osseuse qui transmet les sons de l’ordinateur à l’utilisateur directement à l’oreille interne via les os de la mâchoire et du crâne. La communication avec un ordinateur ou un smartphone devient donc silencieuse et complètement privée. Par conséquent, elle ne gêne en rien les collègues environnants. « La motivation était de construire un dispositif d’intelligence artificielle de réalité augmentée, explique Arnav Kapur, chef de projet AlterEgo au MIT. Puis nous nous sommes dit que nous pourrions avoir une plate-forme numérique qui fusionne l’humain et la machine, une sorte d’extension interne de notre propre cognition. »
Une précision de 92%
Au passage, l’interface d’AlterEgo pourrait débarrasser les salariés des codes d’accès, de la dactylographie et, plus généralement, de l’addiction au smartphone et à ses applications. Reste que la subvocalisation digitale en est encore à ses balbutiements. Pour comprendre comment concevoir le casque AlterEgo, l’équipe du MIT a utilisé un réseau de 16 électrodes disposées sur différentes parties d’un ensemble de visages de volontaires pour trouver les meilleurs signaux neuromusculaires. Ensuite, les chercheurs leur ont demandé de subvocaliser une série de mots quatre fois de suite. L’équipe a constaté que seulement quatre électrodes sont réellement nécessaires. Ce qui rend le dispositif moins encombrant. Actuellement, les algorithmes utilisés fonctionnent sur un vocabulaire d’environ 20 mots pour une série de tâches limitées. Une fois les mots subvocalisés, un réseau de neurones fait passer les données à travers une série de nœuds de traitement simples qui cherchent des corrélations entre les signaux neuromusculaires et des mots spécifiques. Des tests réalisés sur dix personnes, qui avaient passé 15 minutes à accorder le prototype à leur neurophysiologie et utilisé l’interface pendant 90 minutes pour effectuer des exercices informatiques, ont révélé une précision de 92%. Un rendement pourrait être amélioré à condition de disposer d’un plus grand nombre de données afin de mieux entraîner la machine.
Erick Haehnsen
Commentez