Examen de la saisie vocale de Google

Il est de plus en plus courant d'utiliser la voix pour contrôler nos maisons et nos ordinateurs. Il y a dix ans à peine, demander à Alexa ou à Google Home de contrôler les lumières ou de commander un produit sur Internet pouvait sembler inhabituel, mais c'est maintenant la norme.

L'une des entreprises qui a le plus investi dans ce type de technologie est Google, qui permet à ses appareils Google Home et à ses systèmes Android d'accepter des commandes verbales et même de reconnaître le locuteur.

Aujourd'hui, nous allons voir comment ils ont associé cette technologie à leur plate-forme Google Docs et déterminer s'il s'agit d'une alternative viable aux autres solutions de voix-texte commerciales.

Tarification

Le logiciel est inclus dans Google Docs et est donc intrinsèquement gratuit. Tout ce dont vous avez besoin pour l'utiliser est un compte Google et un appareil mobile ou un ordinateur avec un microphone. Il s’agit d’une autre source de données que Google peut collecter, mais cela fait partie du prix du «gratuit» de nos jours.

Conception

Il est possible d'utiliser la voix pour la saisie sur Google Docs, la fonctionnalité s'appelle "Saisie vocale" et se trouve dans le menu Outils sur un document Google ou dans Google Slides. Il peut également être activé dans l'un ou l'autre endroit à l'aide de la touche de raccourci Ctrl-Shift-S.

Lorsque vous l'avez activé pour la première fois, vous êtes invité à autoriser l'accès au microphone pour docs.google.com.

Une fois que vous avez accepté qu'une petite boîte apparaisse avec un logo de microphone dessus, vous pouvez cliquer pour activer la saisie vocale. Celui-ci est ensuite remplacé par un symbole de microphone rouge à côté du document pour indiquer que le système est en mode d'écoute.

Avant d'activer la saisie vocale dans le panneau de commande, vous pouvez choisir une langue dans un menu, et comme il s'agit de Google, il y a beaucoup de choix. Et, vous pouvez également cliquer sur un point d'interrogation et recevoir de l'aide sur la façon d'utiliser le système.

Au fur et à mesure que ces systèmes fonctionnent, il s'agit d'une solution hautement condensée.

Google traitera ce que vous dites au mieux de ses capacités, et si le système ne sait pas exactement sur un mot, il le soulignera en gris. Ces mots «suspects» peuvent ensuite être cliqués et certaines alternatives fournies par le système.

Mais vous pouvez rapidement vous déplacer dans un document et résoudre les problèmes manuellement ou placer le curseur et donner un autre coup de main à la saisie vocale.

Si vous avez besoin de parler à une autre personne pendant que vous travaillez, vous pouvez demander à Google d'arrêter d'écouter, puis de reprendre ensuite.

Mais pour obtenir la pleine capacité de cette solution, il existe une longue liste de commandes à mémoriser qui peuvent copier, coller, se déplacer dans le document, insérer des tableaux et une myriade d'autres fonctions.

De plus, vous pouvez insérer des signes de ponctuation, mettre en forme le document et même insérer des hyperliens.

Mais, en tirer le meilleur parti suppose que vous puissiez vous souvenir des commandes ou avoir l'aide ouverte pour vous rafraîchir la mémoire.

Une liste est rapidement disponible en disant «Liste des commandes vocales», de manière pratique.

Langues

Là où de nombreuses solutions de voix-texte ne couvrent qu'un petit nombre de langues, Google en propose un nombre important. La liste définitive actuelle est:

Afrikaans, amharique, arabe, arabe (Algérie), arabe (Bahreïn), arabe (Egypte), arabe (Israël), arabe (Jordanie), arabe (Koweït), arabe (Liban), arabe (Maroc), arabe (Oman) , Arabe (Palestine), arabe (Qatar), arabe (Arabie saoudite), arabe (Tunisie), arabe (Émirats arabes unis), arménien, azerbaïdjanais, bahasa indonésien, basque, bengali (Bangladesh), bengali (Inde), bulgare Catalan, chinois (simplifié), chinois (traditionnel), chinois (Hong Kong), croate, tchèque, danois, néerlandais, anglais (Australie), anglais (Canada), anglais (Ghana), anglais (Inde), anglais (Irlande) , Anglais (Kenya), anglais (Nouvelle-Zélande), anglais (Nigéria), anglais (Philippines), anglais (Afrique du Sud), anglais (Tanzanie), anglais (Royaume-Uni), anglais (États-Unis), farsi, philippin, finnois, français , Galicien, géorgien, allemand, grec, gujarati, hébreu, hindi, hongrois, islandais, italien, italien (Italie), italien (Suisse), japonais, javanais, kannada, khmer, coréen, laotien, letton, lituanien, malayalam, Malaisie n, marathi, népalais, norvégien, polonais, portugais (Brésil), portugais (Portugal), roumain, russe, slovaque, slovène, serbe, cinghalais, espagnol, espagnol (Argentine), espagnol (Bolivie), espagnol (Chili), espagnol (Colombie), espagnol (Costa Rica), espagnol (Équateur), espagnol (El Salvador), espagnol (Espagne), espagnol (États-Unis), espagnol (Guatemala), espagnol (Honduras), espagnol (Amérique latine), espagnol (Mexique ), Espagnol (Nicaragua), espagnol (Panama), espagnol (Paraguay), espagnol (Pérou), espagnol (Porto Rico), espagnol (Uruguay), espagnol (Venezuela), sundanais, swahili (Kenya), swahili (Tanzanie), Suédois, tamoul (Inde), tamoul (Malaisie), tamoul (Singapour), tamoul (Sri Lanka), thaï, turc, ukrainien, ourdou (Inde), ourdou (Pakistan), vietnamien et zoulou.

C’est 119 langues, dont 13 formes arabes, 19 variantes espagnoles, 13 dialectes anglais et même quatre saveurs de tamoul.

Certaines langues incluses sont rarement prises en charge par les logiciels de dictée, comme le zoulou et l'islandais, en raison du nombre relativement faible de locuteurs.

La couverture linguistique est probablement la plus grande force de Google Voice Typing.

Enregistrements

Si cette solution présente une faiblesse, c'est qu'elle ne peut pas traiter facilement les enregistrements.

Bien qu'il ne soit pas impossible de faire cela, mais cela nécessite de patcher le système audio de l'ordinateur afin qu'il prenne la sortie destinée aux haut-parleurs et la dirige comme si elle provenait du microphone. Mais cela ne vous permet pas de différencier les différentes personnes sur les enregistrements, et cela pourrait interférer avec l'IA que Google utilise pour améliorer la précision verbale en apprenant comment vous parlez.

Si vous souhaitez transcrire des podcasts ou des interviews enregistrées, nous vous recommandons d'utiliser autre chose, car cet outil n'est pas conçu à cet effet.

Précision

Il est difficile de juger de la précision d’un système de traitement de la voix lorsque vous ne pouvez pas lui envoyer les mêmes enregistrements que d’autres produits ont convertis. Et quiconque utilise régulièrement Alexa ou Google Home sait que parfois il ne nous comprend pas, principalement à cause de sons parasites ou de discours incohérents.

Cela dit, lors des tests actifs que nous avons effectués, cet outil a généralement obtenu la plupart des mots corrects, ou le mot correct était rapidement disponible dans le menu des mots suspects.

Pour obtenir les meilleurs résultats, il faut un certain contrôle de la vitesse, du volume et du ton de la parole, ce qui vient sans aucun doute avec la pratique. De plus, le fait de pouvoir se souvenir de toutes les commandes spéciales peut réduire considérablement le nombre de modifications post-enregistrement nécessaires.

Selon vos attentes, la précision ici est acceptable. Il y a une cohérence dans ses interprétations qu'il a maintenue lors de nos tests. Nous ne pouvons pas prévoir à quel point cela fonctionne pour vous. Mais comme il est gratuit, cela ne vous coûtera rien d'autre que votre temps pour le déterminer.

Sécurité

Comme il s'agit de Google, le modèle de sécurité est le même que celui qui contrôle l'accès à tous les comptes Google. Cela va de la simple protection par mot de passe à une méthodologie plus raisonnable à l'authentification à deux facteurs (TFA).

Compte tenu du nombre de voleurs d'identité, ceux qui utilisent Google sans TFA courent un risque important de voir leurs comptes compromis.

Même cette option de sécurité a ses limites, mais elle vaut mieux qu'un simple mot de passe.

Pour ceux qui ne sont pas suffisamment paranoïaques, nous vous recommandons vivement de vous rendre sur https://myactivity.google.com/myactivity

Et vous verrez ce que Google collecte quotidiennement sur vous, et cela peut inclure des enregistrements de vos commandes vocales.

Verdict final

Cela pourrait être un examen plus long si ce logiciel offrait plus de fonctionnalités, mais ce n'est pas le cas.

En tant que solutions de voix-texte, celle-ci n'est pas compliquée, mais elle a suffisamment de fonctionnalités pour être vraiment utile.

D'autres solutions sont conçues pour gérer la transcription des conversations entre plusieurs personnes, alors que cela a été conçu pour gérer une seule personne qui parle de manière contrôlée et précise.

Son utilisation suppose que vous êtes heureux d'utiliser Google et Google Docs, même si ce n'est pas la destination ultime du texte que vous saisissez.

Ce n’est pas une corvée de copier une dictée collée de Google Docs dans une autre application, et vous aurez une copie cloud à référencer si vous en avez besoin.

Certains utilisateurs ont naturellement des problèmes pour nourrir l'appétit insatiable de Google pour les données utilisateur, et ce mécanisme est une autre source de données à grignoter.

Si vous en avez envie, vous n'utiliserez pas Google Voice Typing ou quoi que ce soit de Google.

Pour ceux qui sont prêts à accepter ce que Google pourrait savoir à leur sujet, la solution de dictée vocale de Google Docs est suffisamment capable pour une utilisation générale, surtout si vous n'avez besoin de cette fonctionnalité qu'occasionnellement.

Articles intéressants...