Chaque outil de transcription cible un créneau spécifique et Sonix a choisi ceux qui enregistrent des réunions ou des présentations et ont ensuite besoin d'une version dactylographiée pour rechercher ou diffuser.
Par conséquent, il pourrait être tout aussi utile à un étudiant qu'à un dirigeant, en fournissant des transcriptions qui peuvent être facilement indexées pour référence future.
Mais pour réussir ces tâches, le logiciel doit être précis et abordable.
Sonix.ai est-il cet outil et un service en ligne peut-il concurrencer une application installée?
- Voulez-vous essayer Sonix.ai? Consultez le site Web ici
Plans et prix
Comme pour de nombreux services de transcription, le modèle de coût Sonix est basé sur le temps. Plus précisément, la durée de tout enregistrement que vous téléchargez sur le service à traiter, et le coût de cette ressource est de 10 USD par heure, si vous utilisez son service standard de paiement à l'utilisation.
Le coût par heure peut être réduit à 5 $ si vous vous inscrivez au service d'abonnement Premium pour 22 $ par mois pour chaque utilisateur. De plus, des remises sur volume sont disponibles pour les entreprises qui nécessitent plus de 100 heures de transcription par mois.
Le plan Standard a les fonctionnalités les plus basiques, et Premium en ajoute d'autres comme l'accès multi-utilisateur et le partage d'équipe. Et, Enterprise a tout ce que Premium offre avec beaucoup de frais administratifs supplémentaires et un modèle de support amélioré.
En ce qui concerne les services de transcription, Sonix est l'un des plus chers, et certainement pas quelque chose que la majorité des étudiants ou des utilisateurs à domicile pourraient raisonnablement se permettre.
Conception
Le site my.sonix.ai utilise un design exceptionnellement épuré et la création d'un compte est gratuite.
Au moment de la rédaction de cet article, il s'agit exclusivement d'un service Web et Sonix n'a pas d'application mobile pour capturer et envoyer au traitement des enregistrements audio.
Cependant, comme nous le verrons plus tard, il existe des moyens simples de contourner ce problème qui résout un peu le manque d'application mobile.
Le point de départ de toute tâche de transcription est le tableau de bord Sonix.ai, où vous pouvez voir l'audio déjà transcrit et en ajouter de nouveaux à traiter.
Étant donné que ce système a été conçu pour plusieurs utilisateurs, il comprend un système de dossiers virtuels pour organiser les transcriptions de la manière jugée appropriée.
En cliquant sur "télécharger", l'utilisateur accède à une page sur laquelle plusieurs fichiers peuvent être déposés dans le système, et si le compte dispose d'un crédit suffisant, ils peuvent alors être traités.
Tous les formats de fichiers audio standard sont pris en charge, y compris wav, mp3, mp4a, aiff, acc, ogg et wma, et vous pouvez également télécharger des structures d'emballage vidéo. La taille maximale du fichier est de 4 Go, donc avant de télécharger un gros fichier vidéo de résolution 4K, nous vous recommandons d'utiliser un autre outil pour diviser l'audio afin d'accélérer le téléchargement.
Un bon moyen d'accélérer le téléchargement est d'utiliser une installation de stockage dans le cloud comme Google Drive, One Drive, Box ou Dropbox et de la lier directement au compte. Vous pouvez également envoyer un e-mail au système à l'aide de Gmail, afin de créer un flux de travail plus élégant que de déposer des fichiers sur une page Web.
Cette automatisation est fournie via Zapier, ce qui permet une intégration beaucoup plus large si l'entreprise qui l'utilise a investi dans cette technologie pour connecter ses processus métier.
Une autre touche intéressante est que, avec le fichier audio ou vidéo, vous pouvez inclure une transcription existante, afin de terminer plus rapidement le processus et d'améliorer la précision.
Une autre touche intéressante est que, avec le fichier audio ou vidéo, vous pouvez inclure une transcription existante, afin de terminer plus rapidement le processus et d'améliorer la précision.
En raison de la nature du traitement basé sur le cloud, il est impossible de juger de la vitesse ou de la lenteur du traitement, mais Sonix.ai est relativement rapide d'après notre expérience. En règle générale, la transcription prend entre 10% et 20% du temps au fur et à mesure que l'enregistrement dure. Par conséquent, terminer un enregistrement de 10 minutes prend généralement moins de 2 minutes.
Vous n'avez pas besoin de suivre le traitement, car le système vous enverra une notification par e-mail lorsque le travail sera terminé, avec un lien vers la nouvelle transcription.
Une fois le fichier traité, vous pouvez l'ouvrir dans une page d'édition pour examiner les résultats, et également exporter le texte dans un large éventail de formats utiles, y compris ceux définis comme sous-titres par certaines applications.
Le nombre de langues et de dialectes pris en charge par le système est de 36, ce qui comprend plusieurs pays anglophones, français, cantonais, mandarin, portugais et espagnol, ainsi que toutes les langues communes d'Europe occidentale et orientale, ainsi que certaines langues asiatiques et arabes.
Enregistrements
Parallèlement au travail qui a été consacré à l'IA nécessaire pour interpréter les bruits que font les humains, la page Enregistrements représente probablement un effort de codage important ici.
Ici, l'audio et sa transcription associée peuvent être comparés et améliorés manuellement avec des détails sur les changements de locuteur et des corrections pour les interprétations erronées.
Pour toute personne travaillant sur une transcription pour peaufiner le texte, cette page fournit l'emplacement de la face du charbon. Il est logique que des efforts aient été consentis dans cette partie, car elle est très facile à utiliser et à suivre.
Pour tenter d'indiquer à l'utilisateur où il pourrait y avoir des problèmes, Sonix.ai codera en couleur le contenu pour mettre en évidence les sections pour lesquelles il est moins confiant. Cette fonctionnalité peut être utile, bien que Sonix.ai puisse faire des erreurs même dans les parties où il considère que la transcription a un statut «Très confiant».
Les meilleurs aspects de cette page sont la façon dont la lecture audio et le texte sont synchronisés de sorte que le fait de placer le curseur dans le texte déplace la position de lecture vers la même section.
Parallèlement à l'édition simple, il est également possible de mettre en évidence des sections dans différents styles et de prendre des notes pour accompagner la transcription.
Vous pouvez également modifier le code temporel, ce qui est particulièrement utile si l'enregistrement commence par une longue pause ou un préambule indésirable.
Précision
Sonix décrit Sonix.ai comme «le meilleur logiciel de transcription automatisé alimenté par une IA de pointe».
Compte tenu de nos tests, nous décririons ce produit comme étant fortement dépendant de la qualité de l’enregistrement et de nombreux autres facteurs qui ne peuvent pas être facilement contrôlés.
Lors du traitement de nos enregistrements vocaux historiques classiques, cela a été très difficile avec certains haut-parleurs, même s'ils nous semblaient clairs.
Ces résultats contrastaient nettement avec certains enregistrements plus simultanés, où la précision était acceptable mais à peine stellaire.
Nous avons conclu que l'approche adoptée par Sonix fait plusieurs hypothèses qui peuvent fonctionner ou non, selon le locuteur et la qualité de l'enregistrement.
Ce qui était fascinant, c'est que le service codera en couleur sa transcription en fonction de sa confiance dans ce qui est dit, et cette auto-analyse est très révélatrice.
Dans certaines circonstances, il identifie correctement qu'une section peut être suspecte, mais dans d'autres parties, il est convaincu que la section qu'elle a transcrite est totalement erronée.
Quelques problèmes courants semblent lui donner un coup de fouet, et l’un d’entre eux concerne les personnes qui ne parlent pas une prose grammaticalement parfaite. Dans un effort pour rendre leur discours plus direct, ils ont supprimé certains mots de leurs phrases, ce qui en fait un style plus dramatique. Lorsque ceux-ci sont transcrits par Sonix, il semble déterminé à rajouter ces mots pour qu'ils correspondent à son modèle de grammaire interne, plutôt qu'à ce qui a été réellement prononcé.
La transcription se lit mieux en tant que document, mais elle n’est pas vraiment représentative de ce qui a été dit.
Sonix est certainement meilleur lorsque la qualité de l'enregistrement et la clarté du haut-parleur sont élevées, comme nous l'avons prouvé avec un petit clip de Stephen Fry lisant Harry Potter. Mais il n’est pas possible de toujours avoir un tel contrôle sur la qualité du son, et il a quand même commis des erreurs avec ce test.
Les noms formels et les mots techniques ou les abréviations constituent un autre problème. Ces problèmes peuvent être résolus en les ajoutant au dictionnaire personnalisé, mais cela nécessite du travail pour permettre au système de mieux se rendre compte lorsque des noms ou des acronymes sont utilisés.
Pour ceux qui ont besoin d'un mot de transcription parfait, Sonix propose une sélection de transcripteurs professionnels associés qui peuvent travailler sur un enregistrement et résoudre ces problèmes, mais cela va quelque peu à l'encontre du but de la transcription traitée.
Sécurité
La sécurité de Sonix.ai se concentre sur les serveurs sur lesquels l'audio est traité et les transcriptions sont conservées.
Tout le trafic est chiffré à l'aide de TLS (Transport Layer Security) et une fois que les fichiers sont sur le serveur qui est protégé par plusieurs couches de pare-feu, la protection contre les intrusions et toutes les données sont entourées par le chiffrement côté serveur AES-256. Et la société promet que les employés n’ont pas accès aux enregistrements ou aux transcriptions à moins qu’une autorisation explicite ne leur soit accordée.
Le problème critique de cette approche est qu'un simple identifiant et un mot de passe peuvent tout contourner. Sonix.ai n'a pas d'authentification à deux facteurs et il ne dispose pas d'un journal facilement accessible indiquant qui accède aux fichiers et quand.
Du point de vue de la sécurité, cela pourrait bien être considéré comme une dépendance excessive sur l'intégrité de ceux qui utilisent le système pour ne pas partager les enregistrements avec d'autres personnes extérieures à l'entreprise ou conserver les fichiers potentiellement sensibles lorsqu'ils quittent l'entreprise.
En bref, la sécurité doit être améliorée et le suivi ou l'activité des utilisateurs doit être plus prioritaire.
Verdict final
Compte tenu du coût relativement élevé, nous nous attendions à ce que Sonix fonctionne mieux.
Peut-être n'avons-nous pas eu de chance avec nos choix de choses à transcoder, mais cela semblait toujours faire une quantité démesurée d'erreurs.
Du côté positif de cette équation, c'est rapide et c'est un système remarquablement facile à utiliser, même si nous vous recommandons d'exécuter quelques exemples d'enregistrements via cette solution avant de souscrire à un abonnement.
Le plus gros problème avec Sonix est le coût élevé, et même s'il s'agit du bon outil pour vos besoins particuliers, il existe des moyens moins chers de transformer l'audio en texte ailleurs.