Revue de Vocalmatic

Vocalmatic est un service de transcription en ligne créé par une société canadienne Enactics Inc.

Selon son site, il existe pour «aider les personnes qui travaillent avec des enregistrements audio à gagner du temps en transcrivant leur audio et vidéo en texte».

Compte tenu du nombre d'outils de transcription en ligne disponibles, qu'est-ce qui rend celui-ci spécial?

Envie d'essayer Vocalmatic? Consultez le site Web ici

Plans et prix

Lorsque vous vous inscrivez à Vocalmatic, vous bénéficiez immédiatement de 30 minutes de temps de transcription, et lorsque cela est épuisé, des heures supplémentaires peuvent être achetées à partir de 15 $ pour une seule heure.

Plus vous achetez d'heures, moins elles coûtent, 90 à 100 heures ne coûtant en moyenne que 6 $ l'heure.

Ces prix sont pour des utilisateurs individuels, et Enactics propose des prix flexibles pour les entreprises où plusieurs utilisateurs ont besoin d'un accès, et les volumes seront vraisemblablement élevés.

Si vous avez un besoin groupé, le meilleur moyen de réduire les coûts est d'utiliser un pass journalier. Ceux-ci permettent une utilisation illimitée du service pendant une journée avec une limite de trois fichiers par heure.

Utiliser ces laissez-passer une seule journée coûte 15 $, trois jours 17 $ et sept jours coûte 25 $, et si vous pouvez organiser tout votre travail en blocs, c'est le moyen le moins cher d'utiliser Vocalmatic.

Conception

Même selon les normes de transcription en ligne, Vocalmatic est basique. Mais à l'inverse, cela le rend remarquablement simple à utiliser, même pour ceux qui ont des compétences informatiques limitées.

Le processus simple en quatre étapes commence par vous définir si vous avez de l'audio, de la vidéo ou exclusivement pour les clients américains, vous souhaitez appeler et faire transcrire directement vos mots.

La plupart des utilisateurs utiliseront des fichiers audio ou vidéo, et à l'étape 2, ceux-ci sont téléchargés sur le site Vocalmatic. Les types actuellement pris en charge incluent; fichiers audio mp3, m4a, mp4, flac, ogg, wav, aac, opus, oga, mogg, webm et wma.

La troisième étape consiste à définir la nationalité du locuteur et la quatrième étape consiste à dire comment vous aimeriez la sortie.

Les langues sont certainement une force de ce système, car il transcrit actuellement l'anglais, l'espagnol, le français, l'allemand, le portugais, l'italien, le néerlandais, le polonais, le tchèque, le roumain, le chinois (mandarin), le chinois (cantonais), le japonais, le philippin, le vietnamien, l'arabe , Persan, hindi, thaï, coréen, ourdou, turc, hébreu, grec, bulgare, russe, finnois, suédois, danois, afrikaans, amharique, arménien, azerbaïdjanais, indonésien, malais, bengali, catalan, basque, galicien, géorgien, gujarati , Croate, zoulou, islandais, javanais, kannada, khmer, lao, letton, lituanien, hongrois, malayalam, marathi, norvégien, serbe, ukrainien, cinghalais, slovaque, slovène, sundanais, swahili, tamoul et télougou.

Aussi impressionnante que soit cette liste, tous les accents et dialectes de chaque langue ne sont pas reconnus.

Une option de sortie par défaut utilise un formatage simple et le choix SRT est conçu pour ceux qui créent des sous-titres pour une vidéo.

Une fois ces sélections effectuées et le fichier fourni, s'il vous reste suffisamment de temps sur le compte, le système commencera à traiter le fichier en texte.

Un e-mail est envoyé pour annoncer que le système a démarré le processus et un autre est envoyé une fois qu'il est terminé.

Le temps que cela prend dépend entièrement de l'occupation des serveurs Vocalmatic, mais en général, nous avons constaté qu'il était proche de l'heure de l'enregistrement, ou peut-être un peu plus longtemps.

Un enregistrement de 19 minutes que nous avons traité a pris environ 28 minutes à rendre, mais d'autres parties plus courtes étaient proportionnellement plus rapides.

Une fois le fichier traité, vous pouvez aller dans un éditeur et voir comment il a fonctionné, et apporter quelques ajustements au formatage et au contenu.

Ce que ce système ne fait pas, c’est de fournir une mise en forme grammaticale. Il n’insère pas de retours chariot entre les phrases, quel que soit l’intervalle de parole, et ne met pas toujours les noms en majuscule.

Et, il place le code temporel entre les morceaux de transcription même lorsque vous ne l'utilisez pas pour la génération de fichiers SRT.

L'audio peut être lu dans l'éditeur de contenu, mais il ne tente pas de vous montrer où se trouve l'audio dans la transcription.

Une fois que vous êtes «satisfait» des résultats, le texte peut être exporté sous forme de document Word ou de fichier texte en mode par défaut, et de fichiers SRT si vous avez choisi ce mode de sortie.

Précision

Dans la FAQ Vocalmatic déclare: «Nous nous attendons à une précision de 80 à 90% sur un son clair. S'il y a beaucoup de bruit de fond ou si les gens parlent en même temps, la transcription peut avoir une précision inférieure à 10%. »

Eh bien, dans les tests limités, même des extraits de livres audio, avec l'audio le plus clair possible, nous n'avons pas réussi à atteindre ce niveau de précision.

Même lors de ses meilleures tentatives, il répète souvent une partie d'un paragraphe ou des mots, se trompe de nom, il a raison de la phrase précédente et jonche la transcription d'erreurs.

Lorsque les enregistrements ne sont pas parfaits, comme nos tests de discours historiques, les résultats peuvent être incompréhensibles.

Ce que nous avons trouvé le plus troublant, c'est que lorsqu'il a un problème avec un mot ou une phrase, Vocalmatic crachait au hasard des lettres uniques. En anglais, la langue que nous avons utilisée pour tester, une lettre «y» à elle seule n’est pas un mot, pas plus que «m», «k ou« t ».

Le fait que la sortie ne soit conforme à aucun dictionnaire ou à des formes grammaticales définies ne semble pas être un problème pour le logiciel. Il ne comprend pas non plus le contexte, car il a à plusieurs reprises interprété son fils comme «Soleil».

Lorsque vous prenez en compte tous les correctifs et que vous ajoutez correctement des points, des virgules et des majuscules, même les meilleures tentatives nécessitent un ajustement substantiel pour être considérées comme exactes.

Verdict final

Ce service n’est pas bon marché, rapide ou très précis.

La joie d'avoir 30 minutes de temps libre s'épuise de façon inquiétante rapidement, même si la solution est très accessible et très facile à utiliser.

Un avantage du temps libre dont bénéficie un client potentiel est qu'il vous permet de télécharger un exemple des enregistrements que vous aurez probablement besoin de transcrire et de voir comment cela fonctionne.

Ce n'est que s'il renvoie un texte qui représente généralement ce qui a été dit dans l'audio que nous continuerons, mais essayez d'autres options avant de payer pour celle-ci.

Comparé à certaines des autres options, notamment Transcribe by Wreally, Trint et Happy Scribe, ce n'est pas assez précis pour valoir la dépense.

Peut-être que nous ne sommes pas gentils et qu'il est brillant pour transcrire le swahili, ou d'autres langues, mais uniquement sur la base de ses efforts avec l'anglais, nous choisirions autre chose.