Home Meilleur Bureau Meilleurs Services De Transcription

Meilleurs Services De Transcription

3
0
Meilleurs Services De Transcription

Pourquoi Vous Devez Nous Faire Confiance

Je suis un journaliste expert qui a mené plus de mille interviews ces dernières années. Bien que je transcris généralement mes fichiers audio d’entrevue de manière complémentaire et conservatrice (en tapant vite pendant que je joue et en rembobinant chaque phrase 100 fois en grognant au son de ma voix), j’ai essayé de nombreux choix différents. Les services de transcription se sont toujours distingués comme les meilleurs. Avec ce manuel, ainsi que des tests complets, j’ai lu les critiques existantes des services de transcription et consulté les forums pour localiser les choix couramment recommandés.

Qui Doit Trouver ça

Les professionnels et les amateurs qui souhaitent une version texte des enregistrements sonores – journalistes, étudiants, diffuseurs et extérieurs – peuvent bénéficier d’un service de transcription. Ces services peuvent réduire les heures passées à enregistrer manuellement une transcription, et ils permettent également de parcourir sans effort le contenu d’une réunion, de localiser un échantillon audio dans une immense bibliothèque de documents ou simplement de s’occuper de presque tout le travail de transcription. estimations. Rappelez-vous que nous avons analysé les choix de ce manuel presque entièrement avec les appels téléphoniques répertoriés avec le programme TapeACall. Il est possible qu’ils fonctionnent différemment avec différentes variétés de sons, comme les disques internes.

Les services de transcription basés sur l’IA sont une alternative beaucoup plus décontractée, beaucoup plus rapide et beaucoup moins chère que les services qui utilisent de vrais humains pour la transcription. Les meilleurs services d’IA ne sont pas idéaux, mais ils sont suffisamment vrais pour rappeler l’essentiel d’une liste et vous aider également à trouver une pièce particulière. Cela les rend utiles pour les hommes et les femmes qui souhaitent une approche visuelle pour mettre l’accent sur les interviews, comme les journalistes qui capturent beaucoup d’interviews, les élèves qui font des enregistrements occasionnels des cours, ou même les professionnels qui devraient garder à l’esprit le contenu d’une réunion. Les journalistes devraient également vérifier les citations indépendamment de quoi, il peut donc être judicieux de payer moins et de procéder à une assistance basée sur l’IA. Mais si vous choisissez le chemin de l’IA, vous voudrez passer du temps à nettoyer le texte.Faites passer les fournisseurs basés sur l’IA en faveur d’une agence utilisant de vraies personnes si vous prévoyez de publier une transcription entière ou si vous avez besoin d’un document texte entièrement précis à utiliser dans un cadre spécialisé.

Les meilleurs services de transcription humaine sont presque 100% vrais et ne se battent qu’avec une terminologie hautement spécialisée comme les noms de rue, ce qui les rend appropriés pour une personne qui veut un enregistrement spécifique de ce qui est indiqué dans un document sonore. Les podcasteurs qui ont besoin d’une transcription complète d’un événement, les professionnels qui souhaitent une liste complète d’une réunion à disperser dans une entreprise, ou même les journalistes préparant un très long article de questions-réponses pourraient découvrir qu’ils peuvent vous faire gagner énormément de temps en travaillant avec un transcripteur humain. . Soyez simplement prêt à payer beaucoup plus pour l’excès de précision par rapport aux solutions d’IA, et attendez quelques jours de délai d’exécution à moins que vous ne soyez prêt à payer plus pour obtenir des résultats plus rapidement.

Comment Nous Avons Choisi

Nous avons parcouru les forums fournis par des journalistes, des auteurs et des podcasteurs pour découvrir une sélection de services de transcription largement utilisés. Nous lisons également les témoignages de Poynter, TechRadar et PCMag. Pour choisir les solutions à vérifier, nous avons considéré que les critères suivants:

  • Lisibilité: l’élément le plus important dans le choix d’un service de transcription serait la lisibilité de la transcription résultante, nous avons donc évalué les échantillons pour la ponctuation et l’orthographe.Nous avons également recherché ensemble la précision autodéclarée des solutions ainsi que l’expertise d’autres personnes. L’un des services de transcription soutenus par l’homme, nous avons préféré des personnes qui promettaient d’être vraies à 99%. De nombreux services basés sur l’IA ne rapportent pas de précision, mais seule l’alternative que nous avons analysée promettait d’être vraie à 90% pour un son clair.
  • Délai d’exécution: les services basés sur l’IA nécessitent au maximum une ou deux minutes par minute de son soumis pour revenir à une transcription, mais les transcripteurs humains peuvent prendre des semaines pour envoyer une transcription. Si un retard prolongé perturbe votre flux de travail ou vous permet de manquer une échéance importante, une agence d’IA coûte beaucoup moins cher qu’une transcription précipitée de quelqu’un. Étant donné que nous avons regardé une si vaste sélection de délais d’exécution, nous avons considéré individuellement les délais annoncés pour les fournisseurs d’IA et les transcriptions de personnes réelles. Pour ces derniers, nous n’avons considéré que les services de transcription qui peuvent renvoyer un relevé de notes en une semaine, et nous avons particulièrement pris note s’ils garantissaient un délai d’exécution de plusieurs heures voire minutes.
  • Prise en charge du son compliqué: peu de fichiers son sont répertoriés dans un studio professionnel, par conséquent, les meilleurs services de transcription doivent être préparés ou capables de gérer le fond sonore, le dictionnaire et les accents. Bien que nous ayons analysé uniquement les enregistrements d’anglophones utilisant des accents français et américains, nous avons noté les langues et les accents que chaque service promettait de prendre en charge. Certains services, par exemple Temi, disent spécifiquement qu’ils n’encouragent pas les carrés ou les langues en dehors de l’anglais américain, tandis que d’autres, comme Trint, fournissent des transcriptions pour de nombreuses langues et couleurs. Nous avons mis en garde l’anglais américain avec ce manuel.
  • Editeurs de transcription: les meilleurs services maintiennent indéfiniment une base de données Internet de vos transcriptions. Ils vous fournissent également une zone dans le navigateur ou une application cellulaire où vous pouvez faire le travail facilement dans une nouvelle mise en page, en modifiant le texte, en écoutant la lecture sonore une fois que vous cliquez n’importe où dans le texte et en modifiant le taux du son. . Les fournisseurs basés sur l’IA sont si sujets aux erreurs qu’il est merveilleux de pouvoir intervenir et de modifier une transcription sur le site Web de l’agence. Puisque les transcripteurs humains sont vraiment vrais, nous n’avons pas considéré comme important pour tous ces fournisseurs d’ajouter autant de fonctionnalités d’édition en ligne.
  • Interface utilisateur: sites Web qui vous permettent de télécharger des fichiers musicaux de manière intuitive et rendent immédiatement le processus de transcription global plus agréable. Nous avons privilégié les services qui présentent des extras, comme inclure des horodatages ou choisir un délai d’exécution plus rapide, sur une seule page et afficher le prix de ces modules complémentaires. Nous avons ignoré les services qui obscurcissaient le prix jusqu’à ce que nous ayons passé une commande, nous ayons fait parcourir de nombreuses pages pour mettre un arrangement, ou avions besoin d’un look encombré.
  • Sécurité et confidentialité: bien que nous ne suggérons pas de télécharger des fichiers audio sensibles dans un service de transcription, nous avons examiné les politiques de chaque entreprise pour protéger les données de ses clients. Nous avons analysé le type de cryptage utilisé par les entreprises et si elles ont fourni des NDA, et nous avons recherché des mesures de sécurité supplémentaires qu’elles ont prises.

Comment Nous Avons Analysé

Depuis que nous avons découvert que la lisibilité était le facteur essentiel, nous avons analysé chaque service avec un assortiment de conversations et de degrés de qualité sonore. Nous avons écrit deux scripts basés sur des interviews réelles qui représentaient les différents types d’articles qu’un service de transcription fantastique devrait pouvoir gérer:

  • Notre «script de gestion» de 237 mots traitait des drones, comprenait un vocabulaire et des quantités communs, et se terminait par une série de phrases de pangrammes qui utilisent tous les sons et toutes les lettres de la langue anglaise. En outre, il a présenté une perturbation où un orateur a parlé à travers l’autre.
  • Notre «script de dictionnaire» de 172 mots comprenait du jargon sur les batteries, la physique des particules et les noms de décors.

Deux acteurs professionnels se sont répertoriés en train d’étudier également des scripts sur TapeACall, un programme d’enregistrement sur iPhone que les journalistes utilisent couramment. J’ai également listé une femme avec un accent français étudiant l’intégralité de ce script de gestion au sein de TapeACall. Nous avons fait quatre disques:

  • Script de contrôle (clair): les célébrités lisent le script du contrôleur de manière évidente et sans bruit de fond pour vérifier les meilleurs résultats possibles de chacun des services de transcription.
  • Script de contrôle (avec son de fond): Les 2 acteurs lisent le script du contrôleur tandis que les chansons jouées par des chiens aboient en arrière-plan pour vérifier la capacité des services à capter le son qui compte.
  • Script de contrôle (avec accent): la femme avec un accent français parcourt le script du contrôleur pour quantifier les solutions qui ont mieux fonctionné en utilisant des accents non américains.
  • Script de jargon (clair): Les célébrités lisent le script du dictionnaire de manière évidente et sans bruit de fond pour vérifier la façon dont les services géraient les mots impairs.

Lors d’une autre série de tests, nous avons inclus un autre échantillon sonore: nous avons répertorié une réunion avec le programme Voice Memos de l’iPhone, un exemple destiné à tester si les performances des solutions changeraient radicalement lorsqu’un document audio a été créé avec une application en plus de TapeACall.

Nous avons déposé tous les échantillons sonores dans chaque service de transcription et indiqué combien de temps il a fallu pour télécharger les échantillons, ainsi que notre expertise en parcourant l’interface utilisateur. Nous avons chronométré la durée de chaque service requis pour renvoyer la transcription finie et comparé la transcription du script initial pour juger de l’exactitude.

Nous avons mesuré la qualité des transcriptions de 2 manières. Pour commencer, nous lisons chaque transcription et évaluons à quel point il était simple de savoir par rapport aux transcriptions de tous les autres fournisseurs, un élément que nous avons étiqueté «lisibilité». Nous avons ensuite compté le nombre de phrases qui étaient correctes et divisé ce nombre par la quantité totale de mots pour créer un pourcentage qui reflétait la précision. Bien qu’il soit facile de tirer une conclusion avec ce pourcentage, il existe un écart important entre un service qui transcrit les «batteries» par «batterie» et celui qui transcrit les «batteries» par «basket». Ainsi, bien que la précision brute soit cruciale, nous avons évalué la lisibilité comme étant encore plus significative.

Nous avons également répertorié le coût total de chaque transcription et analysé l’éditeur de chaque agence pour déterminer à quel point il était facile (ou difficile) de travailler avec. En fin de compte, nous avons évalué pour voir si chaque agence fournissait des sélections utiles telles que des horodatages, la capacité d’ajouter des titres et également un endroit pour soumettre des mots de langue.
Pour plus de documents, il existe une énorme différence de coût entre notre assistance AI préférée, Temi, et notre précieux fournisseur de personnes réelles, GoTranscript.

Temi facture 25 centimes par minute de son téléchargé, établissant un lien vers l’alternative la moins chère que nous avons analysée (à part Otter et YouTube, cela peut être gratuit mais extrêmement incorrect). La version illimitée basée sur un abonnement de Trint n’est plus économique que dans le cas où vous téléchargez au moins 240 minutes de son par mois. L’algorithme supportant Temi ne se soucie pas de la complexité des chansons, ou alors le prix d’achat est toujours exactement le même, peu importe tout ce que vous soumettez. Les services de transcription humaine, quant à eux, commencent à 80 cents par moment et évoluent en fonction de la complexité sonore et des fonctionnalités supplémentaires. Temi a pris entre cinq et deux minutes pour réunir chaque transcription, il vous a donc fallu deux minutes pour transcrire chaque minute de son. Il existe des alternatives humaines coûteuses qui peuvent renvoyer un document en quelques heures,mais de nombreux fournisseurs non-IA – comme notre sélection, GoTranscript – nécessitent au moins quelques jours pour réussir.

Temi avait le deuxième meilleur éditeur que nous avons essayé en fonction de notre capacité à tester et à corriger les erreurs. Trint et Rev partagent le même éditeur, que nous avons évalué comme notre favori car il semblait plus agréable, bien qu’il n’ait pas de fonctionnalités supplémentaires. Le site de Temi stocke tous vos transcriptions indéfiniment et vous permet de les éditer dans un navigateur Internet, vous permettant de travailler avec le texte et le son exactement au même moment. Nous préférons cela à la disposition de quelques autres solutions, qui vous permet d’éditer du texte dans un enregistrement de logiciel de bureau et de contrôler individuellement un lecteur audio. Avec Temi, vous pouvez cliquer n’importe où dans la transcription pour écouter l’audio de cette section et taper vos propres corrections. Vous pouvez ralentir la lecture du son, appuyez sur un bouton pour reculer de cinq moments.L’interface fournit également des outils de surlignage et de texte frappant. Lorsque vous avez terminé, vous pouvez télécharger la transcription sous forme de PDF, de document Word ou de document texte, ou d’en discuter par e-mail ou par lien hypertexte.

Le processus de paiement et de téléchargement de Temi est rapide et compact. Vidéo: Signe Brewster

Temi a connu la deuxième période de téléchargement ordinaire la plus rapide de certaines des solutions que nous avons testées. Vous avez deux pages à parcourir: une page Web de téléchargement ainsi qu’un site de paiement, dont aucun ne nécessite de soumettre des informations supplémentaires concernant le fichier. L’interface utilisateur est propre et moderne, donc le téléchargement de fichiers et l’édition des transcriptions sont intuitifs.

Temi déclare qu’il stocke et transmet des données avec le cryptage TLS 1.2, que nous pensons être très protégé, et vous pouvez demander un accord de non-divulgation. Temi déclare qu’aucun humain ne visualise vos informations si vous ne discutez pas d’un lien pour vos transcriptions. Vous pouvez même choisir de supprimer les fichiers texte et audio du site Web dès que vous les avez téléchargés; nous vous recommandons de le faire dans le cas où vous considérez qu’un enregistrement est sensible.

Des Défauts Mais Peut-être Pas Des Dealbreakers

Temi ne vous permet pas de soumettre les titres des orateurs ou le jargon à l’avance (bien que vous puissiez les éditer après coup en utilisant l’application d’édition de l’organisation), une fonctionnalité que d’autres services fournissent pour améliorer leurs transcriptions. De plus, cela ne sauvegarde pas les conseils de paiement; dans nos évaluations, il nous a fallu renvoyer ces détails à chaque fois que nous téléchargions un document sonore. Une solution de contournement serait d’utiliser PayPal ou de précharger vos comptes avec de l’argent, ce qui vous permettra de regarder plus rapidement. Mais, même lorsque nous devions saisir à nouveau les informations de carte de crédit, passer par la procédure de paiement et de téléchargement nous a pris un moment – comme notre expertise avec tous les services supplémentaires que nous avons examinés. Vous pouvez même télécharger de nombreux documents simultanément pour réduire le nombre de fois que vous souhaitez extraire.

Positions de lisibilité (fournisseurs soutenus par l’IA par rapport à notre sélection humaine)

Trint Les abonnements commencent à 48 € / mois GoTranscript (notre choix de transcription humaine)
Contrôle Jargon Fond d’écran Accent
Temi (AI) 4 4 4 3
Loutre (AI) 6 6 6 5
Trint (AI) 5 5 5 4
GoTranscript (humain) 1 deux deux 1

Temi a produit des transcriptions qui étaient toujours les plus simples à lire l’une des options d’IA que nous avons analysées. Dans ce tableau, « 3 cm indique le meilleur support pour la lisibilité, et » 15 cm signifie le pire.

Les défauts supplémentaires de Temi sont typiques de chaque support basé sur l’IA – le seul moyen d’éviter ces problèmes est de couvrir beaucoup plus pour qu’un individu effectue sa propre transcription. Pour commencer, bien que Temi ait battu d’autres fournisseurs basés sur l’IA en termes de lisibilité et de précision, il a renvoyé des transcriptions pleines d’erreurs. Vous devez traiter Temi comme un moyen qui vous aidera à trouver un emplacement particulier dans un enregistrement sonore ou à vous souvenir du contenu total, et encore moins d’un service qui prépare parfaitement les citations pour la publication.

Comme les autres fournisseurs d’IA que nous avons essayés, Temi se débat spécifiquement avec des accents sonores. Comme il n’affirme pas le support des carrés ou des langues en dehors de l’anglais américain, nous n’avons pas été surpris de le voir se battre avec tout l’accent de notre locuteur. Si vous souhaitez une transcription pratiquement idéale d’un document avec des intervenants en surbrillance, nous vous recommandons de payer pour les services de transcription effectués par un vrai homme.

La détection des haut-parleurs et l’horodatage de Temi sont mauvais, et c’est une tendance que nous avons constatée dans tous les services d’IA. Il a renvoyé nos transcriptions sous la forme d’un seul paragraphe crédité au «Président 1», bien que trois de ces documents soumis comprenaient deux orateurs. Ses transcriptions possèdent un premier « 0

Transcriptions Très Précises De Personnes Réelles: GoTranscript

En plus super