Audio file transcription in Spanish / Transcripción de archivos de audio

Audio file transcription in Spanish / Transcripción de archivos de audio

Closed - This job posting has been filled.

Job Description

(See below for English description)

Tenemos archivos de audio. Necesitamos transcribirlos. El audio puede contener mensajes en estilo texto o mensajes de contestadores automáticos, pero también comandos de voz dirigidos a un aparato como por ejemplo "cambiar para canal cuatro", etc.

El idioma de interés es Español. Si el audio efectivamente está en español, debe ser transcripto, y no traducido. Si el audio está en otro idioma, entonces no debe ser transcripto, solamente etiquetado como idioma extranjero.

El trabajo consiste en:

1. Leer nuestra guía de transcripciones de 14 páginas, en inglés. La guía detalla las convenciones que seguimos, como por ejemplo:
a. Transcribir números por extenso, por ejemplo "uno tres dos" y no "132".
b. Transcribir muletillas como "eh".
c. Usar un corrector ortográfico para garantizar que no haya errores de dactilografía.
d. Usar etiquetas que especificamos para denotar habla en discurso de fondo ([.bs], del inglés "background speech"), habla en idioma extranjero ([.fo], del inglés "foreign"), etc.

2. Descargar una tanda de archivos de audio desde un servidor FTP o web o dropbox.com. Los archivos en su mayoría están en formato Microsoft WAVE.

3. Si el audio no está en español, no hacer el paso 4 (ver paso siguiente) pero sí etiquetar con "[.fo]" (o "[.fo english]", "[.fo italian]", etc., si se reconoce la lengua).

4. Si el audio está en español, transcribir el archivo de audio, agregando la transcripción como una línea en una hoja de cálculo.

5. Retornarnos el archivo con la hoja de cálculo y eliminar los archivos de audio que ya fueron transcriptos.

Este trabajo requiere habilidades básicas de manipulación de archivos para poder descargar y hacer seguimiento de los archivos que enviamos. También necesita rapidez y precisión de transcripción. Conocimiento de español es esencial. Habilidad para reconocer los diversos acentos en español (por ejemplo Caribeño, Rioplatense, Mexicano, Europeo etc.) es deseable.

El contenido de los archivos de audio y las transcripciones son confidenciales y no pueden ser divulgados o usados para otros fines diferentes al del presente trabajo.

======================

We have a set of audio files we need transcribed into text. The audio content may include text or voicemail style messages, voice commands to a machine such as "change to channel four," etc.

The target language is Spanish; if the audio is in fact in Spanish, it is to be transcribed, not translated. If the audio file is in any other language, then it does not have to be transcribed, only labeled as being in a foreign language.

The work to be done is:

1. Read our 14-page transcription guide. It explains the conventions we want followed, for example:
a. Spell out numbers, e.g. "one three two" instead of "132."
b. Transcribe filler words such as "um."
c. Use spell checker to be sure you don't have a typo.
d. Use tags we specify to denote background speech ([.bs]), speech in a foreign language ([.fo]), etc.

2. Download a batch of audio files from an FTP or web site or from dropbox.com. Files will usually be in a Microsoft WAVE format.

3. If the audio is not in Spanish, label it as "[.fo]" (or "[.fo english]", "[.fo italian]", etc, if you recognize the language), and skip step 4 below.

4. If the audio is in Spanish, transcribe the audio file, entering the text into a line of a spreadsheet.

5. Return the spreadsheet to us and delete the audio files.

This work requires basic file handling skills to download and keep track of the files we send. It also requires a combination of speed and accuracy. Knowledge of Spanish is required. Ability to recognize the different Spanish accents (e.g. Caribbean, Rioplatense, Mexican, European etc.) is a plus.

Contents of the audio files and transcriptions are confidential and may not be disclosed or used for purposes other than for this job.