Proyectos

Transcripción de nombres de municipios de texto a audio.

Por febrero 4, 2019 julio 16th, 2019 No Comments

Objetivo general

Crear un corpus de entrenamiento vía crowdsourcing para la identificación automática de las menciones de los municipios valencianos en los informativos de la cadena pública valenciana À punt.

Para alcanzar este objetivo vamos a entrenar una máquina que analice el audio de los informativos e identifique cuando un municipio es nombrado. Para entrenar esta máquina necestimos contar con la pronunciación de cada municipio con distintos acentos.

Objetivos específicos

– Desarrollo de un chatbot en Telegram para transcripción colaborativa de texto a audio de los nombres de municipios valencianos.
– Implementar una API de acceso a los nombres oficiales de los municipios de la Comunitat Valenciana.
– Diseño de una interfaz conversacional centrada en las personas usuarias.

Resultado

Puede accederse al chatbot de Telegram a través del enlace http://t.me/pronunciaelpoblebot o buscando directamente en Telegram «pronunciaelpoble».

El funcionamiento es muy sencillo:

  1. Descargar y ejectuar Telegram.
  2. Buscar «pronunciaelpoble».
  3. Pulsar el botón Iniciar.
  4. Pulsar o enviar el comando /municipi.
  5. Grabar y enviar el audio leyendo el nombre del municipio que aparece en pantalla.

Se pueden grabar tantos municipios como se quiera.