6 de noviembre de 2007

Culturilla General: Sintetizadores de Voz

En la actualidad se distinguen varios grupos de sintetizadores:
Basados en formantes: Sintetizadores que producen la onda sonora a partir de un
modelo acústico variando parámetros físicos como el pitch, sin intervención en ningún
momento de segmentos reales de voz humana.
Este tipo de sintetizadores tienen sentido en condiciones muy restrictivas de hardware
(p.e., sistemas embebidos), pero en general no son usados puesto que producen una voz
completamente robotizada.

Concatenativos: Estos sintetizadores se diferencian de los anteriores en que generan la
voz artificial enlazando segmentos pregrabados de un locutor humano. Dentro de esta
técnica existen diversas variantes, entre las que se encuentran los sintetizadores basados
en “difonemas” cuya unidad mínima es la concatenación de cada par de fonemas, que
son grabados y almacenados en una base de datos, y “sintetizadores basados en
selección de unidades”, que también registran una base de datos de segmentos
pregrabados, pudiendo encontrar desde fonemas simples hasta oraciones completas.

Articulatorios: Este tipo de sintetizadores convierte cadenas de texto en descripciones
fonéticas, ayudado por un diccionario de pronunciación, reglas de caracteres-sonidos,
ritmo y modelos de entonación. Posteriormente transforma las descripciones fonéticas
en parámetros de articulación de bajo nivel para el sintetizador que son usados para
generar un modelo de articulación vocal humano produciendo una salida conveniente
para los dispositivos de salida de audio.

http://www.freesoftwareworldconference.com/comunicaciones/sintetizador%20_voz.pdf

No hay comentarios:

Publicar un comentario

Los blogs se alimentan de comentarios; y el mío está famélico.