Los lingüistas especializados en fonética suelen analizar los sonidos del habla mediante espectrogramas. Los espectrogramas son útiles para el análisis lingüístico porque te permiten ver múltiples señales del habla simultáneamente. Por ejemplo, puedes ver las frecuencias de los componentes, los pulsos glotales, el voicing, los formantes vocálicos y el lugar de articulación, todo en un solo espectrograma. Con un poco de práctica, puedes incluso estimar lo que dice un hablante simplemente leyendo el espectrograma.
Por muy valiosos que sean los espectrogramas, al principio pueden resultar un poco abrumadores. Para entender lo que ocurre en un espectrograma, necesitas algo de información básica.
Un espectrograma es un gráfico de las frecuencias componentes de una onda sonora a lo largo del tiempo. Las frecuencias componentes son la gama de frecuencias presentes en el sonido.
Para aclararlo, cuando oyes un sonido, en realidad estás oyendo un montón de frecuencias diferentes apiladas unas sobre otras. Estas frecuencias apiladas son los componentes de la onda, y el componente más bajo es el tono que oyes (también llamado frecuencia fundamental o F0).
Fig. 1 - El espectrograma muestra el tiempo en el eje x, la frecuencia en el eje y y la amplitud como diferencias de color u oscuridad.
Un espectrograma muestra el tiempo en el eje x y la frecuencia en el eje y. Esto significa que la parte inferior del espectrograma es la frecuencia más baja, y la parte superior es la frecuencia más alta. Moverse de izquierda a derecha en el espectrograma representa avanzar en el tiempo.
Un espectrograma también muestra una tercera dimensión: la amplitud (volumen). Las diferencias de amplitud se muestran como diferencias de color u oscuridad en el espectrograma. Las líneas más oscuras son frecuencias con mayor amplitud, mientras que las zonas más claras son frecuencias con menor amplitud.
Espectrograma Vs. Espectro
La palabra espectrogramaprocede de la palabra espectro .
Un espectro es un gráfico de los componentes de una onda en un momento dado.
Puedes pensar en un espectro como una única instantánea de un espectrograma. Si quieres pensarlo de otra forma, un espectrograma consiste en montones y montones de espectros alineados unos junto a otros. Cada gran "pico" visible en el espectro es una de las líneas horizontales más oscuras visibles en el espectrograma.
Fig. 2 - Un espectro es como un corte de un espectrograma colocado de lado, con la frecuencia en el eje x y la amplitud en el eje y.
Ejemplos de espectrogramas
Hay dos tipos de espectrogramas: los de banda ancha y los de banda estrecha.
Espectrograma de banda ancha
El tipo más común de espectrograma utilizado para el análisis es el espectrograma de banda ancha. Este tipo de espectrograma tiene un aspecto más "borroso", con muchas líneas verticales. En el habla, estas líneas verticales representan pulsos glóticos : la apertura y cierre repetidos de la glotis. Estos pulsos glóticos representan la sonoridad de los sonidos del habla. Un espectrograma de banda ancha te ayuda a ver cómo cambia un sonido a lo largo del tiempo.
Para ver un espectrograma de banda ancha en tu software de análisis, ajusta la "longitud de ventana" a 0,005 s.1
Espectrograma de banda estrecha
Un espectrograma de banda estrecha parece una serie de finas rayas horizontales, algo así como un filete de pescado. Estas finas rayas son los componentes de la onda. En un espectrograma de banda estrecha, es fácil ver las diferencias de amplitud entre los componentes individuales.
Para ver un espectrograma de banda estrecha, ajusta la "longitud de la ventana" a 0,05 s, o incluso a 0,5 s.1
Fig. 3 - El mismo clip de audio tiene un aspecto diferente en un espectrograma de banda ancha que en uno de banda estrecha. El gráfico sobre el espectrograma es la forma de onda del sonido.
Análisis del espectrograma
Es posible estimar lo que dice una persona con sólo mirar el espectrograma del enunciado. Dentro de un rato practicarás un poco con esto. Mientras tanto, aquí tienes algunas señales que buscan los lingüistas al analizar un espectrograma.
Cuando veas varias rayas horizontales oscuras en el espectrograma, probablemente estés ante una vocal. En un espectrograma de banda ancha, también verás líneas verticales que representan pulsos glóticos durante una vocal.
Cuando el espectrograma es más claro y no muestra rayas claras, probablemente estés ante una consonante.
Las secciones aleatorias y "borrosas" de un espectrograma suelen indicar fricativas, como [f, v, s, z, ʃ, ʒ, h].
Una línea oscura en la parte inferior del espectrograma durante una consonante indica vocalización. La verás en consonantes sonoras como [b, d, ɡ, m, n, ŋ, l, v, z]. Si no ves esta línea, probablemente estés ante una consonante sorda como [p, t, k, f, s, θ, ʃ].
Durante una consonante, una zona muy oscura en la parte superior del espectrograma probablemente indica una sibilante; se trata de palabras con sonido s, con un ruido fuerte a alta frecuencia, como [s, ʃ, ʒ].
Cuando parte del espectrograma se parece a una vocal pero contiene menos rayas horizontales, más claras, puede que estés ante una aproximante como [w, ɹ, l, j].
Estas señales no lo dicen todo sobre un enunciado, pero pueden ayudarte a hacer conjeturas.
Las vocales en un espectrograma
¿Recuerdas esas rayas horizontales oscuras que ves en el espectrograma durante las vocales? Esas rayas son los formantes de la vocal. Los valores relativos de los formantes te ayudan a determinar el lugar de articulación de la vocal, o la posición del tracto vocal al producir la vocal. Los formantes más relevantes para el análisis lingüístico son los tres primeros formantes: F1, F2 y F3.
Fig. 4 - Las líneas rojas de este espectrograma indican los formantes de las vocales.
El formantemás bajo, F1, indica inversamente la altura de una vocal. Cuanto más bajo es el F1, más alta es la vocal. F1 es la línea oscura más cercana a la parte inferior del espectrograma. Las vocales altas son sonidos como [i], como en abeja u oveja, o [u], como en sopa o azul. Estas vocales tendrán el valor F1 más bajo. Las vocales bajas son sonidos como [a], como en caja o fiesta. Estas vocales tendrán el valor F1 más alto.
Laaltura de la vocal se refiere a la altura de la lengua en la boca al producir una vocal. Si prestas atención a la posición de la boca, puedes notar que la lengua está más alta cuando dices oveja que cuando dices tienda.
El siguiente formante, F2, te indica lo atrás que está una vocal. Cuanto más bajo sea el F2, más atrás estará la vocal. Las vocales más anteriores son sonidos como [i] y [e], como en plato. Las vocales posteriores son sonidos como [u] y [o], como en polo u orden. Tienen el valor F2 más bajo.
La parte posterior serefiere a la posición horizontal de la lengua al producir una vocal. Si dices la palabra bota, notarás que tu lengua está empujada hacia la parte posterior de la boca y que la parte posterior de la lengua es la que lleva la mayor tensión. Compáralo con la palabra remolacha, en la que tu lengua está empujada hacia delante y la parte delantera de tu lengua está tensa.
Esta tabla resume los valores relativos F1 y F2 de los cinco sonidos vocálicos presentes en la mayoría de las lenguas.
Vocal
Valor F1
Valor F2
i (frente alta)
bajo
alto
e (frontal medio)
medio
alto
a (medio bajo)
alto
medio
o (espalda media)
medio
bajo
u (espalda alta)
bajo
bajo
El siguiente formante más alto es F3. El F3no te dice mucho sobre la mayoría de las vocales, pero desempeña un papel único en las vocales de color r. Los sonidos R, como en la pronunciación americana general de pájaro, tienen un valor F3 muy bajo en comparación con otros sonidos. Esto hace que estos sonidos sean fáciles de detectar en un espectrograma.
Puedes observar que en un espectrograma aparece una cuarta línea de formantes. Los formantes más altos, como F4, F5, etc., aparecen en los sonidos del habla. Sin embargo, estos formantes no revelan tanto sobre los sonidos del habla como F1-F3 y no suelen tenerse en cuenta en el análisis lingüístico.
Por último, las transiciones de formantes pueden ayudarte a identificar el lugar de articulación de las consonantes vecinas. Los formantes de una vocal cambian cuando el hablante pasa de una consonante a la siguiente. La dirección de estos cambios de formantes puede ayudarte a determinar dónde se producen las consonantes. Por ejemplo, pasar de una vocal a un sonido [k] daría lugar a una F2 ascendente y una F3 descendente (esto se denomina "pellizco velar" en un espectrograma).
Práctica de lectura de espectrogramas
Ahora vamos a practicar un poco el análisis de un espectrograma. Todos los espectrogramas de ejemplo de esta explicación han visualizado el mismo enunciado. Amplía el primer cuarto del enunciado: ¿qué ves?
Este espectrograma comienza con un largo segmento que sólo contiene una barra de vocalización. Esto indica una consonante sonora que puede mantenerse durante mucho tiempo. Tampoco hay ruido fuerte aleatorio, por lo que probablemente no se trate de una fricativa. Algunos candidatos probables son [m, n] o [l].
El siguiente segmento parece más fuerte, por las grandes secciones oscuras. También puedes ver pulsos glóticos y formantes visibles. Esto parece una vocal. F1 parece bastante baja, y F2 es muy alta en comparación con F1. Probablemente se trate de una vocal anterior relativamente alta.
El siguiente segmento sigue teniendo formantes y pulsos glotales visibles, pero es mucho más bajo. Esto indica que se trata de una aproximante. F2 y F3 están muy juntos en este enunciado, pero está claro que ambos descienden hasta un punto bajo en este segmento. Esta F3 baja es característica de un sonido r.
El último segmento se parece mucho al segundo. Esto sugiere que se trata de una vocal con un lugar de articulación similar al de la vocal anterior.
Has hecho algunas conjeturas: ¿qué palabra estás viendo aquí? Resulta que este espectrograma muestra a un hablante diciendo la palabra ¡María!
Intenta repetir este análisis con el resto de los enunciados para practicar un poco más. Puedes ver la respuesta a continuación.
Fig. 6 - Los segmentos de A María le encantan las frambuesas, anotados tanto en alfabeto latino como en alfabeto fonético internacional.
Este espectrograma muestra a un hablante diciendo ¡María ama las frambuesas!
Espectrograma - Puntos clave
Un espectrograma es un gráfico de las frecuencias componentes de una onda sonora a lo largo del tiempo. Las frecuencias componentes son la gama de frecuencias presentes en el sonido.
Hay dos tipos de espectrogramas: los de banda ancha y los de banda estrecha.
Un espectrograma de banda ancha te ayuda a ver cómo cambia un sonido a lo largo del tiempo, mientras que un espectrograma de banda estrecha te ayuda a ver las diferencias de amplitud entre los componentes.
Las rayas horizontales oscuras de un espectrograma representan los formantes de una vocal.
Las señales visibles en un espectrograma no lo dicen todo sobre un enunciado, pero pueden ayudarte a hacer conjeturas.
Referencias
Boersma, Paul & Weenink, David (2022). Praat: hacer fonética por ordenador [Programa de ordenador]. Versión 6.2.23, recuperada el 8 de octubre de 2022 de http://www.praat.org/
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.