Software diseño y fabricación cajas acústicas

Software diseño y fabricación cajas acústicas

Abacus 2.0
AJ 2.0
AkAbak 2.1
BassBox Pro 6.0.20 / X.Over Pro 3.0.15
CAAD 4.1 
JBL Speakershop 1.0
LASIP 3.0
LDC 7
LEAP (Enclosure & Crossover Shop, FilterShop ) 5.1
Loudsoft:
FINE X-over
FINE Motor
FINE Cone
FINE Box

LoudSpeaker LAB 3.12 
Lsp CAD 6.20 pro 
Professional audio lab
Box designer gold edition
Acoustic box 4.0
SPL test pro
SpeaD & Reverse SpeaD 
Speak 2.5 
Speaker simulator 2.00 
Speaker workshop 1.06 
Speaker design 1.02 
Ulysses 2.33 
Unibox 4.07 

Shareware and freeware

Demo software

BOBINAS 1″ TITANIO

md-37.5mm 35.5mm buy two sizes models for titanium production of high-frequency copper clad aluminum wire voice coil, inner diameter of 37.5mm 35.5mm. resistance; 8om. standard power 90w to stage  professional speaker high frequency driver first sound film.

SD1.1-A tweeter Motor de Agudos

SD1.1-A tweeter Specifications top
Nominal impedance: 5Ω
Resonant Frequency: 1200Hz
Rated Power: 15W
Maximum power: 30W
Sensitivity (2.83v/1m): 91dB
Weight: 1.0kg
Voice coil diameter: 25mm
DC Resistance: 4.6Ω
Voice Coil Wire: Copper Clad Aluminum high temperature
Voice coil frame: Aluminum heat
Magnetic circuit type: shielded magnetic magnetic
Magnet material: ferrite High performance
Recommended Crossover:> 2000Hz

SD1.1-A for the Swans acclaimed SD1.1 new. Swans Home Theater Series is one unit. Germany’stop natural fiber using original spherical diaphragm vibration components, designed by the American engineers Swans, Swans in maintaining the original resonant frequency band energy SD1.1 suppression technology based on the substantial increase in the capacity of extended power tweeter unit high bandwidth, linear sound pressure to increase unit output range, which greatly improved the unit distortion in the high-power input, when the sound pressure output up to 96dB, total harmonic distortion at 2.5kHz above all less than 1%. Finite element simulation of high-strength die-cast aluminum panels, the appearance is very beautiful, low-distortion symmetrical magnetic circuit design, quality clean, round, maintaining the original flavor of the D series.

Especially for one-third of the treble frequency system.
Recommended crossover frequency> 2kHz crossover with 12dB ~ 24dB/oct.

Design: Swans Speaker systems, Inc. (USA)
Designer: Frank Hale

Q1R MOTOR AGUDOS

Q1R top Tweeter Specifications
Nominal impedance: 6Ω
Resonant Frequency: 1000Hz
Rated Power: 15W
Maximum power: 30W
Sensitivity (2.83v/1m): 89dB
Weight: 0.8kg
Voice coil diameter: 28mm
DC Resistance: 5.3Ω
Voice Coil Wire: Copper Clad Aluminum high temperature
Voice coil frame: Aluminum heat
Magnetic circuit type: shielded magnetic magnetic
Magnet material: ferrite High performance
Recommended Crossover:> 2500Hz

Treble is a system of soul, her tone, transient, texture, dynamic compression, distortion, among other factors often play a decisive role.
Based on the above factors, the course has introduced a reference-level unit – Q1, I believe her sweet and mellow tone, texture transcend worldliness and attain holiness, unmatched transient in the minds of many people left an indelible memory.


Technology continues to progress, the increasing pursuit of this classic prompted us to optimize the performance of all aspects of the speaker, in 2003 launched a Q1R!
– That classic is still the 28mm soft dome German sound film, the difference is the proportion of material formulations and surface improvement of the damping layer, mellow sound more natural, transient, texture, resolution is to reach another level of state .
– Finite element simulation and optimization symmetrical shielded magnetic magnetic, power surge and more uniform; with the distortion of the magnetic structure of the low harmonic distortion can be effectively reduced; magnetic design that is compatible with a wider scope.
– For lower distortion and better prevent dynamic compression, using a modified cavity design, the use of two cavities, middle catheter connected, in two different cavity using different materials, different shapes of acoustic impedance material.
-Ferrosound magnetic fluid cooling, together with the CCAW coil, reducing the moving mass, increase power to bear, transient better.

Difusores Acústicos

Difusores Acústicos

En este trabajo sobre Difusores Acústicos se presentan dos líneas de investigación:
Una visión microscópica sobre su funcionamiento temporal presentando una nueva visión sobre el fenómeno, del cual su propiedad más importante es la memoria.
Y una visión pragmática, muy útil para el proceso de control de proyectos, donde se establece un coeficiente de difusión, Sound Field Diffusivity (SFD) para poder evaluar cuantitativamente campos difusos reales.
Se incorporan sugerencias para futuras investigaciones en ambas líneas: sobre la primera continuar la búsqueda de un coeficiente de difusión más completo, que incorpore el desparramo temporal de la energía, y sobre la segunda darle resolución en frecuencias al SFD para poder efectuar diseños más precisos.

Acoustic diffusers II

Introducción:
Hoy es innegable que la difusión es una herramienta acústica indispensable en todo diseño obteniéndose por medio de las superficies difusoras tipo QRD, PR, etc., o simplemente mediante la implementación de gradientes de impedancia acústica superficial.
Toda investigación nace de ciertos cuestionamientos y en este caso algunos fueron:
· ¿Puede un solo número, el “coeficiente de difusión” obtenido del desparramo espacial de la energía, caracterizar completamente el funcionamiento de una superficie, siendo éste tan complejo?.
· ¿Cuánta superficie difusora es necesaria para conformar un campo difuso?.
· ¿Cuántos tipos de campos difusos se pueden conformar?.
· ¿Es medible la difusión de un campo difuso como para poder repetir valores obtenidos en proyectos ya realizados?.
· ¿Qué superficie difusora es necesaria en un control y en una sala de un estudio de grabación?.
· ¿Es perfectible un campo difuso?.
· ¿Es estudiable un campo difuso?, ¿Cómo?.
· ¿Qué diferencia hay entre conformar un campo difuso con superfic ies aleatorias respecto de superficies devenidas de teorías numéricas y softwares de optimización? Etc.
En el presente trabajo de investigación se trató de orientar las respuestas a las anteriores preguntas analizando las causas y los efectos de los difusores. En una primera instancia analizando el funcionamiento de la superficie difusora, y en una segunda estudiando el campo difuso.
Según lo descrito en “Análisis Teórico y Experimental de Difusores Acústicos Numéricos” (Memorias del Congreso Mexicano de Acústica, año 1999) se obtiene difusión en el campo lejano de una superficie de reacción local cuando en la misma existen gradientes de impedancia acústica.
O sea que tanto las irregularidades como diferentes coeficientes de absorción conviviendo en partes de una superficie funcionan como difusores. Ahora, ¿qué los diferencia? Sabiendo que la transformada de Fourier de la forma de una superficie revela la distribución de energía en el campo lejano, podemos presuponer que un difusor numérico posee una optimización en la distribución energética espacial respecto de uno que no lo es (sólo conformado por aleatoriedades o por diferencias de impedancias acústicas adyacentes, o gradientes de impedancia superficial).
Al respecto de los difusores numéricos podemos enumerar un breve resumen de los problemas que presentan:
· Diagramas polares de difusión no uniformes en el tiempo.
· Difusión en sólo una dimensión.
· Ancho de Banda discretizado.
· Lobulación de su desparramo espacial al concatenar secuencias.
· Absorción en bajas frecuencias
· La realización práctica con materiales livianos incrementa la frecuencia mínima real.
· La complejidad de la realización práctica los encarece.
· El método tradicional de medición es complejo. Algunos de estos problemas se ven resueltos mediante:
· Modulación de la secuencia: Mejoramiento del Ancho de Banda (y de la lobulación).
· Difusión en dos dimensiones aplicando el teorema del resto chino.
· Optimización de la radiación de los difusores.
La principal conclusión de este trabajo, luego de un último experimento de audición (donde se logró aislar el sonido directo monofónico de sus correspondientes reflexiones difusas) es que uno de las principales propiedades de las superficies difusoras, conjuntamente con el desparramo espacial, es el desparramo temporal de la energía.
Otras conclusiones indican que las superficies difusoras:
• Desparraman la energía acústica en el tiempo.
• Desparraman la energía acústica espacialmente.
· El correspondiente patrón polar de radiación cambia en función del tiempo dada una excitación transitoria.
· Idealmente mantienen la energía acústica dentro del recinto: Acústica Ecológica.
Un campo difuso tenderá a ser ideal espectralmente si la cantidad de “comb filters” tiende a infinito, y la profundidad de los “nulls” tiende a cero. Por lo tanto la respuesta al impulso entre dos puntos interiores a dicho campo presentará un bajo valor de Correlación Cruzada.

Difusión:
Propiedad de las superficies por la que desparraman la energía acústica en el espacio en forma no especular y en el tiempo.

Campo Difuso:
Espacio físico donde existe similar decorrelación binaural de la energía acústica. En las anteriores definiciones se hacen tres afirmaciones a ser demostradas en el siguiente trabajo:
1. Los difusores desparraman la energía acústica en el tiempo.
2. El método de medición de los campos difusos es intrínsecamente binaural.
3. Los campos difusos poseen un valor medio de difusividad y un desvío estándard que demuestra (o no) su homogeneidad.

Difusores Acústicos II: la Superficie Difusora.

El objetivo de este capítulo es la comprobación del desparramo temporal y de la decorrelación de las reflexiones emanadas de la superficie difusora.
Dispositivos bajo prueba:
En esta primera parte de los ensayos se midieron dos difusores del mismo tipo pero de diferentes frecuencias mínimas teóricas, un panel plano de igual superficie (proyectada) y un difusor cilíndrico.
Muestras evaluadas:
· Un difusor en 2 dimensiones tipo QRD de 10cm de profundidad máxima de 0,5m x 0,5m.
· Un difusor en 2 dimensiones tipo QRD de 20cm de profundidad máxima de o,5m x 0,5m.
· Un panel plano de 0,5m x 0,5m.
· Un difusor cilíndrico de 0,6m de ancho por 1,2m de alto.

Equipo de Medición:
Con objeto de obtener respuestas al impulso (para su posterior análisis) de cada dispositivo el set de medición constituía de:
· Una cámara anecoica de un volumen aproximado de 200m3.
· La fuente sonora utilizada fue ruido rosa (al utilizar ruido la única correlación entre señales posible es la dada por el sistema).
· El post procesamiento fue realizado mediante 2 canales de FFT utilizando una ventana tipo Hanning, analizadores de espectro y de oscilogramas, Plug ins de correlación y procesadores de integral reversa de Schroeder.
· Un reproductor de CD.
· 2 Micrófonos Eartworks M30.
· 2 Micrófonos Shure SM81.
· Un medidor de Nivel de presión sonora TES 1350 con calibrador correspondiente.
· Un grabador de DAT de 2 canales.
· Un amplificador de Audio de 2 canales.
· Un altavoz marca Auratone modelo “The Cube”.
· Transportador y cinta métrica.

Resultados de las mediciones:

Los primeros resultados (figuras 1, 2, 3 y4) muestran tanto la señal directa como el desparramo en tiempo de la energía reflejada. Las figuras fueron obtenidas excitando cada DUT a 35o de entrada y captando su salida tamb ién a 35o. Se tomó esta combinación de ángulos de entrada y de salida porque bajo estas condiciones no se cumple la ley de Snell. Podemos observar en la figura 2 aproximadamente cuatro reflexiones discretas de energía las cuales se deben a la “difusión de borde” (“edge scattering”). Veremos en
el siguiente punto que estas reflexiones no tienen un contenido energético considerable.
Tras procesar estas respuestas al impulso por la Integral reversa de Schroeder1 de los primeros 40ms de las mismas podemos cuantificar la energía involucrada en las IR (impulse response) de cada DUT en los primeros milisegundos de la mismas. Esto se observa en las figuras 5, 6, 7 y 8. En las figuras 9 y 10 se observan claramente las diferentes pendientes de la
integración reversa para el panel plano y para el difusor. En el caso del difusor aparecen reflexiones (más de una) con importantes valores de energía en la salida las cuales generan una zona de mayor pendiente (no un instante) de duración
4,22ms presentando un ÄdB= 8,43dB. Según estas condiciones de entrada y salida de la información (respecto del DUT)
vemos que el panel plano no refleja energía apreciable mientras que los difusores sí.

Estas visualizaciones justifican relacionar este comportamiento de las superficies difusoras con la característica de los sistemas denominada “memoria”.
Memoria:
“Propiedad por la cual el valor actual en la salida depende del valor actual de la entrada y de valores pasados.”
En un paso posterior del procesamiento se evaluó la entrada y la salida mediante la envolvente2 de la función correlación cruzada (equivalente a la convolución entre entrada y salida de un sistema). De esta herramienta matemática se pueden extraer ciertas conclusiones sobre los difusores (ver Figura 11 y 12, un zoom de la anterior):
· Existen multiplicidad de trayectos desde un punto de entrada hasta un punto de salida. Esto indica diferentes retrasos de la misma señal.
· Cada pico de la función resultante indica similaridad entre ambas señales. Esto confirma la propiedad de “memoria” del difusor.
· La no coincidencia temporal entre picos indica que se está decorrelando la señal en el tiempo entre cada par de puntos in – out.
· La correlación cruzada de las anteriores correlaciones tiene muy bajo grado de correlación.

Nota: La envolvente (módulo) se obtuvo mediante la transformada de Hilbert de la correlación cruzada original (o sea la parte real).
Por lo tanto podemos afirmar que los difusores desparraman la energía acústica en el tiempo. Ver modelos clásico y moderno (propuesto por el autor) en las Figuras 13 y14.

Difusores Acústicos II: El campo Difuso.

El motivo de este capítulo es poder cuantificar la difusividad3 de un punto en el espacio dentro de un recinto. Con esto se pueden graficar (o especificar) líneas o zonas con idénticos (o similares) valores delimitándose campos difusos reales. Así se estaría independizando efectivamente el campo reverberante del campo difuso.
Sólo cuantificando, tabulando y ponderando subjetivamente una serie de valores medidos en diferentes ámbitos acústicos servirá de guía para todo diseño y como valores de corrección u objetivos de una reforma acústica.

Casos de Aplicación:
· Diseño de una Sala de Ópera y/o de Conciertos: Mediante la permanente auditoría de los campos sonoros formados en el proceso de construcción o remodelación se pueden detectar prematuramente problemas o deficiencias en la predicción y poder solucionarlos.
· Diseño de Controles de Estudios de grabación tipo LEDE: Cuantificando la difusividad provista por los difusores traseros en las zonas del Técnico y del Productor (tratando de que sean similares) se puede acotar y dimensionar la superficie de los difusores traseros.
· Diseño de superficies difusoras por el método de prueba y error: Mediante el intercambio del tipo de superficie lograr ciertos valores de difusividad en un punto interior del campo de reflexiones generado.
· Especificación de superficies difusoras: Comparando los valores de difusividad obtenidos con distintos difusores bajo las mismas condiciones de entorno y de medición.

Dispositivos bajo prueba:
Campo difusos generados en:
· Control de un estudio de grabación.
· Sala de un estudio de grabación.
· Teatro Colón.
Equipo de Medición:

Con objeto de obtener respuestas al impulso (para su posterior análisis) y captaciones binaurales de cada dispositivo el set de medición constituía de:
· Un par de micrófonos PZM en configuración binaural (llamado “Wood Head”).
· La fuente sonora utilizada fue ruido rosa (al utilizar ruido la única correlación entre señales posible es la dada por el sistema).
· El post procesamiento fue realizado mediante 2 canales de FFT utilizando una ventana tipo Hanning, analizadores de espectro y de oscilogramas, Plug ins de correlación y procesadores de integral reversa de Schroeder.
· 2 Micrófonos Eartworks M30.
· 2 Micrófonos Shure SM81.
· Un medidor de Nivel de presión sonora TES 1350 con calibrador correspondiente.
· 2 Pares de micrófonos binaurales Senheiser (“in ear”).
· Un reproductor de CD.
· Un grabador de ADAT de 8 canales.
· Una consola Soundcraft de 16 canales de entrada.
· Un amplificador de Audio de 2 canales.
· Un altavoz marca JBL modelo 4425.

Resultados de las mediciones:
En busca de un parámetro que refleje la difusión de un punto en el espacio, definimos el SFD, Sound Field Difusivity.
Definición:
SFD:
“Es un índice de Espacialidad Subjetiva que indica el grado de decorrelación de reflexiones entre el oído izquierdo y derecho (binaural)”

· Teatro Colón:

Inicialmente se midieron las respuestas al impulso monoaurales en 7 ubicaciones en el interior de la sala. Se realizaron también diferentes captaciones binaurales y una toma estereofónica tipo “omnis espaciados” en la posición 2. Ver figuras15 y 16.
La respuesta al impulso (monoaural) medida en la posición 2 se puede observar en la figura 17.
Se destacan el I.T.D.G. y la S/N dentro de él. Esta última brinda una aproximación rápida de la inteligibilidad existente dentro del recinto. La transferencia medida en esta posición se observa en la figura 18.
· Estudio de Grabación, Sala y Control tipo Lede:
Se realizaron captaciones binaurales, 2 en la Sala y 3 en el Control; en este último en las zonas del técnico, del productor y muy cerca del difusor trasero.
Post procesado de las mediciones binaurales:
Sabiendo que existe una correlación entre el IACC y la sensación subjetiva de difusión, a partir de los valores del primero se llegó a los valores del segundo por medio de una ecuación fruto de una regresión matemática entre resultados obtenidos en anteriores estudios.

Se trabajó con distintos softwares para obtener la correlación cruzada entre las señales correspondientes al oído derecho e izquierdo, su ponderación tipo “A” y su máximo valor normalizado.
Los resultados obtenidos fueron:

Podemos destacar:
· La gran similitud de valores obtenidos de SFD entre las posiciones del Técnico y el Productor, lo cual debería ser un objetivo primordial en todo diseño.
· El alto valor de SFD de las captaciones cercanas a los Difusores (Toma “Difusor” en el Control y “Omnis Espaciados” en la Sala). Esto se debe a que los micrófonos se encuentran en una zona de impedancia acústica de radiación reactiva de las fuentes fantasma que se generan dentro de las celdas de los difusores.

Podemos destacar:
· La gran similitud de los valores resultado de la captación con Binaural Wood y Binaural Hô, lo cual valida el modelo microfónico binaural compuesto por 2 micrófonos PZM separados por una madera a modo de “cabeza”.
· La reducción del valor de difusividad, SFD, (o sea mayor correlación entre ambas informaciones) encontrado en la captación Spaced Omnis. El mismo se produce debido a que no existe un material aislante entre un micrófono y otro, función que cumple la cabeza entre nuestros dos oídos.

Conclusiones:
· El ETS existe y es cuantificable. Sugerimos tomar en cuenta la duración (D de tiempo) y la magnitud del conjunto de reflexiones salientes.
· La superficie difusora decorrela en el tiempo las reflexiones salientes (respecto de sí mismas y de la señal original).
· La difusividad de un campo sonoro es mensurable en forma objetiva y a partir de ello es posible tomar decisiones correctivas.

Trabajo a futuro:
· Análisis de la memoria de los difusores mediante la Autocorrelación de su salida.
· Relevar valores relativos y absolutos de S.F.D..
· Realizar pruebas subjetivas de S.F.D. en Controles de estudios de grabación.
· Distribuir el SFD en frecuencias para una mayor comprensión de los campos sonoros dentro de los recintos.
· Incorporar al coeficiente de difusión una magnitud del E.T.S..

ACÚSTICA DE RESONADORES DE HELMHOLTZ

RESONADORES DE HELMHOLTZ

INTRODUCCIÓN TEÓRICA

Ya advierte la bibliografía especializada en temas de absorción de baja frecuencia, que la mayor ayuda para el tratamiento acústico con elementos resonadores es la propia experimentación.
Las expresiones teóricas informan acerca del comportamiento del conjunto resonador; y, ateniéndose a ciertas restricciones, la formulación acierta en la frecuencia de sintonía del sistema pero flaquea en las previsiones de absorción.
Recordemos las principales fórmulas que modelan el funcionamiento de un resonador de Helmholtz así como las limitaciones de cada una.

Se advierte del cambio en el ancho de banda y de la disminución de la eficacia del resonador con la introducción, en la cavidad de éste, de material aborbente poroso, pero, ¿en qué medida varían los parámetros antes mencionados? Poca bibliografía completa el caso de sistemas con pérdidas.

Absorción

La absorción de un resonador de Helmholtz es quizás el apartado más abandonado por la teoría y más necesitado en los casos prácticos. Si bien el ajuste de la frecuencia de resonancia es un hecho sin problemas, la predicción de la cantidad de absorción constituye un tema poco claro. Existe formulación para la absorción de un resonador individual en su frecuencia de resonancia y también para todo el margen, pero debemos remarcar su “validez” únicamente para el caso de un resonador aislado, cosa que en un tratamiento real no encontramos nunca. Así, la predicción de absorción para un conjunto de resonadores de Helmholtz (resonadores individuales no independientes), se hace casi imposible.

La fórmula que se encuentra para la absorción de un resonador es la siguiente:

La absorción máxima, Amax, usadada algunas veces en trabajos teóricos, responde a la expresión mostrada para los casos en que la resistencia de fricción del resonador se iguala a la resistencia de radiación del mismo; para resonadores totalmente adaptados al medio [Kutrruff].Muchas veces su usan aproximaciones de la fórmula cambiando el denominador por 3.5p o 4p.

CASOS PRÁCTICOS
Para estudiar el comportamiento de los resonadores de Helmholtz se han analizado en el laboratorio diferentes montajes realizando medidas en cámara anecoica y reverberante.

MEDIDAS EN CÁMARA ANECOICA
En la cámara anecoica se midió la frecuencia de resonancia, el ancho de banda de los resonadores construídos y la variación de ambos parámetros cuando se introducían pérdidas en el sitema.

Medida de la f0
La frecuencia de resonancia se obtuvo excitando con ruido rosa en el exterior del resonador y obteniendo el espectro de la excitación en el interior de su cavidad. Los resultados obtenidos convergen a una buena previsión teórica de la frecuencia de resonancia cuando las restricciones de dimensionado y proporcionalidad son respetadas.

En las figuras anteriores mostramos uno de los resonadores analizados y la medida de su frecuencia de resonancia. Para este caso, la frecuencia teórica predecía 59.42 Hz y la frecuencia real ha resultado de 62.2 Hz.
Las medidas realizadas en los 15 sistemas analizados han presentado variaciones relativas máximas del 5%.

Medida de un sistema con pérdidas

Para el caso del resonador presentado anteriormente, al añadir material absorbente en el volumen encerrado, la frecuencia de resonancia varía disminuyendo, hasta los 60.5 Hz para un 40% de fibra de vidrio en la cavidad y hasta 58.7Hz para un 70% de fibra en un segundo caso. El material absorbente también contribuye a reducir el nivel de las frecuencias propias de la cavidad del resonador así como a disminuir la energía del pico de la resonancia.
La variación del ancho de banda es visible pero éste se extiende, en muchos casos, por debajo del ancho definido a –3dB.

A continuación se muestran, para diferentes experimentos, las variaciones en la frecuencia de resonancia y en el ancho de banda relativo según el porcentaje de volumen ocupado por material absorbente.

Como se aprecia en la gráfica, la frecuencia de sintonía disminuye debido al material absorbente asociando el fenómeno a un aumento virtual del volumen del resonador. Los datos obtenidos coinciden con los resultados de Beranek llegando a una reducción máxima de la f0 de un 85%.

MEDIDAS EN CÁMARA REVERBERANTE
Medida de la absorción

Para los ensayos de coeficiente de absorción se midieron dos conjuntos de resonadores. Uno de ellos formado por botellas (f0 de 116 Hz) y realizando medidas con grupos de 25, 50 y 100 resonadores. Un segundo sistema se observa en lafotografía superior y se basa en un conjunto de 8 resonadores de madera sintonizados a 90.5Hz.
Los resultados obtenidos se muestran en los gráficos siguientes. Para la obtención del incremento de absorción se aplicó la Normativa ISO 354 para el cálculo del coeficiente de absorción en cámara reverberante.

Apreciamos en los la variación del incremento de absorción en función del número de resonadores y de la colocación de éstos. Este incremento, evidentemente, no es lineal con el número de elementos absorbentes y por tanto es imposible extrapolar un coeficiente de absorción para un único resonador. La absorción proporcionada por el conjunto de 100 botellas es considerable, rebajando el tiempo de reverberación de la sala de 15 segundos a 9.6 segundos en la banda de 125Hz.

Los datos conseguidos con el conjunto de 8 resonadors se muestran a continuación.

En el gráfico anterior se representa la curva tonal de la cámara reverberante vacía (línea rosa) y la curva tonal después de colocar en medio de la cámara el conjunto resonador en posición vertical (línea azul).

Estos dos gráficos representan la variación del TR60 y del incremento de absorción en función de la posición del conjunto de resonadores (posición horizontal y posición vertical) y el incremento de absorción provocado por sólo 4 resonadores del conjunto, invalidando los 4 restantes. Como se observa en los resultados obtenidos, el resonador colocado en posición vertical presenta el máximo incremento de absorción mientras que en posición horizontal la absorción disminuye acercándose al caso de los 4 resonadores.
Es interesante destacar que la cantidad de absorción que se obtuvo con estos 8 resonadores sintonizados a 90.5Hz, fue la misma que la obtenida por los 100 resonadores del experimento anterior, sintonizados a 116 Hz. Este resultado confirma, como anunciaba la formulación presentada en la introducción teórica, la dependencia de la absorción con la longitud de onda de la frecuencia de resonancia.

Efectos secundarios

Otros efectos previsibles medidos en algunos casos prácticos, son la actuación de estos elementos resonadores en el campo sonoro que los rodea. El sistema resonador, no sólo provoca una absorción determinada sino que puede contribuir a aumentar la difusión del campo acústico de su alrededor gracias a la reradiación de energía que se produce a través de la boca
del mismo.
En cámara reverberante y en ambiente anecoico se han medido estos efectos apareciendo en los espectros de la señal captada en la zona que envuelve el resonador, o en las gráficas de tiempo de reverberación. En este último caso, la actuación del resonador aparecía creando una doble pendiente en la caída de la energía o creando un pico energético que provocaba una discontinuidad en la curva.

CONCLUSIONES

La frecuencia de sintonía de los resonadores construídos se calcula con exactitud con la ayuda de la formulación existente. Se debe tener en cuenta la disminución de esta frecuencia, hasta un 85%, cuando se añade material absorbente en la cavidad del resonador y
la variación del comportamiento cuando no se respetan las condiciones de dimensionado.
La absorción de estos elementos puede llegar a ser elevada y aumenta con la longitud de onda de la frecuencia de resonancia. La fórmula de absorción para el caso de un resonador aislado no sirve en implementaciones reales.
La colocación en la sala del sistema resonante así como su posición, pueden influir de forma considerable en la absorción del sistema. Es máximamente eficaz la colocación de estos absorbentes en los lugares de máximos de presión.

BIBLIOGRAFÍA

[1] Room Acoustics, Heinrich Kuttruff
[2] Principles and Aplications of Room Acoustics Volume 1 y 2, L.Cremer, H. Müller
[3] Acústica de Recintes. Enginyeria La Salle. Robert Barti
[4] Master Handbook of Acoustics.

FFT_Medición de Función de Transferencia con sweeps 2

COMPARACIÓN ENTRE SWEEPS Y MEDICIONES MLS

2.1 Duración de la medición

En todas las mediciones, el periodo de captura AD debe ser por lo menos del largo de la respuesta impulsiva (en la practica: el tiempo antes de que la respuesta llegue al ruido de fondo) para evitar errores. Esto es obvio para una medición con pulsos no periódicos.
Toda su energía es emitida al principio, y el conversor DA simplemente muestrea hasta que la respuesta impulsiva decae. En el caso que sean usados sweep no periódicos como señales de excitación, el período de captura debe ser un poco mayor, pero en
general no mucho. Esto gracias a que los sweep comienzan en frecuencias bajas. Con DUTs normales, como altavoces, el mayor retardo de la señal ocurrirá en baja frecuencias. Así, mientras se produce el barrido a través de las altas frecuencias, el
tiempo debe ser suficiente para obtener los componentes retrazados de baja frecuencia.
Para mediciones de altavoces el decaimiento en frecuencias altas es usualmente tan corto que la captación AD puede ser detenida inmediatamente después que la señal de excitación pasa a través de él (siempre que el sweep sea considerablemente más largo que el retardo en bajas frecuencias y por supuesto, observando el tiempo de llegada entre el altavoz y el micrófono). En mediciones de salas acústicas el trozo de silencio siguiente a la emisión del sweep usualmente debe ser mayor que el tiempo de reverberación en altas frecuencias.
En el caso de excitaciones periódicas, el largo del período y el tiempo de captura AD deben ser mayores que el largo de la respuesta impulsiva. Utilizar un largo menor podría provocar time aliasing, que consiste en el pliegue de la parte final de la IR que cruza el periodo con el principio del siguiente, sumando ésta al principio de la IR.
Dependiendo de la cantidad de energía plegada hacia atrás, aparecerán errores más o menos tolerables. Comparado con mediciones de pulsos no periódicos o mediciones con sweeps, la necesidad de emitir la señal de excitación dos veces significa que se requiere
mayor tiempo para la medición. Por otra parte, solo la mitad de la energía total que alimenta al DUT es usada para el análisis.

2.2 Factor de Cresta

El factor de cresta es la relación del voltaje Peak-RMS de una señal expresado en dB. Asumiendo que la medición del sistema o el DUT están limitados por un nivel distinto de voltaje, el valor peak de cualquier señal de excitación considerada, tiene que ser
normalizado a este valor para extraer la máxima energía posible en una medición. El nivel RMS entonces será bajo de acuerdo al factor de cresta. Así, el factor de cresta indica cuanta energía se pierde cuando hay una cierta señal de excitación, comparada con el caso ideal de estimulo cuyo voltaje RMS es igual al voltaje peak (cresta = 0 dB).
Por esta razón, el diseñar señales con un factor de cresta lo más bajo posible se ha convertido en una especie de deporte para los desarrolladores teóricos de análisis de señales.
La suposición que un nivel de voltaje está definiendo el límite superior de una medición, muchas veces es verdadero en mediciones puramente eléctricas (por ejemplo, ecualizadores, mezcladores, etc.). En mediciones acústicas esto es válido sólo cuando el amplificador es el eslabón más débil de la cadena. Aún, muchos amplificadores equipados de una fuente de alimentación basada en una transformación lineal pueden reproducir sobretensiones peaks de 2 o 3 dB más altos que la potencia continua.
La primera restricción es el daño por el sobrecalentamiento de la bobina del altavoz, para este caso la energía total emergente del altavoz es más importante que el factor de cresta. Sin embargo, factores de cresta muy grandes deben ser evitados siempre, ya que
un único peak de nivel puede causar distorsión.
Como primera observación, un MLS mantiene la salida semejante a la señal de excitación ideal. En el sentido de máxima extracción de energía. El valor Peak es igual al valor RMS. Sin embargo, el ideal factor de cresta resultante de 0 dB no puede ser explotado en la práctica. Tan pronto como el MLS salga al mundo real y pase a través de un filtro, la forma de onda rectangular puede cambiar considerablemente.
Especialmente los filtros anti-aliasing abruptos usados en la etapa de oversampling de un conversor DA causan dramáticos overshoot (distorsión). Para evitar esta drástica distorsión causada por los clip en las etapas del filtro, el MLS debe alimentar el conversor DA con un nivel de al menos 5 a 8 dB bajo la escala total, dependiendo de las características del filtro anti-aliasing. Esto quiere decir que el MLS no puede ser emitido libre de distorsión con la misma energía de una señal senoidal con un factor cresta de 3.01 dB.
Pero aún si el MLS es producido por un hardware generador, este no retendrá el favorable factor de cresta por un gran tiempo. Los amplificadores de potencias siempre equipados con un filtro pasa bajos de entrada que rechaza la interferencia de radio, y evita trancientes de intermodulación inducida por altas slew rate de la señal de audio precisamente que prevalecen en abundancia en un MLS no filtrado. Un típico filtro de entrada puede ser un Butterworth pasa bajos de 2° orden con un frecuencia de corte de quizás 40 kHz. El overshoot producido por este filtro es mucho más moderado que el de un filtro anti-aliasing abrupto (fig. 7) pero aún merece consideración.

Existen casos en que algunos nodos internos del DUT restringen el driving level y no los voltajes de la salida del sistema de medición. Por ejemplo, si una resonancia con alta ganancia se encuentra en una etapa de ecualización de la cadena, la señal de excitación debería distorsionar a la salida de esa etapa. En esos casos, los sweeps tienen que alimentar con un nivel más bajo determinado por la ganancia en la frecuencia de resonancia de ese filtro específico. En contraste a esto, el MLS filtrado tiende a tomar una amplitud de distribución gausiana, con un 1% de las amplitudes alcanzando un nivel mayor a 11 dB sobre el valor RMS [13]. En muchas mediciones de altavoces y salas acústicas, aun con la presencia de resonancias moderadas, un sweep puede alimentar con un mayor nivel RMS que un MLS. En la práctica la distorsión ocurre gradualmente, con MLS mucho antes que el nivel de clip del amplificador sea alcanzado. Como será examinado en la sección 2.5

2.3 Rechazo de Ruido

Cualquier principio de medición usando señales de excitación con igual longitud, distribución espectral y energía total conducirá exactamente a la misma cantidad de rechazo de ruido, si es considerado el período entero de la respuesta al impulso sin ventana. Para cada frecuencia la relación S/R solamente depende de la relación de energía de la respuesta del DUT a ese extraño ruido capturado en el período de medición. Las diferencias entre varios métodos de medición simplemente engañan en la manera de cómo el ruido se distribuye sobre el periodo de la IR recobrada. Claramente usando la misma distribución espectral en una señal de excitación requiere la misma coloración invertida en el proceso de deconvolución. Esto explica el porque la magnitud de la fuente de ruido no varía cuando se cambia el tipo de estimulo. Las fases sin embargo serán muy diferentes. Aún, algunos tipos de fuentes de ruido aparecerán similarmente en todas las mediciones, ya que su característica general no es alterada por la manipulación de la fase. Como por ejemplo un ruido de mono frecuencias (hum).
Igualmente el ruido no correlacionado (por ejemplo aire acondicionado) aún aparecerá como ruido.
Sin embargo, cualquier otro disturbio será reproducido bastante diferente, dependiendo del tipo de estímulo. Fuentes de ruido impulsivas, como clicks y pops, serán nuevamente transformados en ruido cuando usamos un ruido como estímulo. En contraste en una medición con sweep ellos llegarán a ser audibles como un sweep invertido en el tiempo. Usualmente ruidos estables son considerados más discretos que otras señales de error. Generalmente, si cualquier ruido aparece inesperadamente, la medición simplemente debe ser repetida, o, si se está promediando eliminar el periodo específico del proceso.

2.4 Variación de Tiempo

Las variaciones de tiempo tienden a aparecer en las mediciones siempre que se realicen sobre una larga distancia exterior, cuando el promedio sincronizado es realizado sobre largo periodos de tiempo, o cuando el DUT en si mismo no es invariante en el tiempo.
El primer caso ocurre en mediciones en estadios, o sitios al aire libre bajo condiciones metereológicas con viento. El segundo se da cuando la relación S/R es muy baja forzando a utilizar muchos cientos o incluso miles de promedios sincrónicos. En
periodos de medición largos, una leve variación de temperatura o movimiento puede frustrar el proceso de promediado. Un tipo de DUT que no sea invariante en el tiempo como cualquier tipo de grabadora análoga.
Es bien sabido que las secuencias de ruido periódicas en general, y en especial los MLS son extremadamente vulnerables a leves variaciones de tiempo. Una considerable cantidad de trabajos teóricos explican estos efectos en detalle [27-29]. Aunque las ecuaciones allí presentadas se ven amenazadoras, en la práctica es fácil comparar los efectos de variaciones de tiempo, estos tienden a tener una errática e impredecible naturaleza. Es probable que dos mediciones al aire libre realizadas en serie estén afectadas por diferentes ráfagas del viento. Sólo una simulación permite evadir esta “variación del tiempo de la variación del tiempo”. La fig. 8 da un pequeño ejemplo.
Una secuencia de ruido y un sweep, ambos con espectro blanco plano, han sido sometidos a una suave variación del tiempo sinusoidal de ±0.5 muestras.  Para simular un jitter, las señales han sido sobre muestreadas por un factor de 256 (sin filtrar, simplemente insertando 255 ceros consecutivos después de cada muestra). Entonces el tiempo exacto de llegada de las muestras ha sido desplazada en un rango de ±128 de acuerdo a la curva sinusoidal de jitter. La alteración resultante del espectro de banda base es insignificante en baja frecuencia, pero este aumenta extremadamente para el espectro de ruido con jitter. Por el contrario el espectro del sweep con jitter sólo muestra una mayor corrugación al final de altas frecuencias, y esto puede ser removido con una suave ventana de suavización.

Otra prueba expresiva es la respuesta de frecuencia de la medición de un grabador análogo, un tipo de maquinas que siempre sufre wow and flutter en alguna proporción.
Como el material de cinta magnética tiende a saturarse mucho antes en altas frecuencias, ha sido aplicado un énfasis de 24 dB en baja frecuencia al MLS y al sweep usados en este experimento. Adicionalmente la envolvente del sweep ha sido hecha a la medida para que decrezca 12 dB sobre los 5 kHz, pero manteniendo la coloración inicial. La sección 4.4 nos revelara como esto es realizado. Ambos estímulos fueron normalizados para que contengan la misma energía y fueron grabados con el mismo nivel de entrada. Como los resultados de la fig. 9 muestran, la respuesta de frecuencia medida usando MLS como excitación es tremendamente ruidosa sobre los 500 Hz.
En la que se utilizó el sweep como estimulo, también se observa la variación de tiempo inducida por la contaminación pero mucho menos extendida. Además de los efectos de deterioración de la variación de tiempo, la distorsión también juega un papel importante en la contaminación de respuesta recobrada de la grabadora análoga. Para minimizar la ínter-modulación producida, el nivel de grabación ha sido ajustado 20 dB bajo la saturación límite en este experimento.
Aun cuando el sistema de medición es virtualmente libre de variaciones de tiempo, el uso de señales de excitación pseudo-ruidosas es desventajoso cuando se realizan ajusten dentro del período de medición (volumen, EQ, otros). En este caso ocurren grandes errores en la visualización de la IR. Los sweep y la medición del impulso no muestran esta molesta reacción a la variación del tiempo y estas son además más agradables de usar para ajustes en mediciones repetitivas.

2.5 Distorsión

Los ingenieros de Hardware de audio se empeñan en optimizar el rango dinámico de sus circuitos que idealmente debe corresponder a nuestro sistema auditivo con valores sobre 130 dB. La relación S/R en mediciones acústicas parece haber sido descuidada por los acústicos en el pasado.
En sitios de relativa calma, es menor el ruido de fondo que limita la calidad de las respuestas de las IR obtenidas, pero muy frecuentemente la distorsión es producida por el altavoz empleado. En cualquier medición usando ruido como señal de excitación, estos productos de excitación serán distribuidos como ruido sobre todo el período de la IR. La razón de esto, es que la distorsión de un estímulo con fase pseudo- aleatoria también tiene mayor o menor fase aleatoria, y también el proceso de deconvolución involucra fases aleatorias que eventualmente producen un espectro erróneo con fases aleatorias, correspondientes a una señal de ruido aleatoriamente distribuida. Como esta señal errónea es correlacionada con la señal de excitación, promedios sincrónicos no mejoran esta situación.
Mientras es verdad que los niveles de ruido dañan relativamente al valor peak de la IR cuando escogemos una secuencia mayor, esto puede ser reducido difícilmente a un valor aceptable. Mediciones de acústica de salas involucran secuencias largas. Por ejemplo, aumentando el largo de un MLS de grado 18 por un factor de 128 podríamos teóricamente reducir el nivel de ruido de un típico valor de –65 dB a –86 dB. Mientras esto puede ser factible en procesos MLS de grado 25 (largo 12min, 42s con 44,1 kHz de frecuencia de muestreo) en un computador equipado con bastante memoria, podría no funcionar bajar el nivel de ruido a este nivel, porque cuando usamos una secuencia tan larga, la vulnerabilidad contra la variación de tiempo es predominante.
En vez de reducir la influencia de la distorsión por un incremento del período de medición, es más beneficioso simplemente excluirla totalmente de la IR recuperada.
Esto puede ser logrado fácilmente por el uso de sweeps como señal de excitación, como se explico en la sección 1.8. La mayor mejora que puede ser realizada en mediciones de acústica de salas por el reemplazo de MLS con sweep es demostrada en la fig. 10.
Ha sido medida la IR de una cámara reverberante usando MLS y sweeps de grado 20, ambos con la misma energía y el mismo pre-énfasis de 20 dB en baja frecuencia. Para la medición con MLS, el volumen ha sido cuidadosamente ajustado para producir una
mínima contaminación a la IR. De hecho, esta búsqueda del óptimo nivel mediante prueba y error es crucial en mediciones con MLS [34], ya que mucha energía produce distorsión excesiva visible por un aumento del ruido de fondo con una estructura abultada, mientras que en bajo nivel conduce al que el ruido de fondo estropee la mayoría de las veces la medición.

Después de este ajuste se pueden realizar 1, 10, 100 promedios sincrónicos con ambas señales de excitación. Es claramente visible en la fig. 10, que cuando no se usan promedios, la IR decae al ruido de fondo que es 5 dB menor en mediciones con sweeps.
La distorsión acumulada queda al final del período de medición. Como el largo de la señal de excitación ha sido escogida al menos 8 veces mayor que el tiempo de reverberación, esta puede ser separada de la actual IR. Realizando 10 promedios sincrónicos, el ruido de fondo se reduce 10 dB cuando se utilizan sweeps. Por el contrario, cundo se usa MLS como señal de excitación, sólo se observa una pequeña disminución del ruido de fondo, demostrando que el producto de intermodulación correlacionada prevalece en la IR recuperada. Realizando 100 promedios sincrónicos no sucede ninguna mejora en una medición con MLS, mientras que en la medición con sweeps se aprecia una disminución, a pesar de que no alcanza los 10 dB esperados. La variación de tiempo debido a la variación de la temperatura podría explicar esto, ya que la medición de 100 promedios toma alrededor de 40 minutos.
En este experimento el nivel de salida ha sido optimizado para el uso con MLS. El nivel del sweep emitido podría haber sido aumentado 15 dB causando una distorsión en el amplificador, y con esto disminuir el nivel del ruido de fondo esta misma cantidad. Así, la relación señal ruido podría haber alcanzado un valor de 100 dB con sólo 10 promedios de sweeps. Por el contrario es imposible conseguir esta calidad con mediciones MLS, independientemente del nivel y del número de promedios.
El altavoz utilizado en el experimento fue una combinación woofer/tweeter para PA de 12 pulgadas optimizado para una mayor eficiencia. Este tipo de parlantes claramente produce mayor distorsión que un sistema de alta fidelidad con suspensiones más suaves
y mejores bobinas, pero incluso con este último, una relación de señal ruido de 90 dB se puede lograr, algo que es inalcanzable con mediciones MLS.
Esto es mostrado con un experimento similar usando un altavoz coaxial de 5’’ con suspensión suave medido en una cámara anecoica con señales de excitación muy pequeñas (fig. 10b). Nuevamente el nivel fue ajustado para alcanzar la óptima relación S/R con el MLS rosado. Alimentado con la misma energía, el sweep rosado produce una mejor relación S/R con sólo una medición. Este nivel ajustado a favor del MLS fue tan bajo que fue posible aumentar 20 dB sin causar saturación en el amplificador de potencia empleado. Haciendo esto, los productos de la distorsión al final del período aumentan considerablemente, pero la relación S/R aumentó aproximadamente a la ganancia adicional del amplificador. Con sólo 10 promedios (largo total de la medición de 3,5 segundos), se alcanzan exitosamente 100 dB.

Además de mediciones acústicas, existen más situaciones de medición en que se requiere linealidad que las mediciones con MLS no satisfacen, como por ejemplo codificadores psico-acústicos. Un ejemplo obvio son los teléfonos celulares que usan una muy alta compresión para obtener bajos bit rate. Experimentos preliminares muestran que señales cortas de excitación producen errores impredecibles y erráticos, independientemente si se usa MLS o sweeps. Aumentando el largo del grado 18 a 44.1 kHz de frecuencia de muestreo entregan resultados más o menos confiables con un sweep (lineal entre 100 Hz y 7 kHz), mientras que la medición con MLS del mismo largo y coloración produce una curva muy rugosa que difícilmente permite reconocer la función de transferencia (fig. 11). Sin embargo, hay que admitir que estos resultados son cuando la respuesta impulsiva es transformada al dominio espectral sin un proceso previo. Aplicando una ventana estrecha con un ancho de sólo 80 ms alrededor del peak mayor alivia la situación bastante (fig.12). Aún así, aparecen sorprendentes diferencias sobre los 2kHz entre las mediciones con MLS y sweeps. El codificador parece producir diferentes resultados para ruido de banda ancha y aparecen señales mono frecuenciales en un corto periodo de análisis.
Otro ejemplo que es más frecuente en aplicaciones de audio que la codificación de baja fidelidad telefónica es la popular compresión MPEG 1 / layer 3. La fig.13 muestra la función de transferencia de codificador para la común razón de 128 Kbit/s, con medición de MLS y sweep. La ventaja del sweep es arrolladora en esta aplicación. De hecho, el ruido de banda ancha que el codificador tiene que tratar cuando un MLS se utiliza como señal de excitación presenta el caso peor para la codificación psicoacústica.
Todas las bandas de frecuencia contienen energía, así ninguna cae debajo del nivel de enmascaramiento que podría permitir omitirla. Consecuentemente, todas las bandas tienen que ser sometidas a una cuantización para obtener el bit rate requerido, resultando en distorsión que perturba significantemente la medición con MLS. Por el contrario, los sweeps se deslizan solo un par de bandas por intervalo de análisis, permitiendo cuantizar con alta resolución mientras se descartan otras que no contienen energía.

Para resumir, cuando medimos la compresión de datos de los codificadores, los sweeps tienen la considerable ventaja de reducir la complejidad de la señal comparado con las secuencias de ruido. Esto convierte la codificación en una tarea sencilla. Mientras que en mediciones “naturales” usando sweeps, la distorsión puede ser aislada y eliminada por el uso de ventanas, la ventaja en mediciones que involucren codificadores parece mentir más en el hecho que la generación de distorsión es simplemente prevenida.

FFT_Medición de Función de Transferencia con sweeps

Medición de Función de Transferencia con sweeps

Comparado a usar señales pseudo-aleatorias, las mediciones de función de transferencia usando sweeps como señal de excitación muestran significativamente mayor inmunidad contra la distorsión y varianza de tiempo. Capturar respuestas impulsivas binaurales de salas con propósitos de auralización de alta calidad requiere una relación señal-ruido mayor a 90 dB que no es factible lograr con mediciones con MLS debido a la no linealidad del altavoz, pero fácilmente alcanzables con sweeps debido a la posibilidad de remover completamente la distorsión armónica. Antes de investigar las diferencias y problemas prácticos con mediciones con MLS y sweeps y discutir porque los sweeps son una mejor opción para la mayoría de las mediciones, serán revisados los métodos existentes para obtener la función de transferencia. Será dirigida la necesidad de usar señales de excitación pre-enfatizadas en mediciones acústicas. Es presentado un método para crear sweeps con contenidos espectrales arbitrarios, pero con envolvente temporal con dependencia de frecuencia constante o prescrita. Es investigada la posibilidad de analizar simultáneamente función de transferencia y armónicos.

– INTRODUCCIÓN

La medición de funciones de transferencia y sus respuestas impulsivas asociadas es una de las tareas más importantes en todas las áreas de la acústica. Está técnica prácticamente es necesaria en todo. Un desarrollador de altavoces chequeara la respuesta de frecuencia de un nuevo prototipo muchas veces antes de la entrega para la producción. Como la respuesta en el eje central no es suficiente para caracterizar un altavoz, es necesario un completo conjunto de mediciones polares de los datos. En acústica de salas, la respuesta impulsiva juega un rol central, ya que una gran cantidad de parámetros acústicos relacionados con la calidad de la percepción pueden ser derivados de ésta. En acústica de locales, el aislamiento del ruido depende de la frecuencia. En vibro-acústica, la propagación de las ondas de sonido en los materiales y la radiación desde su superficie tiene un vasto campo de simulación y verificación de las mediciones con vibradores. También es usada para la detección de reflexiones (sonar, radar) y otras áreas relacionadas a la medición de respuestas impulsivas.
Mientras muchas de estas tareas de mediciones no requieren un excesivo rango dinámico, es diferente cuando se trata de adquirir la respuesta impulsiva de una sala (RIR) para usarla en la convolución de audio en condiciones de campo libre. Debido al amplio rango dinámico de los sistemas de los auditorios y la relación logarítmica entre el SPL y la sonoridad percibida, cualquier anomalía en la parte final del tiempo de reverberación de una RIR es fácilmente reconocible. Esto se siente especialmente cuando pronunciaciones con largas pausas intermedias son usadas para la convolución y cuando los resultados de la auralización son monitoreados con audífonos, como se requiere para “realidad virtual” basada en respuestas binaurales. Con la tecnología digital de hoy, la relación S/R supera los 110 dB, por lo que no parece ser muy osado atreverse a pedir una relación S/R para la adquisición de RIRs que sea como mínimo equivalente a los 16 bit del CD estándar.
Este trabajo ha sido motivado por la constante decepción de las mediciones RIRs basadas en MLS. Bajo condiciones óptimas, con la suposición de ausencia de varianza del tiempo, muy poco ruido de fondo, apropiado pre-énfasis y un número de promedios sincrónicos arbitrarios, parece imposible lograr un rango dinámico superior a ese, supongamos, en un grabador de cinta análogo. En cualquier medición que se utilice ruido como señal de excitación, distorsión (muchas veces inducido por el altavoz) se reparte en todo el período de medición de la respuesta impulsiva, el nivel de ruido resultante puede ser reducido utilizando largas señales de excitación, pero nunca será excluido enteramente. La distorsión puede ser reducida usando un nivel bajo, pero esto conduce a que el ruido de fondo contamine el resultado. Por lo tanto, el nivel comprometido debe ser ajustado arduamente para cada lugar de medición [34], frecuentemente dejando las capacidades del amplificador de potencia y del altavoz poco explotadas.
En contraste, el uso de sweeps como señales de excitación muestra un mejor alcance de esas limitaciones. Usando sweeps algo mayores que la RIR a ser recobrada permite excluir toda la distorsión armónica producida, prácticamente dejando solo el ruido de fondo como limitación para alcanzar la relación S/R. De esta manera los sweeps pueden ser alimentados con una potencia considerablemente mayor en el altavoz sin introducir señales artificiales en la RIR adquirida. Además en condiciones anecóicas la distorsión puede ser clasificada como únicos armónicos asociados a la fundamental, permitiendo la medición simultanea de al función de transferencia y la distorsión en función de la frecuencia. Esta posibilidad es anticipada por Griesinger [1] y descrita por Farina [2] y
será examinada en la sección 5.
Las mediciones basadas en sweeps son considerablemente menos vulnerables a las nocivas varianzas de tiempo. Por esta razón a veces son la única opción para mediciones exteriores de larga distancia bajo condiciones ambientales adversas o mediciones con
grabación analógica.

1 MÉTODOS EXISTENTES

En el siglo pasado se utilizaron diferentes formas de medición de la Respuesta Impulsiva. El punto en común de todas ellas es que existe una señal de excitación (estímulo) que contiene todas las frecuencias de interés para el dispositivo bajo prueba (device under test, DUT). La respuesta del DUT es capturada y de alguna forma comparada con la señal original. Por supuesto siempre existe una cantidad de ruido que reduce la certeza de la medición. Sin embargo, es deseable usar señales de excitación con alta energía para obtener una buena relación señal-ruido en todo el rango de frecuencias de interés. Usando técnicas gating o compuertas para reducir ruido y reflexiones no deseadas, se puede mejorar la relación Señal-Ruido, pero esto produce variaciones no lineales y varianza de tiempo, como comúnmente se observa en mediciones acústicas. Se realizará una breve descripción del comportamiento de los diferentes métodos de medición.

1.1 Grabador de Nivel (Level Recorder)

Uno de los métodos de medición más antiguos de llevar la función de transferencia a un papel ya involucraba sweeps como señal de excitación. La respuesta del DUT a un sweep creado por un generador análogo es rectificada y suavizada por un filtro pasabajo.
El voltaje resultante es llevado a un amplificador diferencial cuya otra entrada es el voltaje derivado por un potenciómetro de precisión que es mecánicamente acoplado a un lápiz de escribir. La salida del amplificador diferencial controla el lápiz que pasa sobre un papel que contiene una escala apropiada. El potenciómetro puede ser lineal o logarítmico, para producir lecturas en el papel de dB. Obviamente este método no necesita circuitos digitales y fue usado como estándar de medición de respuesta de frecuencia por muchos años. La señal de excitación usada es un sweep logarítmico, esto quiere decir que la frecuencia aumenta por un factor fijo por unidad de tiempo. El papel se mueve con velocidad constante, la escala de frecuencia en el papel es correspondientemente logarítmica. El espectro de un sweep logarítmico decae 3dB/oct. Cada octava comparte la misma energía, pero esta energía debe ser repartida sobre un ancho de banda mayor, por lo tanto la magnitud de cada componente de frecuencia disminuye. Una de las ventajas es que la distribución espectral tiene una buena adaptación con el ruido ambiental, resultando una buena relación señal ruido incluso en bajas frecuencias. A pesar que el método de grabador de nivel no puede suprimir el ruido o reflexiones, se
puede suavizar la respuesta reduciendo la velocidad del lápiz. El ripple en una respuesta de frecuencia causado por una reflexión es convertido en un movimiento irregular del lápiz, que puede ser “alisado” de esta simple manera. Si los detalles espectrales son muy confusos por la reducción de sensibilidad del lápiz, se puede corregir reduciendo la razón del sweep para obtener la resolución requerida. De esta manera existe un compromiso entre el largo y la certeza de la medición, al igual que en los métodos
modernos basados en proceso digital de señales.
La deficiencia del método Grabador de Nivel (level recorder) es que no entrega información de la fase y el espectro es almacenado en una hoja de papel, en vez de ser almacenado en un disco duro como otros métodos. Claramente la exactitud horizontal de las frecuencias no es comparable con las de procesos digitales como los basados en clock de cuarzo de los conversores AD-DA. En la escala vertical, la resolución de las lecturas de amplitud en dB están restringidas por la naturaleza discreta de los servopotenciómetros que está compuesto por un número discreto de resistencias de precisión.

1.2 Espectrometría por retardo de tiempo (TDS)

TDS (time delay spectrometry) es otro método para encontrar las funciones de transferencia con ayuda de sweeps, diseñado por Heyser [3-6] especialmente para la medición de altavoces, también es aplicable para las mediciones de acústica de salas o cualquier otro sistema LTI en general. La principal funcionalidad de un analizador TDS se muestra en la fig.1

El analizador muestra un generador que produce dos señales sinusoidales simultáneamente en fase. El seno es llevado al altavoz bajo prueba (LUT, loudspeaker under test) y la respuesta capturada es multiplicada separadamente por ambas señales originales, el seno (para obtener la parte real de la función de transferencia) y el coseno (que tiene un desfase de 90 grados respecto al seno), para obtener la parte imaginaria.
La salida del multiplicador es filtrada por un filtro pasa bajos con frecuencia de corte fija. El multiplicador actúa similar a los mixers usados en etapas de frecuencia intermedia de receivers HF (principio superhet), produciendo la suma y diferencia de las frecuencias de entrada. La suma de los términos de ambas salidas de los multiplicadores es rechazada por el filtro pasa bajos, mientras que los términos de la diferencia pueden pasar dependiendo de su frecuencia. Si ambas frecuencias, la generada y la capturada, son iguales, la frecuencia de salida de la diferencia será mucho menor y de ésta manera no será atenuado por el filtro pasa bajos.
Como el sonido que viaja desde el LUT al micrófono llega con un retardo, su frecuencia momentáneamente será menor que la del generador de señales. Esto causa una diferencia de frecuencia mayor a la salida del mixer que, dependiendo de su frecuencia de corte, será atenuado por el filtro pasa bajos. Por esta razón la señal generada debe tener un “retardo de tiempo” por una cantidad equivalente a la distancia entre el alto parlante y el micrófono antes que sea multiplicada por la respuesta del LUT. De esta manera, la diferencia de frecuencia será cercana a una señal DC. Como sabemos, las reflexiones siempre tendrán un camino mayor que el sonido directo, de esta manera llegaran con una frecuencia instantánea menor, causando mayores componentes de frecuencia en la salida del multiplicador por lo que serán atenuados por el filtro pasa bajos.
Con una selección apropiada de la razón del sweep y la frecuencia de corte del filtro pasa bajos, al utilizar TDS es posible simular mediciones casi en campo abierto. No solo las reflexiones molestas serán atenuadas, también serán atenuados las distorsiones (que llegan con una frecuencia instantánea mayor y producen una frecuencia mayor a la salida del mixer, por lo tanto serán suprimidas por los filtros) y ruidos (gran parte del rango de frecuencias sobre la frecuencia de corte del filtro pasa bajos). La cancelación controlada de las reflexiones es la causa por la cual los analizadores TDS utilizan sweep lineal (df dt = cte como señal de excitación). La diferencia de frecuencia entre el sonido directo entrante y las reflexiones quedarán en su totalidad sobre el rango del sweep, manteniendo la atenuación de cada reflexión independiente de la frecuencia.
Si se utiliza un sweep logarítmico el filtro pasa bajo podría incrementar su frecuencia de corte por un factor constante por tiempo para evitar el estrechamiento de la ventana de tiempo impuesta (el impacto del filtro pasa bajos en realidad es similar a la ventana de
una respuesta impulsiva en los métodos de la FFT). Por otra parte las componentes de altas frecuencias de la típica respuesta de impulso de un altavoz decaerán mucho más rápido que las de baja frecuencia. Así un estrechamiento de la ventana en altas frecuencias (correspondiente a “ventanas adaptativas” propuesto por Rife para los procesos de respuesta impulsiva) serán deseables para muchos escenarios de medición.
Esto podría incrementar la relación señal ruido en altas frecuencias, sin dañar la respuesta impulsiva más que en las bajas frecuencias.
Existen un sinnúmero de inconvenientes asociado con la medición de TDS. El más serio es el hecho de que TDS la utiliza sweep lineales y por lo tanto tiene un espectro de excitación blanco. En muchas configuraciones de medición, esto dejara una pobre relación señal ruido en baja frecuencia. Si todo el rango de audición de 20 – 20 kHz es barrido en 1 segundo, entonces el rango hasta los 100 Hz sólo recibirá energía durante 4 ms. Esto muchas veces es insuficiente en una región de frecuencias donde la salida del
altavoz disminuye mientras el ruido ambiente se incrementa. Para mejorar esta mala distribución de energía espectral los sweeps son hechos muy largos, o las mediciones separadas en dos rangos, por ejemplo bajo y sobre los 500 Hz. Ambos métodos extienden el tiempo de medición mucho más de lo que sería necesario físicamente para el desarrollo de una medición de una resolución espectral particular.
Otro problema es el ripple que ocurre en baja frecuencia. Como previamente se mencionó el multiplicador produce los términos de la suma y diferencia de la señal de excitación “retardada en el tiempo” y la respuesta en camino. En frecuencias altas, la suma es suficientemente grande para ser atenuada por el filtro pasa bajos de salida. Pero en el rango bajo del sweep, donde la suma se aproxima o es menor que la frecuencia de corte del pasa bajos, aparecerá un “golpe” (beating) en la magnitud de la respuesta obtenida. Para remediar esto los sweep pueden ser hechos muy largos y la frecuencia de corte del filtro pasa bajos disminuirá por este mismo factor. Sin embargo el mejor método es repetir la medición con una configuración espejo, que consiste en excitar el
DUT con un coseno en vez de un seno y tratar de capturar la señal como se muestra con las líneas punteadas en la fig.1b. La parte real del resultado complejo de esta segunda medición es añadida a la parte real obtenida en la medición anterior, mientras la parte
maginaria es restada. El efecto de esta operación es que la suma de los términos a la salida del mixer será cancelada, como se muestra en [7-9]. Como una consecuencia, gracias a la ausencia de la interferencia de los términos sumados sobre todo el rango del sweep, las etapas del filtro pasa bajos siguientes del multiplicador pueden ser omitidas. De hecho ellas tienen que ser omitidas si es recuperada una respuesta al impulso completa, un caso en que obviamente el impacto de la atenuación de las reflexiones causado por el filtro pasa bajos no es deseada Ciertamente las mediciones de salas acústicas, en las que siempre implica obtener largas respuestas impulsivas, son solo realizables con el método de excitación doble. Si sin embargo el objeto de interés es un altavoz, se requiere mantener el filtro pasa bajos insertado en orden para rechazar las reflexiones, ruido y armónicos.

Igual que la cancelación de los términos sumados en el método de doble excitación, algún ripple podría aparecer al comienzo y al final del rango de frecuencias del sweep debido al abrupto principio del sweep lineal. Por la teoría de sistemas el comienzo de una señal sinusoidal corresponde a un espectro corrugado cerca de la frecuencia inicial ver fig.15.
Una manera común de enfrentar este problema es permitir que el comienzo del sweep de excitación este muy por debajo de la frecuencia de interés, esto podría implicar comenzar el sweep en frecuencias negativas que en la práctica quiere decir se
comenzará en la correspondiente frecuencia positiva, bajando a 0Hz y después incrementando la frecuencia normalmente [8]. Una mejor posibilidad podría ser formular un sweep de excitación en el dominio espectral para crear una señal que no sufra pérdida espectral (ver fig.16), como se demostrará en el capitulo 4.2.
Por supuesto, es necesario el uso del método de excitación doble para recobrar un completa IR que se extienda más allá del tiempo necesario para completar la medición del TDS. Por otra parte los métodos de FFT o MLS que utilizan estímulos periódicos en la practica requieren una señal de excitación que se emita dos veces para recobrar la respuesta impulsiva periódica. Con estos métodos la respuesta periódica del DUT es capturada sólo en la segunda emisión después de la estabilización. Por el contrario el método de la doble excitación TDS utiliza ambas, lo que atribuye la ventaja de aumentar 3 dB de relación señal ruido sobre MLS, con la misma longitud de excitación (ambos tienen espectro blanco). Con la ausencia del filtro pasa bajos la resolución espectral de la medición TDS es tan alta como con una excitación periódica de una misma longitud de periodo. Así una medición de doble excitación TDS requiere el mismo tiempo que una edición MLS para conseguir la misma resolución espectral, esto contrasta de algunas comparaciones entre TDS y MLS en la literatura [13] en donde se asume un cierto filtro pasa bajo y se calcula una correspondiente resolución de frecuencia, en un intento por demostrar que se necesita un largo sweep para obtener la resolución de una medición MLS sin ventana. Pero por supuesto el impacto del filtro pasa bajo TDS es equivalente a aplicar una ventana para recuperar la IR, y cualquier ventana reduce la resolución espectral. La posibilidad de realizar mediciones simulando campo libre y el efecto de suavizado de las reflexiones es muy bien recibido en las mediciones de altavoces con ambos métodos (al menos en las octavas superiores).
Sin embargo, la relación entre la razón del sweep TDS, la frecuencia de corte del filtro pasa bajos y la atenuación conseguida por las reflexiones tardías no es evidente inmediatamente, a pesar de que no es muy difícil de calcular [10]. Pero es más intuitivo analizar la IR completa derivada por mediciones MLS y FFT (o excitación dual TDS) y posicionar una ventana cuyo lóbulo derecho termina justo antes de la primera reflexión molesta. De esta manera, todas las reflexiones siguientes son eliminadas. En contraste, después de varios ajustes de la frecuencia de corte, TDS no es capaz de suprimir las reflexiones debido a la pendiente limitada de los filtros pasa bajos (permitiendo solo el uso de una versión digital FIR de alto orden). El efecto de suavizado en las funciones de transferencia recuperadas no es muy definido, mientras que el uso de ventanas [33] ofrece un buen y claro compromiso entre el ensanchamiento del lóbulo principal y la supresión del lóbulo lateral.
Usando solamente sweeps en conjunto con análisis FFT, sin multiplicadores produce resultados inmediatos, obviamente muchos problemas inherentes a TDS, especialmente la insuficiencia de energía en bajas frecuencias y los largos ciclos de medición. Sin embargo no pueden ser ignoradas muchas ventajas de las mediciones TDS sobre MLS.
El mencionado aumento de la relación señal ruido en una medición de doble excitación TDS puede ser aumentada aun más tomando ventaja del bajo factor de cresta de solo 3 dB inherente al barrido senoidal. En la práctica, MLS tiene un factor de cresta de cresta de al menos 8 dB como se dará a conocer posteriormente. La medición TDS también ofrece alta tolerancia contra la varianza del tiempo y mejor rechazo a la distorsión armónica que puede ser filtrada junto con el ruido y las reflexiones.

1.3 Análisis FFT de dos canales

El principio básico del análisis FFT de dos canales (dual-channel) consiste en dividir el espectro de salida el DUT con el de la señal de entrada, como en todos los métodos de medición de la función de transferencia basados en FFT. Sin embargo, la fuente de ruido tradicional de los analizadores de dos canales es no determinístico y por lo tanto su espectro no puede ser conocido previamente. Esto influye en capturar y procesar la entrada y la salida simultáneamente.
Aunque esto parece una desventaja en comparación con otras técnicas que solo requieren un canal, el principal inconveniente la FFT tradicional de dos canales es la naturaleza de la señal de entrada comúnmente empleada. Esta usualmente tiene un espectro blanco (o rosado) cuando es promediada por un largo tiempo, pero una foto instantánea del ruido de la señal tiene un espectro corrugado que sufre profundas depresiones de magnitud. Así, un analizador de dos canales debe promediar varias mediciones antes de presentar un resultado confiable. Como en algunos intervalos del análisis, la relación señal ruido es deficiente en algunas frecuencias, estas deben ser eliminadas del proceso de promediado debido a la división de ambos canales, ya que ésta podría provocar un gran error que impedirá mostrar la respuesta de frecuencia.
La detección de la deficiencia de la relación señal ruido comúnmente es realizada por la función de coherencia [12], [13]. Debido a la necesidad de promediar muchos bloques de datos para obtener un resultado consistente, la sensibilidad del análisis de dos canales
es bastante deficiente y la hace poco atractiva para propósitos de ajuste.

En mediciones acústicas tiene que ser conocido el retardo preciso del camino de transmisión acústica, pues la señal directa será retrazada en ésta cantidad de tiempo para analizar los correspondientes trozos de la señal de excitación (ver fig. 12). Además, con el fin de evitar los efectos de pérdida, los bloques de señal considerados en el análisis de FFT deben ser pasados por una ventana. Esta es una importante fuente de error, ya que las componentes retrasadas son atenuadas más que el sonido directo.
El análisis de dos canales puede ser mejorado considerablemente, generando la IR de cada medición mediante la IFFT. El uso de ventanas en la IR ofrece una libertad importante para controlar la cantidad de reflexiones consideradas en el resultado y para eliminar el ruido fuera del intervalo de la ventana, así mejora el proceso de convergencia. No todos los analizadores de dos canales ocupan esta útil característica que no es incluida en la fig.2.
Hay una aplicación bien conocida para el análisis de dos canales que ninguna otra tecnología de medición ofrece: La posibilidad para medir sistemas de sonidos discretamente durante un espectáculo, usando el mismo material del programa como señal de la excitación. Sin embargo, música con distribución espectral impredecible es usualmente una peor señal de excitación que lo ruidos no correlacionados y requiere periodos de promediado incluso mayores para obtener resultados confiables. De este modo, cuando no se necesita ser discreto, es aconsejable usar un generador de ruido como fuente. Se pueden obtener resultados mejores en un tiempo más corto usando señales determinísticas hechas a la medida con técnicas FFT.

1.4 Senos paso a paso (Stepped Sine)

Probablemente el método que ocupa la mayor cantidad de tiempo para obtener la función de transferencia del DUT es la excitación paso a paso (stepped sine) con tonos puros incrementando su frecuencia. La respuesta del DUT a la estabilidad de la excitación puede ser analizada filtrando y rectificando la fundamental, o realizando la FFT y recuperando la fundamental del espectro. El método anterior requiere el uso de un seno que es exactamente periódico dentro de las fronteras de una longitud del bloque de la FFT para evitar una pérdida espectral (leakage). En la práctica, esto solo puede ser realizado generando un seno digital, y emitiéndolo vía el conversor DA que es sincronizado con el conversor AD. Además el método de la FFT permite la completa eliminación de todas las otras frecuencias, por lo que este método es preferido sobre el análisis del dominio del tiempo que involucra filtros pasa banda, con una restringida selectividad y precisión.
Después de cada medición la frecuencia del sweep de excitación es elevada al valor acorde a la resolución espectral deseada. En mediciones acústicas la frecuencia será incrementada por la multiplicación al valor previo por un factor para obtener el espaciamiento logarítmico. Claramente la resolución espectral en las mediciones de stepped sine es baja en altas frecuencias comparada con la obtenida usando una señal de excitación de banda ancha con análisis FFT. Pero no necesariamente es una desventaja ya que la resolución fina es poco usada en altas frecuencias mientras que la pérdida de información en bajas frecuencias, proveída por la FFT en el mismo intervalo de tiempo usado, es más pequeña.
La mayor ventaja del método stepped sine es la enorme relación señal ruido que puede ser obtenida para una medición. Toda la energía es concentrada en una única frecuencia, y la onda senoidal de alimentación tiene un factor de cresta de solo 3dB, permitiendo la estabilidad en un alto nivel continuo. De esta manera, la certeza y repetibilidad para una frecuencia puede ser mucho mayor comparado con una excitación de banda ancha, especialmente cuando usamos la técnica de sincronización de FFT.
Es por esto que a pesar de la considerable cantidad de tiempo para completar la evaluación de la función de transferencia, este método es aun popular para mediciones de precisión y calibración de equipamiento electrónico, o transductores acústicos como
micrófonos. Este método también es estable cuando se requiere precisión para medir la distorsión. Cada armónico puede ser escogido con una alta precisión del espectro de la FFT.
Sin embargo, cuando solamente la función de transferencia es de interés, el método de stepped sine no es bueno. Sólo parte de la energía emitida por el DUT puede ser usada para el análisis, ya que después de cada cambio a una nueva frecuencia, debe ser esperado un cierto tiempo antes que el DUT quede en estado estable. Especialmente cuando existen resonancias de alto Q (correspondiente a largas IR), este tiempo debe ser muy largo para reducir errores a niveles insignificantes. Por otro lado, cuando el sistema es muy ruidoso y deben ser realizados muchos promedios sincrónicos para obtener una mejor certeza en la medición, el tiempo juega un rol menor [14].
En mediciones acústicas con tonos puros, solo es posible eliminar las reflexiones cuando la diferencia de tiempo entre el sonido directo y reflejado es mayor que el intervalo del análisis. Esta es una clara desventaja comparada con los métodos que
recuperan la respuesta impulsiva.
La precisión alcanzable con la medición de un tono (single tone) también debe ser puesta en duda. Debe quedar claro que la misma precisión puede ser obtenida con una medición de banda ancha en un tiempo menor. Mientras las mediciones stepped sine
entregan magnitudes de una única frecuencia con una muy alta relación señal ruido, una medición de banda ancha entrega muchos valores en un intervalo particular de frecuencias. Claramente cada uno de ellos tiene menor certeza, pero realizando una
suavización espectral sobre un ancho correspondiente al incremento de frecuencia usado en la medición de tonos puros, el ruido aleatorio debe disminuir a valores comparables.
Esto, sin embargo, asume que la distorsión armónica producida puede ser totalmente eliminada de la medición de banda ancha, una condición que sólo puede ser realizada por mediciones con sweep, como se dará a conocer posteriormente.

1.5 Impulsos

Usar un impulso como señal de excitación es la manera natural de obtener la IR y también la más sencilla aproximación para el desarrollo de la medición de función de transferencia basada en la FFT. El impulso puede ser creado por medios análogos o preferentemente enviándola por un conversor DA y amplificándola. Este alimenta al DUT cuya respuesta es capturada por el micrófono, amplificada y digitalizada por un conversor AD (Fig. 3). Como el nombre lo indica, esta respuesta capturada ya es la IR deseada, siempre que el estilo del pulso Dirac utilizado tenga una respuesta de frecuencia lineal. Para aumentar la relación Señal-Ruido el pulso puede ser repetido periódicamente, y las respuestas de cada periodo sumadas. Esto permite que la respuesta periódica al impulso (PIR) sea prácticamente igual a la no periódica (IR) si es que esta es más corta que la medición periódica (en la práctica: si la IR se desaparece con el ruido de fondo antes del fin del período). Como es sabido tales promedios sincronizados permiten una reducción de ruido de 3dB cuando el ruido es no correlacionado, relativo a la IR por cada duplicación del número de promedios.

La IR opcionalmente puede ser desplazada a la izquierda (o la PIR desplazada de manera cíclica) para compensar el retardo producido por el tiempo de llegada entre el altavoz y el micrófono de la medición acústica. La aplicación de ventanas elimina
reflexiones indeseadas y aumenta la relación S/R.
La IR puede entonces ser transformada en una función de transferencia por la FFT. Para aumentar considerablemente la precisión de la medición, el resultado debe ser multiplicado por un espectro de referencia. Este espectro de referencia es obtenido por la conexión de la entrada y la salida del sistema de medición e invirtiendo la función de transferencia medida. Aplicando esta técnica (independientemente del tipo de la señal de excitación) ofrece la libertad de realizar un pre-énfasis de la señal de excitación para adaptarla a las contribuciones espectrales del ruido de fondo. Este pre-énfasis será automáticamente eliminado del resultado de la función de transferencia aplicando el espectro de referencia obtenido en todas las mediciones subsiguientes.
Los impulsos son una simple y no tan mala manera de medición cuando es puramente eléctrica (cuando no hay un camino acústico en la cadena de medición) y la medición debe ser lo más rápida posible. Sin embargo, ellos requieren un bajo nivel de ruido de fondo del DUT para obtener certeza razonable de la medición. Cuando se miden equipos de audio con bajo nivel de ruido, este requerimiento es fácilmente obtenido. A pesar de que se encuentra lejos de la opima relación S/R los impulsos igualmente pueden ser usados en acústica. En una cámara anecoica donde el ruido ambiente es bajo en altas frecuencias, los tweeters pueden ser medidos con una razonable relación S/R.
Debido a su brusquedad, los pulsos, pueden alimentar con un alto voltaje el cono del altavoz, sin considerar el posible daño de sobrecalentamiento. Se debe tener consideración de no causar una excursión en el rango no lineal del altavoz (aunque esto puede ser provocado con un pulso muy estrecho [15]), esto causará que la amplitud sea más pequeña que la esperada y por lo tanto conducirá una aparente pérdida de sensibilidad [16].
Generalmente toda la distorsión en una medición por pulso ocurre simultáneamente con la IR y por lo tanto no puede ser separada de esta. Para aumentar la relación S/R de la medición de un tweeter los impulsos pueden ser repetidos y promediados en intervalos pequeños, cuando la IR recuperada es muy corta y requiere una resolución de frecuencia lineal bastante baja.
Las pruebas impulsivas no permiten identificar la distorsión pero son bastante inmunes contra los efectos perjudiciales de la variación del tiempo, no como las mediciones MLS o basadas en ruidos para ambientes exteriores. Esto es simple, no requieren un sofisticado procesamiento de señal y trabajan muy bien para ciertos tipos de medición.
Es por esto que han sido un método muy popular [15], [17]. Cuando se disponen de bastantes amplificadores de potencia, el aumento de la relación S/R usando señales de excitación extendidas en el tiempo comparadas con la medición de un pulso, no es tan grande como se esperaba, ya que el altavoz generalmente puede ser alimentado con pulsos de alto voltaje. La ganancia de relación señal ruido disminuye favoreciendo a las mediciones con pulsos, cuando se considera la distorsión en la IR obtenida por
mediciones con ruido, como MLS.

1.6 Secuencias de máxima longitud (MLS)

Las señales MLS (maximum length sequences) son secuencias binarias que pueden ser generadas de una manera muy fácil con un N-staged shift register y una compuerta XOR (con hasta 4 entradas) conectada con un shift register (alternador de registro) de
tal manera que todos los 2N estados son posibles, menos el caso de “todos 0” [18]. Esto puede ser logrado con un hardware con pocos y simples TTL-IC o por un software con menos de 20 líneas de código assembler.

En los tiempos en que el código MLS fue popular, la posibilidad de crear secuencias por hardware estaba restringida por la memoria. En los ’80 la memoria máxima en un PC IBM 8088 era de 640 KB. Claramente el tener que almacenar largos arreglos de datos para capturar y procesar la respuesta del DUT era un gran inconveniente. Hoy en día esta desventaja no es tal, ya que con la tecnología existente es mucho más fácil crear secuencias MLS por software y sacar la señal de salida desde la memoria a través de un conversor DA del sistema de medición.
Como el caso “todos cero” de la secuencia está excluido, la longitud de la secuencia MLS es 2N-1. Aunque se pierde un valor para tener un bloque de longitud exacto para una FFT, MLS tiene propiedades únicas que los hacen convenientes para la medición de la función de transferencia. Su autocorrelación, es muy cercana de un pulso Dirac, indicando un espectro blanco. Reiterado periódicamente como un tren de pulsos, todas las componentes de frecuencia efectivamente tienen la misma amplitud, por lo que su espectro es perfectamente blanco. Comparado a un pulso de la misma amplitud, mucha más energía puede alimentar al DUT ya que la señal de excitación es alargada sobre el periodo entero de medición. De esta manera aumenta la relación S/R.
Normalmente, un MLS no se hace salir como tren de pulso, pues éste significaría la alimentación de energía muy pequeña al DUT subsiguiente. En vez de esto, la salida del hardware generador MLS generalmente se mantiene constante entre dos pulsos de clock. En el caso del hardware generador de MLS, existe una pérdida de apertura sin(x)/x en fs/2 de al menos 4dB que debe ser compensada posteriormente. Cuando se emite MLS por un conversor DA usando oversampling, el cual es el estándar de hoy, el espectro será plano hasta le frecuencia de corte de filtro digital. En el caso de conversores más baratos, se puede introducir un notable ripple sobre toda la banda de paso. Estas ondulaciones de frecuencia lineal están siempre presentes hasta cierto punto en el oversampling de los conversores de audio. Estás se originan de la fase lineal del filtro FIR anti-alias. Estos son fabricados por medio del algoritmo Parks-McClellan [19], viendo el ripple de banda contra la banda de detención. Además ellos son prácticamente
siempre diseñados como filtros de media banda que dividen en dos el cálculo de potencia requerida, pero exhiben una atenuación de solamente 6,02 dB en fs/2. Es por esto que siempre existe una pequeña región de aliasing inválida en las cercanías a la frecuencia de Nyquist cuando la medición esta hecha con conversores de audio. El filtro anti-alias también induce a un fuerte salida de MLS por lo que no pueden ser usados con todo el nivel. En el capitulo 2.2 se clarificara este tema.
Señales de excitación con espectro blanco permiten el uso de la correlación cruzada para recuperar la respuesta impulsiva del sistema. Mientras normalmente, una correlación de cruce se desarrolla más eficientemente en el dominio espectral por una multiplicación complejo-conjugado, la conocida transformada de Hadamard (FHT, fast Hadamard transformation) puede desarrollar esta tarea para señales MLS sin dejar el dominio del tiempo. Nosotros omitiremos la teoría que existe detrás de esto ya que ha sido desarrollada y explicada muchas veces, por ejemplo en [18], [20-23].
El algoritmo Butterfly que ha sido empleado en la FHT solo usa sumas y restas y puede operar con los datos enteros entregados por el conversor AD. Anteriormente esto significaba que el desarrollo de estos cálculos era mucho más corto que el de una FFT de similar longitud.
Pero hoy día esta diferencia ha disminuido considerablemente. Los procesadores modernos como la familia de Pentium II pueden desarrollar adiciones, multiplicaciones y sustracciones de punto flotante tan rápido como las respectivas operaciones de
números enteros.
En década de los 80 la propiedad time-saving de la trasformada de Hadamard fue muy bien recibida, a pesar de que los cálculos de la respuesta al impulso en una sala de un gran ancho de banda aun consumían muchos segundos. La ventaja llegó a ser especialmente prominente sólo cuando la IR era de interés, y no la función de transferencia asociada. Esto, por ejemplo, mantiene la evaluación del tiempo de reverberación por la integración hacia atrás de la respuesta impulsiva [24]. En estos casos sólo se requiere de una FHT para transformar la respuesta MLS capturada por el micrófono en la deseada PIR. Esta FHT es más rápida que una FFT. Por el contrario usando una señal de ruido arbitrario, o un sweep como estimulo, requiere al menos una FFT y una IFFT para obtener la IR. Sin embargo, el tiempo de procesamiento ya no es una preocupación debido a los poderosos procesadores de hoy en día, las
transformaciones pueden ser desarrolladas más rápidas que en tiempo real.

Por ejemplo el procesamiento de un MLS de grado 18 (longitud del periodo de 6 segundos a 44,1 kHz de frecuencia de muestreo, una típica longitud para mediciones de ancho de banda en ambientes reverberantes) se completa en sólo 138 ms en un Pentium III/500, usando un 32-Bit-integer Radix-4 MMX-FHT particionado en sub chunks acomodados en los tamaños de 1° y 2° nivel caché. Esto abarca la permutación necesaria antes y después del algoritmo Butterfly y una búsqueda de peak. Una FFT calculada con números reales [11] para la misma longitud, también usando sub chunks anidados, que puede ser procesado enteramente en el caché termina en el doble del tiempo (280 ms), esto es aún mucho menor que el periodo de la medición.
Independientemente del principio de la medición hoy día es posible transmitir la señal de excitación continuamente y completar los cálculos y mostrarlos actualizados dentro de cada periodo, incluso para dos canales de entrada. Para mediciones de cortos períodos se obtiene buenos resultados de una medición en tiempo real, ya que pueden ser manipuladas enteramente en el caché. Por supuesto el número de operaciones por cada muestra de salida también disminuye levemente según la razón del grado (por ejemplo una FFT de grado 12 solo necesita dos tercios de las operaciones por cada muestra de salida que en una de grado 18).
En una medición basada en MLS la FHT es el primer paso de procesamiento de la señal, después de la digitalización por el conversor AD (fig. 4).
La respuesta al impulso obtenida puede ser desplazada de forma cíclica y se puede aplicar una ventana como
con una simple prueba impulsiva. Si la función de transferencia es la que se desea observar, se debe realizar una FFT adicional. Pero como los MLS tienen una longitud de 2N-1 una muestra tiene que ser insertada a la respuesta al impulso para que la longitud
sea de 2N. Mientras que computacionalmente esto es una acción trivial, hay que tener cuidado con el lugar donde se pone esta muestra. Esto debe ser una región en donde la Ir haya decaído cercano a cero para evitar grandes errores.
Cuando usamos una ventana, la muestra puede ser localizada en el área silenciada. La función de transferencia obtenida nuevamente puede y debe ser corregida por la multiplicación con un espectro de referencia obtenido previamente por una medición de
respuesta del sistema.

La medición MLS es bastante popular en mediciones acústicas, pero tiene bastantes desventajas. Tiene una alta vulnerabilidad contra la distorsión y la variación del tiempo (estas serán comparadas directamente a las mediciones con sweep en el capitulo 2), pero la más lamentable propiedad del MLS es su espectro blanco. Como será demostrado en el capitulo 3, un espectro no blanco es deseable en casi todas las mediciones acústicas.
Este requerimiento puede ser obtenido por la coloración del MLS con un énfasis apropiado. Claramente el MLS perderá su característica binaria por el prefiltrado. Así que esta técnica es viable si el prefiltrado del MLS se hace a la salida por un verdadero
conversor DA, no solo una etapa de conmutación de un bit, como utilizan algunos antiguos hardware-analizadores basados de MLS. Estos últimos son confinados al postfiltro análogo para enfatizar el MLS, pero estos no ofrecen la versatilidad de los filtros
FIR como una fase lineal, o compensación de la propia respuesta del sistema de medición [25].
La creación del MLS enfatizado puede ser hecha eficientemente por medio de la transformada inversa de Hadamard (IFHT) [25], [26]. La IFHT simplemente es la inversión en el tiempo de la respuesta al impulso del filtro de énfasis deseado (reducido a 2N-1 muestras), aplicando una FHT normal en la IR invertida y entonces nuevamente invertimos el resultado anterior. Esto produce una MLS periódica convolucionada con el filtro de énfasis. Debido a la periodicidad, cada componente discreta de frecuencia de la anterior MLS puede ser influenciada independientemente tanto en amplitud y fase.
Cuando usamos como estimulo un MLS enfatizado, en vez de MLS puro, obviamente la respuesta al impulso obtenida por la FHT consistirá en la IR del DUT convolucionada con la IR del filtro de énfasis. Para mediciones acústicas esto es significativo pues dará a la señal de excitación un fuerte estimulo en frecuencias bajas probablemente de unos 20 o 30 dB, como será demostrado mas tarde. En este caso la respuesta al impulso obtenida puede ser más ancha que la medición solamente con el DUT. Este ensanchamiento frecuentemente restringe la realización de la ventana, especialmente cuando las reflexiones que serán silenciadas están cerca del peak principal. En estos casos aplicando una ventana “pre-comp” (pre compensación) a la respuesta impulsiva no ecualizada atenuará la energía de bajas frecuencias extendida en el tiempo. Así que es mejor la aplicación de una ventana “post-comp” (post compensación), lo que significa una posterior transformación de la IR no corregida al dominio espectral, multiplicándola con la respuesta inversa de un filtro de énfasis, y eventualmente trasformándola al dominio del tiempo. Esto producirá la respuesta al impulso sólo del DUT a la cual se le puede aplicar ahora ventanas con menos pérdidas de energía en bajas frecuencias.

Si la función de transferencia es el resultado deseado de la medición, otra FFT será desarrollada después de la aplicación de la ventana de la respuesta al impulso compensada (fig. 5). Así que el número de las transformaciones es en total una FHT y tres FFT cuando se realiza la medición de la función de transferencia con MLS preenfatizado y aplicando ventanas post-comp de la respuesta impulsiva.

1.7 Señales periódicas de longitud 2N

Examinando a fondo la configuración de la medición MLS en la fig. 5, revela que actualmente el uso de MLS y la aplicación de la FHT son bastante innecesarios. Si sólo la señal de excitación tiene 2N muestras en vez de 2N-1 como las MLS, la respuesta del DUT puede ser transformada directamente al dominio espectral, omitiendo la FHT, y esto puede ser implemente multiplicando con el espectro de referencia (la multiplicación de la inversa del espectro de la señal de excitación por la respuesta de frecuencia del sistema de medición). Como esta multiplicación es una operación compleja, no sólo la magnitud, sino también la fase son corregidas para producir la verdadera función de transferencia compleja del DUT, independientemente de la naturaleza de la señal de excitación. Al desarrollar una IFFT en este espectro compensado, se producirá la verdadera respuesta al impulso del DUT (fig. 6).
Cuando comparamos esta técnica (FFT, compensación, IFFT) a la FHT queda claro que esta es lejos más poderosa y flexible, permitiendo el uso de señales arbitrarias de longitud 2N. La única restricción es que la señal de excitación debe tener la suficiente cantidad de energía en todo el rango de frecuencias de interés.
La FHT, siendo un algoritmo de la correlación cruzada, puede modificar simplemente las fases de una clase especial de señal de excitación, particularmente MLS. Esta operación es la “compresión de pulso” al MLS por medio de una convolución con el correspondiente “filtro acoplado” (matched filter). En contraste, la aproximación de la FFT compensa la fase y la magnitud de cualquier señal de excitación ya sea ruido, sweeps o cortos fragmentos musicales. Esta operación es algunas veces referida como el “filtraje mal acoplado” (mismatched filtering). Aunque en contraste con el matched filter, este no está restringido a señales de excitación con espectro blanco. La única restricción obvia es que la señal de excitación debe tener la suficiente energía sobre todo el rango de frecuencias de interés para evitar ruidos en la función de transferencia obtenida.

Claramente el desarrollo de 2 FFT consumen más tiempo de procesamiento que una única FHT, pero con los poderosos microprocesadores de hoy en día, esta desventaja es insignificante. Como nosotros hemos visto, usando MLS pre-enfatizados, y la
aplicación de ventanas post-comp (fig. 5) conduce, incluso, a tiempos levemente más largos de cálculo que usando señales arbitrarias de longitud 2N.
La técnica se asemeja al viejo análisis FFT de dos canales, pero se diferencia de esta en que la señal de la excitación es conocida por adelantado. Por lo tanto, su espectronecesita ser calculado solo una vez y se puede utilizar en todas las mediciones siguientes. Esto evita la necesidad de un segundo canal, o si esta presente de todos modos, permite analizar dos entradas simultáneamente. Una ventaja adicional es el hecho de que la precisión obtenida de un analizador de FFT de un canal supera a cualquier analizador de dos canales. Con lo último, cualquier diferencia de la respuesta de frecuencia en la entrada de los dos canales, se reflejara en la respuesta de frecuencia medida del DUT. Por supuesto los fabricantes de analizador de dos canales se esfuerzan
por hacer que estas diferencias sean lo más pequeñas posibles. Sin embargo, creando un archivo de referencia, por el reemplazo del DUT con un cable, hace que la señal de excitación pase exactamente por las mismas etapas, lo que garantiza una alta precisión.
Incluso con cualquier equipamiento, puede ser obtenida una certeza de 1/1000 dB o mejor en una medición eléctrica pura. El voltaje de referencia de la fuente, incluidos los modernos conversores AD y DA, son lo suficientemente estables para permitir esta certeza (cuando ocurre una tendencia de calentamiento, la medición de la referencia puede ser rápidamente repetida). Sin embargo, puede haber errores de la fuente debido a las impedancias de las etapas análogas de entrada y de salida. La salida de impedancia del DA debe ser lo suficientemente baja para prevenir una perdida del voltaje generado cuando lo conectamos al voltaje de salida del DUT. Estas condiciones rara vez se dan cuando usamos simples tarjetas de sonido sin amplificadores de salida.

Aún, la gran característica de un análisis de un canal, es el uso de una señal determinística en contraste a la fuente de ruido no correlacionada, normalmente usada en el analizador de FFT de dos canales. Como establecimos antes, el anterior tiene un espectro estable cuando es promediado a lo largo del tiempo, pero en un único snapshot la señal de ruido sufre pérdidas en la magnitud. De esta manera el analizador de dos canales tiene que ser promediado durante muchas mediciones antes de entregar un correcto resultado. Por el contrario, los estímulos determinísticos usados en los métodos de la fig. 6 pueden ser creados a la medida definiendo una magnitud arbitraria del espectro libre de caídas, adaptándola al ruido de fondo predominante, para lograr una independencia de la frecuencia en la relación S/R. De acuerdo al tipo de señal deseada,la correspondiente fase del espectro puede ser construida de muchos modos diferentes.
Una señal ruidosa puede ser generada fácilmente por la configuración de sus fases como valores aleatorios. La señal de excitación es obtenida por la IFFT. Repetida periódicamente esta tendrá exactamente la magnitud del espectro previamente definido (por ejemplo plano o rosado). Señales ruidosas tienen propiedades similares a las MLS, especialmente lo que consiste en su vulnerabilidad contra la distorsión y la variación del tiempo. Algunas personas se refieren a las señales ruidosas como “señales sinusoidales múltiples”, pero por supuesto cualquier señal que no sea pura es una señal de múltiples senos.

Como el espectro predefinido de una señal de ruido es sólo valido para una repetición periódica, la medición o puede ser comenzada inmediatamente después de encender el estimulo, al menos tiene que ser esperado un tiempo correspondiente a la longitud de una respuesta al impulso para que la respuesta del DUT se estabilice. Como la longitud de la IR no siempre es conocida de antemano, resulta práctico ejecutar simplemente dos periodos de la señal de excitación. La adquisición de la señal sólo comienza en la
segunda partida, al igual que las mediciones MLS. Similarmente, solo la mitad de la energía emitida es usada para el análisis en una sola medición (single shot). Por otra parte, la periodicidad nuevamente permite la manipulación completamente independiente de cada componente de frecuencia. Por ejemplo, podemos seleccionar una única frecuencia para realzar o atenuar reduciendo o mejorando la energía de la señal en la banda particular de frecuencias.

1.8 Sweeps no periódicos

En vez de aleatorizar las fases para obtener una señal de ruido con la forma espectral deseada, la fase del espectro también puede ser ajustada para producir un incremento en el retardo de grupo. La IFFT revelará un sweep en vez de una señal ruidosa. Por varias razones los sweep son una bastante mejor elección para la medición de la función de transferencia que una secuencia de ruido. Primero que todo, en contraste a lo último, el espectro de un único sweep no repetido es idéntico comparado a su repetición periódica.
Los sweeps tienen que ser enviados a la salida solo una vez y la respuesta del DUT puede ser inmediatamente capturada y procesada. Así que la duración de la medición se reduce a la mitad, manteniendo en la misma resolución espectral y la relación S/R como un estimulo periódicamente repetido. Las diferencias restantes de menor importancia en el espectro del sweep repetido y no-repetido no son importantes, pues son reflejadas y canceladas más adelante por la medición de referencia que también utiliza el barrido norepetido.
La otra enorme ventaja de la medición con sweep es el hecho de que las componentes de la distorsión armónica, pueden ser completamente eliminadas de la IR obtenida.
Estas aparecen en los tiempos negativos donde ellas pueden ser separadas completamente de la IR actual. De esta manera la respuesta al impulso queda intacta de la energía de la distorsión. Por el contrario, mediciones que utilizan ruido como estímulos inevitablemente tendrán una distribución de la distorsión producida sobre todo el período.
La razón por la que la distorsión es rechazada puede ser explicada con el siguiente ejemplo:
Consideremos un sweep que recorre desde los 100 Hz después de 100 ms y llega a 200 Hz en 200 ms. Para comprimir esta señal de excitación en un pulso Dirac, el espectro de referencia necesita tener un correspondiente retardo de grupo de –100 ms en
100 Hz y –200 ms en 200 Hz. Cuando una frecuencia momentánea es 100 Hz y el DUT produce armónicos de segundo orden, una componente de 200 Hz con el mismo retardo de la fundamental de 100 Hz estará presente en la respuesta del DUT, ésta componente
de 200 Hz será tratada con el retardo de grupo de –200 ms del espectro de referencia a 200 Hz y por lo tanto aparece –100 ms después del proceso de deconvolución, así los armónicos de alto orden aparecerán en “tiempos negativos mayores”.
Para colocar realmente los productos de la distorsión en los tiempos negativos de la respuesta impulsiva obtenida, sería conveniente realizar una deconvolución lineal para señales no periódicas. En vez de esto, también es posible mantener la operación de FFT
normal y la multiplicación de referencia como es usada en las mediciones con estímulo periódico, con la condición de que el sweep de la excitación sea considerablemente más largo que la respuesta al impulso del DUT o sean insertados ceros para rellenar la
respuesta al sweep del DUT para doblar la longitud (fig. 6b). En ambos casos, la distorsión producida aparecerá al final de la respuesta impulsiva obtenida, donde ellos pueden ser interpretados como portador de tiempos negativos. Estos pueden ser removidos sin afectar la actual respuesta al impulso, como en el primer caso, se encontrará en la última parte del ruido de fondo, y en el segundo caso, cualquier información causal no se puede encontrar en está región.

Sin embargo, en ambos casos significa que como primer paso de procesamiento de señales se requerirá un largo de bloque de FFT mayor para la resolución espectral empleada. Para lograr capturar la respuesta al impulso de alta calidad en salas, es recomendable la utilización de sweeps que sean considerablemente mayores que la IR, está es la mejor manera de aumentar la relación S/R y disminuir la influencia de la variación de tiempo.
Hay una importante diferencia que concierne al ruido de fonde de la IR obtenida por una deconvolución lineal y circular. Usando una deconvolución circular resulta un ruido de donde que es básicamente constante en distribución de amplitud y frecuencia, sobre
el punto donde aparece el primer efecto de distorsión. Sin embargo, la deconvolución lineal produce un decaimiento del ruido que es progresivamente filtrada en bajas frecuencias hacia el final. Esto se debe al hecho de que la última parte del resultado de la deconvolución originada del ruido estable convolucionada con un sweep en orden inverso (por ejemplo desde altas a bajas frecuencias). El usuario debe tener conciencia de este efecto y no confundir la disminución del ruido de fondo con la parte final del
tiempo de reverberación de la sala.
El periodo de adquisición de datos en mediciones no periódicas debe ser lo suficientemente largo para capturar todos los componentes retardados. Esto significa que el sweep siempre debe ser más corto que el período de captura y el largo de FFT siguiente. En mediciones acústicas de salas, es muy beneficioso que el tiempo de reverberación para altas frecuencias sea usualmente mucho mas corto que el de baja frecuencia. Así el sweep debe ser cortado solo el tiempo correspondiente a la reverberación de alta frecuencia, permitiendo que longitud del sweep sea suficiente para que la reverberación de bajas frecuencias quede atrás de las componentes de alta frecuencia.

Acústica Capítulo 3 Acústica Musical

Acústica Musical

3.1. Introducción

La Acústica Musical estudia no sólo el comportamiento de los instrumentos musicales (tanto acústicos como electroacústicos), sino también las relaciones entre los distintos sonidos para dar origen a sensaciones musicalmente significativas, como la percepción de una escala musical, la sensación de consonancia y disonancia, los diferenciación tímbrica, etc.

3.2. Consonancia y disonancia
Al superponer dos sonidos de frecuencias muy próximas entre sí tiene lugar un fenómeno de batido (batimento) o pulsaciones entre ambos, consistente en una fluctuación periódica de la amplitud. Por ejemplo, si superponemos dos tonos puros de 700 Hz y 800 Hz e igual amplitud, se tiene la situación ilustrada en la Figura 3.1. Al sumarlos, dado que en el instante inicial (t = 0) están en fase (es decir que los cruces por cero coinciden en el tiempo), la amplitud se duplica. A medida que transcurre el tiempo, debido a la diferencia de frecuencia, las dos senoides se van desfasando, y hacia los 5 ms, el octavo semiperiodo de la senoide de 800 Hz y el séptimo de la de 700 Hz están prácticamente en contrafase, razón por la cual el resultado es casi nulo. Hacia los 10 ms vuelven a estar en fase, y por lo tanto la amplitud vuelve a ser doble. Se obtiene así un sonido modulado por una envolvente que se repite cada 10 ms, es decir que tiene una frecuencia de 100 Hz. Obsérvese que esta frecuencia es la diferencia entre las dos frecuencias superpuestas:

100 Hz = 800 Hz – 700 Hz

El resultado anterior se puede generalizar. Si se superponen (suman) dos sonidos de frecuencias f1 y f2, (f1 mayor que f2), entonces aparecen pulsaciones de frecuencia f1 – f2. Si la diferencia de frecuencias es muy pequeña, entonces las pulsaciones serán
muy lentas, y no se percibirán como una pulsación sino como una suave envolvente. Por ejemplo, si las frecuencias son 440,1 Hz y 440 Hz, la diferencia es 0,1 Hz, es decir una pulsación cada 10 s. En este caso, dado que la gran mayoría de las notas usadas en música son mucho más cortas que eso, no llegará a completarse una pulsación, produciéndose más bien la sensación de un sonido más cantado, más expresivo. Si las pulsaciones son un poco más rápidas, por ejemplo 1 ó 2 Hz, se percibe un efecto llamado trémolo, semejante a notas repetidas. Si son bastante más rápidas, por ejemplo 5 ó 10 Hz hasta unos 50 Hz, el resultado produce una sensación de agitación comúnmente denominada disonancia.

El efecto de batido analizado anteriormente suponía que los sonidos eran tonos puros, es decir ondas senoidales. Si en lugar de ello se tienen dos sonidos de los más frecuentemente utilizados en la música, es decir sonidos formados por cierta cantidad de armónicos, es posible que se produzcan batidos entre los armónicos de ambos sonidos. Supongamos, por ejemplo, un acorde formado por dos sonidos de 220 Hz y 311 Hz (un LA y un RE# respectivamente). Es sabido en música que dicho acorde resulta disonante. Si efectuamos la resta entre ambas frecuencias obtenemos:

311 Hz – 220 Hz = 91 Hz

que es un batido demasiado rápido para provocar sensación de disonancia. Pero si tenemos en cuenta los armónicos de ambos, que son respectivamente 220 Hz, 440 Hz, 660 Hz, … y 311 Hz, 622 Hz, 933 Hz, …, resulta que el tercer armónico de 220 Hz, es decir 660 Hz, interfiere con el segundo armónico de 311 Hz, es decir 622 Hz, causando pulsaciones de frecuencia:

660 Hz – 622 Hz = 38 Hz

El resultado es una sensación de disonancia. Si los sonidos hubieran sido senoidales, si bien la combinación sonaría algo extraña, no se percibiría casi agitación alguna. Nos preguntamos ahora cuándo dos sonidos forman un acorde consonante. La condición para esto es que no exista interferencia entre armónicos importantes, es decir intensos, de uno y otro sonido. Así, tenemos que la consonancia más perfecta es el unísono (frecuencias exactamente iguales, ya que en ese caso no hay en absoluto pulsaciones. Luego sigue la octava, es decir cuando los sonidos están en una relación de frecuencias 2:1 (un sonido tiene el doble de frecuencia que el otro). Aquí tampoco hay posibilidad de “choques” entre armónicos, porque todos los armónicos del más agudo coinciden exactamente con armónicos del más grave. Luego sigue la quinta, que corresponde a una relación de frecuencias de 3:2 (uno de los sonidos tiene frecuencia 1,5 veces la del otro). Tomemos por ejemplo la quinta formada por el LA de 220 Hz y el MI de 330 Hz. En este caso los armónicos sucesivos, mostrados en la Figura 3.2, difieren en 110 Hz ó más.

3.3. Escalas musicales
Las escalas musicales surgen históricamente de la necesidad de satisfacer tres principios: economía, reproducibilidad, y funcionalidad.

3.3.1. Economía
De todos los sonidos disponibles (es decir audibles) deben seleccionarse la menor cantidad posible. Una razón es que la mayoría de los instrumentos permiten realizar sólo una cantidad relativamente pequeña de sonidos. Algunas excepciones son la voz humana, los instrumentos de arco (violín, viola, etc.) y el trombón a vara. En el caso de la música grupal (orquestas, bandas), el hecho de que algunos instrumentos posean una cantidad limitada de sonidos condiciona fuertemente los sonidos utilizables por los instrumentos de afinación continua. Otra razón es la necesidad de lograr la máxima variedad con la mayor simplicidad.

3.3.2. Reproducibilidad
Los sonidos seleccionados deben ser fácilmente reproducibles, tanto vocal como instrumentalmente. Cuando se habla de “reproducibles” significa que debe ser fácil de lograr una afinación suficientemente precisa como para no alterar de modo apreciable el sentido de lo que se ejecuta o canta.

3.3.3. Funcionalidad
La escala adoptada debe satisfacer los criterios estéticos correspondientes al uso que se le va a dar. Por ejemplo, si el uso será armónico (es decir que se emplearán combinaciones simultáneas de sonidos), entonces la mayor cantidad posible de superposiciones entre sonidos de la escala deberán resultar aceptables o “agradables” de acuerdo al estilo armónico que se va a practicar. Esto implica que al adoptar una escala se deben tener en cuenta cuestiones como el gusto y otros aspectos.

3.3.4. Escalas para uso monofónico
En este caso, que corresponde a las músicas más primitivas, sólo aparece un sonido por vez. Corresponde al canto o a los instrumentos monofónicos como la flauta, etc. El principio de funcionalidad en este caso no implica ninguna restricción. El principio
de reproducibilidad requiere casi exclusivamente la memoria, ya que los sonidos sucesivos deben ser fácilmente memorizables.
El criterio básico será que existan armónicos comunes entre los sonidos más importantes de la escala, ya que de esa manera éstos actuarán como “pivotes” entre ambos, permitiendo una transición segura, es decir con buena afinación, entre ellos.
El intervalo más fácil de memorizar es el unísono (igual frecuencia), ya que corresponde a una repetición exacta de la altura anterior. Luego sigue la octava, ya que la octava de un sonido equivale a su segundo armónico. Después sigue la quinta, cuyo segundo armónico coincide con el tercero de la nota original. Podríamos seguir investigando los intervalos básicos, pero dado que los armónicos superiores al tercero son en general poco intensos, no resulta muy seguro basarse en la memoria de armónicos difíciles
de escuchar.
Se utiliza en realidad otro criterio, que es el encadenamiento de quintas y de octavas, es decir que partiendo de un sonido, se toma primero su quinta, luego la quinta de la quinta, y así sucesivamente hasta completar un número deseado de sonidos. Para la
escala más simple, se toman siete sonidos, que en notación musical son:

Luego se sube o baja la cantidad de octavas que haga falta para que todos los sonidos se encuentren dentro de una misma octava. Así, el fa se sube una octava, el do y el sol no se modifican, el re y el la se bajan una octava, y el mi y el si se bajan dos octavas. Se
obtiene la escala recuadrada en línea de puntos:

El último paso sería reordenar las notas de modo que sus frecuencias vayan en aumento. La escala así obtenida se llama escala de Pitágoras, o escala pitagórica, ya que el célebre filósofo y matemático griego fue quien la sistematizó.

3.3.5. Escalas para uso armónico o polifónico
En un estadio más avanzado de la evolución de la música surge la necesidad de combinar sonidos simultáneos, al intentar varias personas cantar una misma melodía. Entre cantantes de igual tesitura vocal era posible cantar al unísono (igual altura). Pero, por ejemplo, entre las voces masculinas y las femeninas hay una diferencia promedio de una octava, de modo que el primer intervalo de uso simultáneo (además del caso trivial del unísono) fue la octava (relación de frecuencias 2:1). Luego fueron surgiendo otros
intervalos, como la quinta (3:2) y la cuarta (4:3), y posteriormente surgió la polifonía, en la cual se superponían diferentes melodías, formando en cada instante diversos intervalos simultáneos.
El principio de funcionalidad válido para esta aplicación requiere que la mayor cantidad posible de superposiciones de sonidos de la escala que se adopte resulte “agradable”, concepto desde luego muy relativo. En la época en que se consolidaron las escalas sobre las que se basan las hoy en uso, el criterio era el de la consonancia. Las consonancias disponibles son, en orden decreciente de perfección, las ya indicadas en la Tabla 3.1 (dicho orden coincide aproximadamente con el orden histórico en
que fueron siendo aceptadas en la evolución de la música). En una música polifónica desarrollada, es de esperar que cada una de estas consonancias aparezca con cierta frecuencia, por lo que es preciso elegir los sonidos de la escala de manera de lograr la mayor
cantidad posible de superposiciones consonantes. En la escala de Pitágoras, las octavas, las quintas y las cuartas son acústicamente perfectas, pero las terceras y sextas no. Si tomamos por ejemplo, el intervalo entre un DO y un MI pitagóricos, que parecería ser una tercera mayor, resulta la siguiente relación de frecuencias:

donde los cuatro primeros factores 3/2 corresponden al encadenamiento de cuatro quintas desde el do hasta el mi agudo, y los factores 1/2 corresponden a bajar dos octavas.

Vemos que el resultado difiere de una tercera mayor acústicamente perfecta, a la cual correspondería una relación de 5/4 , es decir:

La diferencia, correspondiente a una relación 81/80, se denomina coma pitagórica, y es un pequeño intervalo de alrededor de 1/10 de tono. Esta diferencia es claramente perceptible, produciendo una consonancia no tan perfecta como el intervalo perfecto.
Este inconveniente aparece porque al construir la escala pitagórica no se utilizaron terceras perfectas. Para subsanarlo, en lugar de generar la escala por encadenamiento de 6 quintas, se utilizan sólo 3 quintas, lo cual origina 4 notas. Las tres notas que faltan se
logran tomando las terceras mayores perfectas sobre las tres primeras notas:

Luego se procede igual que en la escala de Pitágoras, subiendo o bajando la cantidad de octavas que haga falta para que todos los sonidos se encuadren dentro de una misma octava. Así, el fa y el la se suben una octava, y el re se baja una octava. Finalmente se
reordenan. Esta escala se denomina escala natural, escala perfecta o escala de Aristógenes.

3.3.6. Escala temperada
Tanto la escala pitagórica como la natural poseen 7 notas en cada octava. Al ir evolucionando la música, ya no fue suficiente con estas 7 notas. Así, la denominada música ficta fue introduciendo algunas notas falsas (“ficta” significa “fingida” o “falsa”)
no pertenecientes a la escala. Hay varias razones por las cuales resulta interesante agregar algunas notas más.
La primera es la necesidad de la transposición, es decir subir o bajar una melodía para adaptarla a la tesitura de una voz o instrumento diferente de aquel para el que fue concebida. La transposición más simple es la transposición a la octava superior o inferior según el caso, pero a veces tal transposición resulta excesiva, ya que quizás era suficiente con transportar una quinta o una cuarta. El problema es que para realizar una transposición con esos intervalos hace falta agregar un sonido nuevo en la escala de
Pitágoras y dos en la natural.
La segunda razón es la necesidad de realizar modulaciones. En música, modular equivale a realizar un cambio de tonalidad, es decir de escala, dentro de una misma pieza, de manera que algunos pasajes de la pieza utilizan una escala, y otros, otra escala.

Ambas situaciones requieren, entonces, el agregado de nuevos sonidos a la escala. Esto tiene el inconveniente de que si se quiere conservar el carácter acústicamente perfecto de los intervalos de la escala, se haría necesario agregar una cantidad enormemente
grande de nuevos sonidos, lo cual no sólo no es práctico sino que además va en contra del concepto mismo de escala planteado al principio.
Después de diversas pruebas durante varios siglos se propuso una escala con 12 sonidos en cada octava, en la cual los intervalos elegidos, pese a no ser perfectos, resultan bastante aceptables. Esta escala se denomina escala temperada. En realidad se han propuesto y utilizado históricamente varias escalas temperadas. La actualmente en uso es la que utiliza el temperamento uniforme. En ella se divide la octava en 12 intervalos exactamente iguales, denominados semitonos, cuyas frecuencias sucesivas están
relacionadas por la expresión:

Con esta ecuación se pueden calcular, a partir de una frecuencia estándar, como la del LA 440 Hz, las frecuencias de todos los otros sonidos de la escala. Los valores correspondientes a la octava central se incluyeron en el capítulo 2.

3.4. Instrumentos musicales acústicos
Haremos aquí una breve descripción de los mecanismos básicos de producción de sonido de los instrumentos musicales. Los instrumentos musicales se clasifican según el medio productor de sonido en instrumentos de cuerda, de viento y de percusión.

3.4.1. Instrumentos de cuerda
Los instrumentos de cuerda producen sus sonidos por medio de una cuerda vibrante. Los métodos para poner la cuerda en vibración son de tres tipos: la percusión, el punteo, y el frotado. La percusión consiste en golpear la cuerda, como sucede en el piano. El punteo, en separar la cuerda de su posición de reposo y soltarla, mecanismo característico de la guitarra. Finalmente, el frotado consiste en rozar la cuerda con un material de gran adherencia como ciertas fibras naturales y sintéticas, procedimiento
utilizado en los instrumentos como el violín.
De estos tres mecanismos, el de frotado es el único que permite entregar energía en forma permanente, y así reponer la que se va disipando. En los otros casos el sonido se extingue más o menos rápidamente.
Cuando la cuerda vibra, transmite en forma directa al aire algo de energía sonora. Sin embargo, el mecanismo principal de emisión de sonido no es éste. La mayor parte de la energía de la cuerda pasa a través del puente (apoyo de la cuerda) a una tabla delgada
de gran superficie denominada placa armónica, tabla armónica o caja armónica, y al vibrar ésta se produce una importante emisión sonora.
Se puede verificar lo anterior comparando una guitarra eléctrica sin amplificación con una guitarra acústica. La guitarra acústica posee caja armónica, y en cambio la guitarra eléctrica no. El sonido de esta última es prácticamente inaudible. La frecuencia de vibración de una cuerda depende de la tensión que soportan, de su masa (o peso) por unidad de longitud, y de su longitud. Si T es la tensión en kgf (kilogramos fuerza), m es la densidad lineal (masa por unidad de longitud), en g/m (gramos por metro), y L es la longitud en cm, entonces la frecuencia f viene dada por la fórmula:

que corresponde a un si grave, una octava y un semitono por debajo del do central. La fórmula revela varias cosas. En primer lugar, al tensar más la cuerda (es decir al aumentar T), aumenta la frecuencia. Este es el método clásico para afinar un instrumento
de cuerda: al ajustar las clavijas se modifica precisamente la tensión. En segundo lugar, al aumentar la densidad baja la frecuencia. Por ese motivo siempre las cuerdas graves son más gruesas. En la guitarra, por ejemplo, dado que una cuerda de nylon con la masa suficiente para las cuerdas más graves sería imprácticamente gruesa, se las recarga con un entorchado (arrollamiento) de cobre. En tercer lugar, la frecuencia es inversamente proporcional a la longitud L. Este principio se utiliza en los instrumentos de
mástil como la guitarra, el violín, el contrabajo, etc. para obtener muchos sonidos diferentes de cada cuerda (en el piano y en el arpa esto no es necesario). Otra aplicación de esta propiedad es que al reducir la longitud de la cuerda a la mitad, su frecuencia aumenta
al doble, es decir sube una octava. Este fue uno de los primeros descubrimientos de la acústica antigua, realizada por los griegos utilizando el monocordio, un instrumento de una sola cuerda. Otro descubrimiento vinculado con esta propiedad es que si se divide la cuerda en partes iguales, se obtiene la serie de armónicos. Al dividirla por 2, se obtiene el segundo armónico, al dividirla por 3, el tercero, y así sucesivamente. Esto es utilizado por los guitarristas, para obtener el efecto denominado armónico.

3.4.2. Instrumentos de viento
Los instrumentos de viento producen sonido por vibración de una así denominada columna de aire. La columna de aire es simplemente el aire dentro de un tubo, y el mecanismo de vibración consiste en que la onda sonora se refleja una y otra vez en los extremos del tubo, siendo un hecho de lo más notable que la reflexión se produce lo mismo esté el extremo abierto o cerrado (aunque con diferentes características). Hay dos mecanismos de producción de sonido en una columna de aire. El primero es el de un obstáculo que provoca remolinos o turbulencias que luego son acentuadas por la resonancia del tubo. Es el caso de la flauta. El segundo es el de la lengüeta, es decir una lámina elástica de metal, caña o plástico que obstruye el pasaje del aire. Esto implica un aumento de presión hasta que finalmente se vence su resistencia. Esto produce una descompresión que vuelve a obstruir el pasaje de aire, repitiéndose el ciclo. A esta categoría pertenece la mayoría de los instrumentos (oboe, clarinete, fagot, etc.). Inclusive los instrumentos denominados metales, como el trombón o la trompeta, utilizan este mecanismo, donde la lengüeta está formada por los labios presionados.

La frecuencia de los instrumentos de viento depende de la velocidad del sonido c y de la longitud del tubo L, según la fórmula aproximada, válida para tubos abiertos en ambos extremos, como la flauta, el oboe, la trompeta, etc.:

En este caso sólo aparecen los armónicos impares. Esto da un timbre muy particular, del cual el ejemplo más representativo es el clarinete.
La primera observación está referida a la dependencia de la velocidad del sonido. Como ésta aumenta con la temperatura, resulta que la frecuencia producida por un instrumento de viento aumenta con la temperatura. Esto justifica por qué los vientistas deben
“calentar” el instrumento, y también por qué al variar la temperatura durante un espectáculo los vientos se desafinan.
La segunda observación se refiere a la variación inversa con la longitud del tubo. Esto es similar a lo que sucedía en las cuerdas. En este caso hay tres formas de variar la longitud. Una forma es mediante orificios, como en la flauta. Al cerrar todos los orificios,
la longitud es máxima, y el tono producido, grave. A medida que se van destapando orificios, la longitud efectiva del tubo se va achicando, y el tono se va haciendo más agudo. Otra forma es mediante unas válvulas que intercalan trozos adicionales de tubo,
como en la trompeta. La última forma, es mediante un tubo deslizante (tipo telescopio), que al introducirse o extraerse del tubo principal reduce o aumenta la longitud total.
La tercera observación es que mediante el procedimiento anterior no se puede obtener mucho más de una octava, ya que cuando la longitud del tubo se vuelve demasiado pequeña, la calidad del sonido empeora. Por otra parte, a diferencia de la guitarra o el violín, donde hay varias cuerdas, en una flauta no es posible tener varios tubos (salvo en la denominada flauta de Pan). Entonces se recurre a la producción de armónicos.
Soplando de una forma particular, es posible seleccionar qué armónico se producirá (o lo que es lo mismo, se inhiben los otros). Combinando los armónicos con la variación de la longitud por cualquiera de los procedimientos detallados, se consigue cubrir varias octavas.

3.4.3. Instrumentos de percusión
Los instrumentos de percusión son aquéllos que producen sonido al golpear objetos. Los hay de altura determinada, como los xilófonos (placas de madera), los metalófonos (placas de metal) y las campanillas (varillas de metal), y los de altura indeterminada,
como los parches (tambores, bombos) en general (salvo los timbales), los platillos, etc. A diferencia de los instrumentos de cuerda y de viento, los instrumentos de percusión crean sonidos con espectro no armónico, por lo cual siempre aparecen parciales o
sobretonos no armónicos. Cuando éstos son débiles, la altura es determinada, pero cuando son intensos (como en los tom-tom) o muy abundantes (como en los platillos), la altura es indeterminada. En muchos instrumentos se crea además una resonancia con
una columna de aire, por ejemplo en la marimba, o el vibrafón, lo cual acentúa el sonido y ayuda a filtrar los parciales inarmónicos.
Dentro de la percusión existen efectos especiales, como el uso de un arco de contrabajo sobre el borde de un platillo, o el efecto de las escobillas, o el de los resortes en el redoblante.
La percusión provee una gran riqueza de posibilidades, aunque en mucha música se la relega al papel de una simple base rítmica.

3.5. Instrumentos musicales electrónicos
Los instrumentos musicales electrónicos surgieron prácticamente con la electrónica, pero recién alcanzaron difusión masiva con el advenimiento de la tecnología digital.
Antes de eso, los sintetizadores analógicos eran, o bien muy rudimentarios, o bien excesivamente costosos e inaccesibles, y, en cualquier caso, reservados para los especialistas, debido a las dificultades para obtener los sonidos deseados. En esta sección haremos un descripción muy sucinta de algunas de las características más importantes de estos instrumentos.

3.5.1. Osciladores
El elemento fundamental de todo sintetizador es el oscilador, es decir el dispositivo encargado de generar la señal eléctrica que luego se transformará en onda sonora. La salida de un oscilador puede controlarse por medio de varios parámetros. En primer lugar, puede controlarse la frecuencia, que determinará la altura del sonido producido.
Luego está la amplitud, que determina la sonoridad. Después, podemos seleccionar la forma de onda. En los sintetizadores analógicos existían pocas formas de onda posibles:
ondas senoidal, cuadrada y triangular, trenes de pulsos, y en algunos casos ruido blanco.
En los sintetizadores digitales actuales, es posible seleccionar cientos y hasta miles de formas de onda diferentes. Ello se debe a que se utilizan sonidos muestreados, es decir sonidos reales (o sintéticos) grabados y almacenados en bancos de memoria. Luego,
cada vez que se requiere producir un sonido, el oscilador simplemente reproduce el sonido durante el tiempo que haga falta (según la duración de la nota a ejecutar).

3.5.2. Control de envolventes
Hay muchos parámetros que pueden controlarse por medio de envolventes. Originalmente la envolvente surge como modelo físico para describir cómo varía en el tiempo de la amplitud de una forma de onda (capítulo 1), tal como sucede en todos los instrumentos acústicos. En un contexto más general, una envolvente es la evolución en el tiempo de cualquier parámetro imaginable asociado a un generador de sonido. Así, pueden variar en el tiempo la altura, el contenido armónico, etc.

3.5.3. Envolvente de altura
La envolvente de altura (o de fercuencia fundamental) permite simular efectos de los instrumentos reales, los cuales varían inicialmente un poco su frecuencia. También pueden generar sonidos nuevos, o que imitan sonidos naturales, como los ladridos.

3.5.4. Envolvente de filtrado
Uno de los procedimientos dilectos de la época de los sintetizadores analógicos era generar una forma de onda con un gran contenido armónico (por ejemplo un tren de pulsos muy angostos y muy altos), y luego aplicarles diversos filtros que eliminaban o atenuaban algunos de los armónicos, o bien enfatizaban otros. La envolvente aplicada a estos filtros, permitía ir cambiando en el tiempo a qué armónicos se daba preferencia. En los sintetizadores actuales, la envolvente de filtrado permite, por ejemplo, simular
electrónicamente el hecho general de que los armónicos de alta frecuencia se atenúan más rápido que los de baja frecuencia. Entonces si se tiene un filtro que deja pasar sólo las frecuencias hasta cierta frecuencia fc, reduciendo paulatinamente esa frecuencia se logra ir eliminando primero los armónicos de mayor frecuencia.

3.5.5. Moduladores
Otra característica habitual en los instrumentos acústicos es el control de la expresión a través de pequeñas fluctuaciones periódicas de algunos parámetros, por ejemplo la altura (vibrato) o la amplitud (trémolo). Si en lugar de las envolventes (o si además de ellas) se agrega una modulación en los correspondientes parámetros de control del oscilador, se consigue simular dicha expresividad. La aplicación de moduladores se estudiará más detenidamente en el capítulo 18 para el caso de los efectos.

3.5.6. Seguimiento de altura (key tracking)
En los instrumentos acústicos, gran parte de las propiedades de los sonidos varían según qué nota se esté ejecutando. Por ejemplo, las notas más graves suelen tener un contenido armónico mayor que las más agudas. También sus envolventes (ya sea la primaria, es decir la de amplitud, como cualquier otra que esté actuando sobre diversas características del sonido) pueden tener velocidades distintas según la altura. Por ejemplo, un sonido agudo se extingue más rápidamente, por lo cual su envolvente decaerá
más rápido que la de los sonidos graves.

3.5.7. Controladores
Los osciladores, con todas las características descriptas, pueden ser controlados por medio de una interfaz. Una interfaz es un dispositivo que permite la comunicación entre entes de naturaleza diversa, por ejemplo entre un sintetizador y un ser humano. El
controlador más clásico es un teclado, que simula el teclado de órgano, piano o clave. Existen otros controladores, como por ejemplo guitarras, vientos o percusión, que permiten también enviar órdenes al sintetizador sobre qué sonidos debe producir. En todos
los casos, la idea es que el músico ejecute un instrumento que le sea técnicamente familiar.

Los controladores pueden enviar información de varias clases. Lo más básico es, por supuesto, enviar información sobre qué altura generar. Pero a través de sensores en las teclas, permiten enviar información sobre la fuerza con que se tocó la tecla, que el
sintetizador normalmente transformará en un valor de amplitud. El parámetro enviado realmente no es la fuerza, sino la velocidad con que se bajó la tecla, razón por la cual dicho parámetro recibe el nombre de velocidad (en inglés, velocity).
Aún cuando la velocidad se utilice con mayor frecuencia para controlar la amplitud del sonido, muchas veces se puede utilizar para controlar otros parámetros o funciones.
Por ejemplo, se puede emplear para simular el hecho característico de los instrumentos acústicos de que los sonidos más fuertes tienen mayor contenido armónico.
Entonces se puede controlar, mediante la velocidad, la apertura o cierre de un filtro. Así, cuando se oprime la tecla rápidamente (con fuerza), el filtro deja pasar todos los armónicos. Cuando se oprime lentamente (con suavidad), en cambio, bloquea los armónicos
superiores, lográndose un sonido no sólo más suave sino también más opaco.
Algunos teclados están equipados a su vez de celdas de carga (es decir sensores de presión) debajo de las teclas, cuya finalidad sí es medir la fuerza que se ejerce sobre la tecla, pero no durante su bajada sino después. El objeto es lograr influir sobre el sonido después de iniciado, algo que en el teclado de piano no es posible pero que en cambio es muy común en instrumentos como el violín, la guitarra o la trompeta. Este parámetro se denomina postpulsación (en inglés aftertouch). La postpulsación puede
utilizarse para alterar características de la modulación, y así darle control al intérprete del tipo de vibrato, por ejemplo, que produce. También puede usarse para variar la sonoridad de un sonido que ya empezó, y así simular una nota sostenida y crescendo en las cuerdas o los vientos, por ejemplo.
Por último existen controles de afinación, modulación y volumen, a través de palancas, pedales o diales (ruedas). Estos controles permiten modificar en tiempo real la afinación, la modulación o el volumen en forma totalmente personal, lo cual permite crear el efecto expresivo exacto que busca el intérprete.

3.5.8. Efectos
Una posibilidad muy interesante que poseen ahora cada vez más frecuentemente los sintetizadores (aún los muy económicos) es la posibilidad de agregar efectos al sonido.
Por efectos se entiende modificaciones que le dan mayor expresividad, o mayor realismo, o mayor espacialidad, etc. Por ejemplo, es posible agregar reverberación, o simular mayor cantidad de instrumentos (coro), o mejorar el sonido o su percepción
(resaltadores), etc.

3.5.9. Posibilidades adicionales
La discusión anterior sugiere el hecho sumamente interesante de que con los mismos recursos introducidos para imitar con mayor fidelidad los instrumentos conocidos, es posible crear sonidos totalmente nuevos. De hecho, uno de los métodos de síntesis
más poderosos que se conocen, la síntesis por modulación de frecuencia, fue descubierto haciendo experimentos con el vibrato en los cuales se llevaban los parámetros totalmente fuera de contexto, acercando la frecuencia de la modulación a la frecuencia
fundamental del sonido.

3.5.10. Interconexión MIDI
Las posibilidades de aplicación de los sintetizadores se multiplicaron al introducirse la norma de comunicaciones MIDI (Musical Instrument Digital Interface, Interfaz digital para instrumentos musicales). Esta norma establece un código de
comunicación entre instrumentos musicales, y entre instrumentos musicales y computadoras.
Esto permite varias cosas. En primer lugar, mediante programas de computadora denominados secuenciadores (sequencers) es posible controlar el instrumento por computadora, lo cual implica entre otras cosas, ejecutar automáticamente música previamente
programada. También permite ejecutar un acompañamiento orquestal mientras el músico toca en tiempo real la parte solista en su teclado. También es posible seleccionar los instrumentos, o modificarlos (editarlos) para lograr personalizarlos al gusto del intérprete. Es posible cambiar virtualmente todos los parámetros de cualquier sonido, así como parámetros globales como la afinación, mediante
órdenes adecuadas enviadas en forma de códigos MIDI.
Por último, también es posible realizar una “grabación” de una interpretación. Esta grabación se diferencia de una grabación tradicional en que lo que se graba no son señales de audio sino las señales MIDI que permiten al sintetizador repetir en forma
idéntica la ejecución. Esto no quiere decir que no pueda luego modificarse la ejecución. A diferencia de una grabación convencional, en la cual si se cometió un error no hay mucho que pueda hacerse para corregirlo decorosamente, en una grabación MIDI es
posible eliminar y reemplazar notas equivocadas, se puede mejorar la expresividad de un pasaje, se pueden agregar voces imposibles de tocar, cambiar de timbre, etc. Las posibilidades son casi ilimitadas. En el caso de instrumentos de gran jerarquía, es posible
lograr interpretaciones magistrales, debido a la cantidad de posibilidades de control que se ofrecen al ejecutante. Sin embargo, el dominio de la totalidad de tales posibilidades requiere una práctica y condiciones personales comparables a las necesarias para la
interpretación de cualquier instrumento tradicional.

Thiele-Small parámetros del Altavoz

Thiele /Small parámetros del Altavoz

Hay diversas maneras de medir los parámetros de Thiele/Small de un driver del altavoz. El método descrito aquí proporciona una manera para el principiante y el entusiasta del HUM de medir los parámetros sin ningún equipo costoso o especializado.

Definiciones:

Re Resistencia eléctrica de la bobina de la voz
Fs Frecuencia de resonancia de la masa móvil del altavoz (en aire libre)
Qes Q eléctrico del altavoz
Qms Q mecánico del altavoz
Qts Q total del altavoz
Vas Volumen de aire equivalente de la suspensión total móvil del altavoz

Midiendo Re, Fs, Qes, Qms y Qts

Para medir estos parámetros usando el método de perfil bajo, necesitarás tener los componentes siguientes:

  • Un amplificador de energía, clasificado en 10 vatios (RMS) o más

  • Oscilador de frecuencia de audio

  • Multímetro digital (con la medida de la frecuencia)

  • Una resistencia de 5 vatios (cualquier valor entre 4 a 10 ohmios)

  • Pinzas de cocodrilo – usted necesitará 4 sistemas de plomos (los plomos pueden ser soldados uno en lugar de otro)

El cuadro 1 muestra una curva típica de impedancia para un altavoz (véase cuadro 5 para el circuito equivalente de este “altavoz”, que fue simulado para este artículo). La resonancia causa un gran aumento de impedancia, y en una cierta frecuencia más alta, la inductancia de la bobina de la voz hace que la impedancia se eleve otra vez. La región para las medidas iniciales debe estar dentro de la región “linear” de la curva de la impedancia. En el ejemplo de abajo, la resonancia está en 27Hz, y la región linear se extiende alrededor de 100Hz a 400Hz.

En la resonancia, la impedancia del altavoz es resistencia pura. Pues la frecuencia aumenta hacia resonancia, la característica de la impedancia es inductiva. Más allá de la resonancia como caídas de la impedancia, la característica de la impedancia es capacitativa. Dentro de la región “linear”, la impedancia es otra vez (casi) resistente, pero en la impedancia nominal del altavoz. En la frecuencia donde la inductancia de la bobina de la voz llega a ser significativa, la impedancia es progresivamente más inductiva pues se eleva la frecuencia. Es común agregar una red de compensación para mantener una característica resistente total en estas frecuencias más altas, para no comprometer el funcionamiento del filtro de la cruce.

ohms-altavoz

Cuadro 1 – Curva De la Impedancia Del Altavoz

El multímetro debe ser capaz de medir frecuencia, así como voltaje AC (corriente alterna) y resistencia. Se hace imprescindible la recomendación este multímetro, puesto que las medidas de la frecuencia son críticas. El amplificador debe ser capaz de reproducir a partir 10 hertzios a 2 kilociclos sin la variación en voltaje de salida. Es totalmente necesario que sea insensible a cualquier carga sobre 4 ohmios. El oscilador de audio debe también producir una señal con la distorsión relativamente baja, y el voltaje de la salida no debe variar mientras que se ajusta la frecuencia.

Medir la resistencia a través de los terminales del altavoz para obtener Re.

Medir la resistencia exacta de la resistencia de la fuente de 5 vatios, Rs.

El driver del altavoz se debe suspender en espacio libre, sin superficies de obstrucción o interferencias cercanas. Cualquier límite más cercano de 60 cm. (afectará a la exactitud de las medidas

Conecta el circuito según se muestra en el cuadro 2, el oscilador audio con los terminales de entrada del amplificador, pero con el multímetro conectado a los terminales de salida del amplificador en vez del “resistor”.

Fija el oscilador a aproximadamente 100 a 200 hertzios (o por lo menos a 2 octavas sobre la resonancia).

Fija la salida del amplificador entre a 0.5V y a 1.0V (esto es: Vs). Puedes necesitar experimentar con diversos voltajes, dependiendo de la exactitud de sus lecturas actuales (o de los cálculos). No intentes utilizar voltajes más altos, pues el altavoz puede dirigirse fuera de su gama linear, que arruinaría la validez de las medidas. Los parámetros que son medidos son de ” pequeña señal”. Es esencial que una pequeña señal sea realmente utilizada.

Calcula la corriente del altavoz ( Is), para cerciorarte de que tendrás una corriente razonable de trabajo. Comprueba que el altavoz no esta cerca de la frecuencia de resonancia, cambiando la frecuencia del oscilador por 50Hz o en cualquier dirección, y mide el voltaje a través del altavoz. No la debes cambiar por cualquier cantidad apreciable.

Is = Vs/(Re + Rs)

Vuelve a conectar el circuito según lo demostrado en el cuadro 2, usando otra vez las pinzas de cocodrilo cuando sea necesario.

cuadro-2

Cuadro 2 – Medir los parámetros principales del altavoz

Ajusta la frecuencia hasta que el voltaje a través de la resistencia alcanza el valor mínimo. Sin cambiar nada, mide cuidadosamente la frecuencia y el voltaje a través del “resistor”.

Frecuencia Fs
Voltaje a través del resistor VM

Calcule el siguiente…

Corriente del altavoz Im = VM/Rs
Impedancia del driver en la resonancia Rm = (Vs -Vm) / Im
r0 r0 = Is / Im
corriente de -3dB Ir = (Im * Is)^0.5
voltaje de -3dB Vr = Ir * Rs

Termina las medidas para la Fi y Fh, para los cuales el voltaje a través del la resistencia de la fuente es igual a Vr, y como comprobación (asegurarse de que sus cálculos y medidas son exactos), calcula la frecuencia resonante basada en estas dos medidas pasadas.

Comprueba eso… (FI * Fh) = Fs

Comprueba lo dicho anteriormente, (dentro de 1 o de 2Hz), después Qes, Qms y Qts pueden ser calculados como sigue:

Qms = Fs * r0/(Fh – Fi)
Qes = (Qms/(r0 – 1)) * (Re/(Rs + Re))
Qts = Qms * Qes/(Qms + Qes)

Puedes utilizar la hoja adjunta para realizar los cálculos automáticamente, ver: ls_param.xls

Medida de Vas (volumen de aire equivalente)

Para medir Vas, utiliza un buen recinto sólido del volumen que sea aproximadamente un cubo del tamaño nominal del altavoz. Por ejemplo, un altavoz de 300mm (12″) necesita una caja de cerca de 28 litros. Para esta referencia, un pie cúbico es 28,3168 litros, y un litro está contenido por un cubo de 100mm por cada lado.

cuadro-3

Cuadro 3 – Disposición para medir Vas

Determina el volumen total, incluyendo el recorte del altavoz y esta encerrado por el cono con el altavoz montado en el exterior de la caja para el acceso fácil. Mide la frecuencia resonante en esta situación, y utiliza la frecuencia resonante libre del espacio de aire que determinada según lo demostrado anteriormente. La determinación del volumen encerrado por el cono del altavoz es algo difícil.

Utiliza uno de los métodos siguientes…

  • Coloca el altavoz en una bolsa de plástico, asegurándolo, se sella totalmente. La bolsa se debe aflojar bastante para poderlo empujar fácilmente por el área del cono. Coloca el altavoz envuelto en una superficie plana, con los revestimientos del cono hacia arriba. El cono se puede en este momento llenar de agua con cuidado, y verter el agua cuidadosamente hacia fuera en un jarro, se mide. La medida que resulta será un poco mayor que el volumen real porque el cono será presionado por la masa del agua. El área del recorte del altavoz en la caja todavía debe ser agregada.

  • Toma una serie de medidas. El área interna del cono se mide, después se divide en las secciones del volumen que puede ser calculado. Para la mayoría de los altavoces tendremos dos formas básicas hacer, y aunque este método no es el 100% exacto, dará probablemente el mejor resultado en la mayoría de casos.

cuadro-4

Cuadro 4 – Determinación del volumen del cono

Hay un cilindro plano (disco) que se ha formado por el área externa de la campana y del recorte en el recinto. El anillo triangular se ha formado por el cono en sí mismo, según se ha demostrado arriba. Finalmente, el cilindro ocupa el área sobre el “dust cap”. La profundidad del cilindro debe ser un promedio aproximado de la distancia de la superficie de montaje y del “dust cap”.

El volumen del cilindro y del disco es dado por la fórmula convencional…

V CYL = * r 2 * h (donde r es el radio r y h es altura), y…
Vdisc V = * r 2 * h

El volumen del “anillo triangular” es dado por…

V ring = ((* r 2 * h) – VCYL) / 2

El volumen total del altavoz es simplemente la suma de los 3 volúmenes calculados arriba. Se calcula el volumen de la caja como uno normalmente, tomando mucho cuidado de asegurarse que las medidas son exactas. La caja se puede apoyar, pero no debe tener ninguna fibra de vidrio u otro material de amortiguamiento del sonido interior. Cerciórate de que el volumen ocupado-apoyando esté considerado en tus cálculos. Incluso una caja simple será suficientemente rígida en las frecuencias interesantes, así que no se requiere un gabinete acústicamente muerto (aunque no dañará).

Vas = Vb((Fb/Fs) 2 – 1)

donde Vb es el volumen cubierto por el altavoz y la caja, y Fb es la frecuencia de resonancia del altavoz y de la caja combinados. Fs es la resonancia libre del aire medida previamente.