Estimador consistente
11.2.3 Reducción de Varianza
Un examen superficial de las estimaciones espectrales para la serie de medidores de alambre en las Figuras 5 y 6 revela una variabilidad sustancial entre frecuencias, tanto que es difícil discernir la estructura general en las estimaciones espectrales sin una cantidad justa de estudio. Todos los estimadores espectrales directos sufren de esta picosidad inherente, que se puede explicar considerando las propiedades distributivas de S^X (d) (f). Primero, si f no está demasiado cerca de 0 o f (N) y si SW (⋅) satisface una condición de regularidad leve, entonces 2S^w(d) (f)/Sw(f)=dx22; es decir, el rv 2S^w(d) (f)/Sw (f) es aproximadamente igual en distribución a un rv chi-cuadrado con 2 grados de libertad. Si no se utiliza el estrechamiento, f se considera “no demasiado cerca” de 0 o f(N) si 1/(n-p)Δt<f<f(N)-1/(n-p)Δt; si se usa el estrechamiento, debemos reemplazar 1/(n-p)Δt por un término más grande, que refleje el ancho aumentado del lóbulo central de la ventana espectral(por ejemplo, el término para el estrechamiento de datos de Hanning es aproximadamente 2/(n-p)Δt, por lo que f es “no demasiado cerca” si 2/(n-p)Δt<f<f(N)-2 / (n-p)Δt).
Dado que un rv xv2 chi-cuadrado con v grados de libertad tiene una varianza de 2u, tenemos la aproximación V = Sw2 (f). Este resultado es independiente del número de peso, tenemos: a diferencia de estadísticas como la media muestral de rvs gaussianos independientes e idénticamente distribuidos, la varianza de S^W(d) (f) no disminuye a 0 a medida que el tamaño muestral n-p aumenta(excepto en el caso poco interesante Sw (f)=0). Este resultado explica la picosidad de las estimaciones espectrales directas mostradas en las Figuras 5 y 6. En terminología estadística, S^W (d) (f) es un estimador inconsistente de Sw(f).
Ahora esbozamos tres enfoques para obtener un estimador consistente de Sw(f). Cada enfoque se basa en la combinación de rvs que, bajo supuestos adecuados, pueden considerarse como estimadores correlacionados aproximadamente en pares de SW (f). En resumen, los tres enfoques son
1
smooth S^W (d) (f) a través de frecuencias, produciendo lo que se conoce como estimador espectral de ventana de retraso;
2
{}} (o {Wt}) en un número de segmentos (algunos de los cuales pueden superponerse), calcular una estimación espectral directa para cada segmento, y luego promediar estas estimaciones juntas, produciendo el estimador espectral de media segmentación superpuesta (WOSA) de Welch;
3
calcule una serie de estimaciones espectrales directas para {Wt} utilizando un conjunto de datos ortogonales y luego promedie estas estimaciones juntas, produciendo el estimador espectral multiformato de Thomson.
Estimadores espectrales de Ventana de retraso Un estimador espectral de ventana de retraso de Sw (⋅) tiene la forma
donde Wm (⋅) es una ventana de suavizado cuyas propiedades de suavizado están controladas por el parámetro de suavizado m. En palabras, el estimador S^W (lw) (⋅) se obtiene enrollando una ventana de suavizado con el estimador espectral directo S^w (d) (⋅). Una ventana de suavizado típica tiene el mismo aspecto que una ventana espectral. Hay un lóbulo central con un ancho que se puede ajustar mediante el parámetro de suavizado m: cuanto más ancho sea este lóbulo central, más suave será S^W(w) (⋅). También puede haber un conjunto de lóbulos laterales molestos que causan fugas de ventana de suavizado. La presencia de fugas de ventana de suavizado se detecta fácilmente superponiendo gráficos de S^W(lw)(⋅) y S^W(d)(⋅) y buscando rangos de frecuencias donde el primero no parece ser una versión suavizada del segundo.
Si hemos hecho uso de un filtro de blanqueamiento previo de AR, podemos entonces poscolor S^W (lw) (⋅) para obtener un estimador de Sx (⋅), a saber,
Las propiedades estadísticas de S^W (lw) (.) son manejables debido al siguiente resultado de muestra grande. Si S^W (d) (⋅) es de hecho el periodograma(es decir, no hemos estrechado los valores de Wt), el conjunto de rvs S^W(d) (j/(n−p)Δt),j=1,2,…,j,, son aproximadamente correlacionados en pares, con cada rv proporcional a una χ22, rv(aquí J es el entero más grande tal que J/(n-p)<1/2). Si hemos utilizado el estrechamiento para formar Sw (d) (⋅), una afirmación similar es cierta sobre un conjunto más pequeño de rvs definidos en una cuadrícula más gruesa de frecuencias igualmente espaciadas, a medida que aumenta el grado de estrechamiento, disminuye el número de rvs aproximadamente no correlacionados. Bajo el supuesto de que el sdf Sw (⋅) está variando lentamente a través de las frecuencias (el blanqueamiento previo ayuda a hacer esto cierto) y que el lóbulo central de la ventana de suavizado es lo suficientemente pequeño en comparación con las variaciones en Sw (⋅), se deduce que S^W(d) (f) en la Ec. (11.15) se puede aproximar mediante una combinación lineal de VRS no correlacionados χ22. Se puede usar un argumento estándar de “grados equivalentes de libertad” para aproximar la distribución de S^W(lw)(f). (véase la Ec. (11.17) más adelante).
Hay dos formas prácticas de calcular S^W (lw) (⋅). La primera forma es discretizar la Ec. (11.15), produciendo un estimador proporcional a una convolución de la forma ΣkWm(f−fk’) SW(d) (fk’), donde los valores offk’ son un conjunto de frecuencias igualmente espaciadas. La segunda forma es recordar que “la convolución en un dominio de Fourier es equivalente a la multiplicación en el otro” para reescribir la Ec. (11.15) como
donde C^τ.W (d), es el estimador de acvs dado en Ec. (11.9) correspondiente a S^W (d) (.), y {wt.m} es una ventana de retardo (esto puede considerarse como la transformada inversa de Fourier de la ventana de suavizado Wm (⋅)). De hecho, porque S^W(d)(.) es un polinomio trigonométrico, todas las circunvoluciones discretas de la forma ΣkWm (f−fk’) S^W(d) (fk’) también se pueden calcular mediante Ec. (11.16) con una selección adecuada de valores wt,m (para más detalles, véase la sección 6.7). Nuestras dos formas prácticas de calcular S^W (l, w) (.) por lo tanto, se obtienen estimadores equivalentes. A menos que la convolución discreta sea suficientemente corta, Ec. (11.16) es computacionalmente más rápido de usar.
La teoría estadística sugiere que, bajo suposiciones razonables
a una buena aproximación,donde v se denomina grados equivalentes de libertad para S^W(lw) (f)y está dada por v=2 (n−p) BwΔt/Ch. Aquí Bw es una medida del ancho de banda de la ventana de suavizado Wm (⋅) a) n d se puede calcular a través de BW = 1 / Δt∑T = – (n−p−1)n-p-1wT, m2;;por otro lado, Ch depende solo de la forma cónica aplicada a los valores de Wtand se puede calcular a través de Ch=(n−p)∑1=p+1nht4Nota que, si no hacemos una forma cónica explícita, entonces ht=1/n−pand por lo tanto Ch>1; para una forma cónica de datos típica, la desigualdad de Cauchy nos dice que Ch>1(por ejemplo, Ch≈1.94 para la forma cónica de datos de Hanning). Los grados de libertad equivalentes para S^W(lw)(f)aumentan a medida que aumentamos el ancho de banda de la ventana de suavizado y disminuyen a medida que aumentamos el grado de estrechamiento. La ecuación (11.17) nos dice que E≈SW (f) y que V≈SW2(f)/v,por lo que aumentar v disminuye V.
La aproximación en la Ec. (11.17)se puede utilizar para construir un intervalo de confianza para SW(f) de la siguiente manera.Sea nv (α) el punto porcentual α×100% de la distribución xv2; es decir,P=α.El intervalo de confianza A100(1−2α)% para Sw(f) está aproximadamente dado por
Los puntos porcentuales ην (α) se tabulan en numerosos libros de texto o se pueden calcular utilizando un algoritmo dado por Best y Roberts
El intervalo de confianza de(11.18) es inconveniente en que su longitud es proporcional a S^W(lw) (f). Por otro lado, el intervalo de confianza correspondiente para 10.log10 (Sw (f)) (es decir, SW (f) en una escala de decibelios) es justo
que tiene un ancho que es independiente de S^W (lw) (.). Esta es la razón para trazar estimaciones de sdf en una escala de decibelios (o logarítmicos).
En la bibliografía se ha analizado un número desconcertante de ventanas de retraso diferentes (véase ). Aquí solo damos un ejemplo, el conocido Parzen fag window (Parzen ):
donde m se toma como un entero positivo y τ = τ / m. Esta ventana de retardo es fácil de calcular y tiene lóbulos laterales cuya envoltura se descompone como f-4, por lo que la fuga de la ventana de suavizado rara vez es un problema. Para una buena aproximación, el ancho de banda de la ventana de suavizado para la ventana de retardo de Parzen viene dado por Bw=1.85/(mΔt). A medida que m aumenta, el ancho de banda de la ventana de suavizado disminuye, y el estimador de ventana de retardo resultante se vuelve menos suave en apariencia. Los grados de libertad equivalentes asociados están dados aproximadamente por v = 3,71(n-p)/(mCh). La ventana de retardo de Parzen para m = 32 y su ventana de suavizado asociada se muestran en la Figura 7.
A modo de ejemplo, la Figura 8(a) muestra un estimador de ventana de retardo poscolorada para los datos del medidor de ondas de alambre (la curva sólida), junto con el estimador espectral directo poscoloreado correspondiente (los puntos, estos representan la misma estimación que se muestra en la Figura 6(b)). La ventana de retardo de Parzen se usó aquí con un valor de m=237 para el parámetro ventana de suavizado (los grados equivalentes de libertad correspondientes v son 64). Este valor se eligió después de algunos experimentos y parece producir un estimador de ventana de retardo que captura todas las características espectrales importantes indicadas por el estimador espectral directo para frecuencias entre 0,4 y 4,0 Hz (tenga en cuenta, sin embargo, que este estimador borra el pico entre 0,0 y 0,4 Hz bastante mal). También hemos trazado un entrecruzado cuya altura vertical representa la longitud de un intervalo de confianza del 95% para 10 ⋅ log10 (SX (f)) (basado en el estimador de ventana de retardo postcolorada) y cuya anchura horizontal representa el ancho de banda de la ventana de suavizado BW
Estimadores Espectrales WOSA. Consideremos ahora el segundo enfoque común para la reducción de la varianza, a saber, el promedio de segmentos superpuestos de Welch (Welch ; Carter y sus referencias). La idea básica es dividir una serie temporal en un número de bloques (p. ej., segmentos), calcula una estimación espectral directa para cada bloque, y luego produce la estimación espectral de WOSA promediando estas estimaciones espectrales juntas. En general, se permite que los bloques se superpongan, y el grado de superposición está determinado por el grado de estrechamiento: cuanto más pesado sea el grado de estrechamiento, más se deben superponer los bloques (Thomson ). Por lo tanto, excepto al principio y al final de la serie temporal, los valores de datos que están fuertemente cónicos en un bloque están ligeramente cónicos en otro bloque, por lo que intuitivamente estamos recuperando la “información” perdida debido a la contracción en un bloque de bloques que se superponen. Debido a que se puede implementar de manera computacionalmente eficiente (utilizando el algoritmo de transformada rápida de Fourier) y debido a que puede manejar series de tiempo muy largas (o series de tiempo con un espectrómetro que varía en el tiempo), el esquema de estimación WOSA es la base para muchos de los analizadores de espectro comerciales en el mercado.
Para definir el estimador espectral WOSA, deje que ns represente un tamaño de bloque, y deje que h1,…, hns ser una forma cónica de datos. Definimos el estimador espectral directo de Sx (f) para el bloque de valores de datos contiguos ns que comienzan en el índice l como
(no hay razón por la que no podamos usar aquí una serie precolombinada {Wt} en lugar de Xt, pero el precolombinado rara vez se usa junto con WOSA, tal vez porque la superposición de bloques se considera una forma eficiente de compensar los grados de libertad perdidos debido al estrechamiento). El estimador espectral WOSA de SX(f) se define como
donde nn es el número total de bloques y s es un factor de desplazamiento entero que satisface 0< s≤ns y s (nB-1) = n-ns (tenga en cuenta que el bloque para j = 0 utiliza valores de datos χ1,…, Xns, mientras que el bloque para j = nB-1 usa Xn-ns + 1,…, Xe).
Las propiedades estadísticas de muestra grande de S^X (wosa) (f) se parecen mucho a las de los estimadores de ventana de retraso. en particular, tenemos la aproximación que VS^X (wosa) (f)/Sx (f) = dXv2,, donde los grados equivalentes de libertad v están dados por
(aquí ht = 0 por definición para todos los t> ns). Si nos especializamos en el caso de superposición de bloques al 50% (es decir, s=ns/2) con una forma cónica de datos de Hanning(una recomendación común en la literatura de ingeniería), esto se puede aproximar mediante la fórmula simple v≈36nB21 (19nB-1). Por lo tanto, a medida que aumenta el número de bloques nB, también aumentan los grados equivalentes de libertad, produciendo un estimador espectral con varianza reducida. A menos que SX(⋅) tenga un sdf relativamente sin rasgos distintivos, no podemos, sin embargo, hacer que nB sea arbitrariamente pequeño sin incurrir en un sesgo severo en los estimadores espectrales directos individuales, principalmente debido a la pérdida de resolución. (Para más información sobre los resultados anteriores, ver sección 6.17.)
La figura 8 (b) muestra un estimador espectral WOSA para los datos del medidor de ondas de alambre (la curva sólida). Esta serie tiene n = 4096 valores de datos. Algunos experimentos indicaron que un tamaño de bloque de ns=256 y la forma cónica de los datos de Hanning son opciones razonables para estimar la sdf entre 0,4 y 4,0 Hz utilizando WOSA. Con una superposición de bloques del 50%, el factor de desplazamiento es s=ns/2=128; el número total de bloques es nB=1_δ(n−ns)+1=31; y v, los grados equivalentes de libertad, es aproximadamente 59. Las 31 estimaciones espectrales directas individuales que se promediaron juntas para formar la estimación WOSA se muestran como puntos en la Figura 8(b).
También hemos trazado un entrecruzamiento de” ancho de banda/intervalo de confianza “similar al de la Figura 8(a), pero ahora el” ancho de banda ” (es decir, el ancho horizontal) es la distancia en frecuencia entre estimaciones espectrales aproximadamente no correlacionadas. Esta medida de ancho de banda es una función del tamaño de bloque ns y la forma cónica de datos utilizada en WOSA. Para la forma cónica de Hanning, el ancho de banda es de aproximadamente 1,94/(nsΔt). Los entrecruzamientos de las Figuras 8 (a) y 8(b) son bastante similares, lo que indica que las propiedades estadísticas de la ventana de retardo de Parzen poscolorada y las estimaciones espectrales de WOSA son comparables: de hecho, las estimaciones reales coinciden estrechamente, con la estimación de WOSA siendo ligeramente más suave en apariencia.
Estimadores Espectrales de Papel múltiple. Un altemativo interesante para la estimación espectral de ventana de retraso o WOSA es el enfoque de papel múltiple de Thomson . La estimación espectral de papel múltiple puede considerarse como una forma de producir un estimador espectral directo con más de dos grados de libertad equivalentes (los valores típicos son de 4 a 16). Como tal, el método de papel múltiple es diferente en espíritu de los otros dos estimadores en que no busca producir espectros altamente suavizados. Un aumento en los grados de libertad de 2 a solo 10 es suficiente, sin embargo, para reducir el ancho de un intervalo de confianza del 95% para el sdf en más de un orden de magnitud y, por lo tanto, para reducir la variabilidad en la estimación espectral hasta el punto en que el ojo humano puede fácilmente desmontar la estructura general. Las discusiones detalladas sobre el enfoque de papel múltiple se dan en el Capítulo 7 de . Aquí simplemente esbozamos las ideas principales.
La estimación espectral de papel múltiple se basa en el uso de un conjunto de conos de datos K {ht.k; t = 1,…, n}, donde k varía de 0 a K-1. Asumimos que estas conos son ortonormales (es decir, ∑t = 1nht, jht, k = 1 si j = k y 0 si j≠k). El estimador de papel múltiple más simple se define por
(Thomson aboga por ponderar adaptativamente la S^k, X (mt) (f) en lugar de simplemente promediarlos juntos). Una comparación de esta definición para S^k, X (mt) (⋅) con la Ec. (118) muestra que S^k, X (mt) (⋅) es de hecho solo un estimador espectral directo, por lo que el estimador multitapa es solo un promedio de estimadores espectrales directos que emplean un conjunto ortonormal de conos. Bajo ciertas condiciones leves, la ortonormalidad de los cónicos se traduce en el dominio de frecuencia como independencia aproximada de cada individuo S^k,X(mt)(f); es decir, S^j.X(mt)(f). La independencia aproximada a su vez implica que 2KS^k,X(mt)(f)/SX(f)=DX22K aproximadamente, de modo que los grados equivalentes de libertad para S^X(mt)(f) es igual al doble del número de conos de datos empleados.
El truco clave entonces es encontrar un conjunto de K secuencias ortonormales, cada una de las cuales hace un trabajo adecuado de estrechamiento. Un enfoque atractivo es retomar el problema de concentración que nos dio la forma cónica dpss para un ancho de banda de resolución fija de 2W Si ahora nos referimos a esta forma cónica como la forma cónica dpss de orden cero y la denotamos por {h,,()}, podemos construir recursivamente las formas cónicas dpss de orden superior K-1 restantes {ht,k} de la siguiente manera. Para k=1,…, K-1, definimos la forma cónica dpss de orden k-ésimo como el conjunto de n números {ht, k; t = 1,…, n} tal que
1
{ht, k} es ortogonal a cada una de las secuencias k {ht,()},…,{ht,(k−1)}es decir, ∑t=11ht.Jht.k = 0 para j = 0,…, k-1);
2
{ht, k} se normaliza de tal manera que ∑t = 1nht, k2=1;
3
sujeto a condiciones] y 2, la ventana espectral Hk (⋅) correspondiente a {ht.k} maximiza la relación de concentración
En palabras, sujeto a la restricción de ser ortogonal a todas las formas cónicas dpss de orden inferior, la forma cónica dpss de orden k-ésimo es “óptima” en el sentido restringido de que los lóbulos laterales de su ventana espectral están suprimidos tanto como sea posible medido por la relación de concentración. Los métodos para calcular los cónicos de datos dpss se discuten en el Capítulo 8.
En una serie de artículos, Slepian (y sus referencias) ha estudiado ampliamente la naturaleza de los dpss. Un hecho importante que discute es que la relación de concentración λk(n,W) disminuye estrictamente a medida que k aumenta de una manera tal que λk(n,W) está cerca de la unidad para k<2nW Δt, después de lo cual se acerca rápidamente a 0 con el aumento de k (el valor 2nWΔt a veces se llama el número de Shannon). Dado que λk (n,W) debe estar cerca de la unidad para que {ht,k} sea una forma cónica de datos decente, la estimación espectral de papel múltiple se restringe al uso de, a lo sumo, y, en la práctica, generalmente menos de 2nWΔt, formas cónicas ortonormales dpss.
En la Figura 9 se muestra un ejemplo de estimación espectral de papel múltiple. La columna izquierda de las gráficas muestra las formas cónicas de datos dpss de orden k-ésimo para n = 4096, nW = 4 / Δt, y k que van desde 0 (gráfica superior) hasta K-1=5 (gráfica inferior). Las finas líneas horizontales en cada una de estas gráficas indican el nivel cero, por lo que, mientras que el dpss de orden cero es estrictamente positivo en todas partes (pero bastante cercano a 0 cerca de t=1 y t=n), las conos de orden superior asumen valores positivos y negativos. Tenga en cuenta también que la forma cónica de orden cero reduce en gran medida los valores de la serie temporal cercanos a t=1 y t=n, pero que estos valores reciben sucesivamente más peso por las formas cónicas de orden superior (una interpretación de la multitapering es que las formas cónicas de orden superior recapturan información “perdida” cuando se usa una sola forma cónica de datos). La curva sólida de la Figura 9(b) muestra una estimación espectral de múltiples capas S^X (mt) (⋅) para los datos del medidor de ondas de alambre basados en estos 6 cónicos dpss, mientras que los puntos muestran las seis estimaciones espectrales directas individuales S^K. X (mt) (⋅). Tenga en cuenta que el número de conos que hemos utilizado está por debajo del número de Shannon 2nWΔt=8 y que v, los grados equivalentes de libertad, está aquí 2K=12. La estimación espectral de papel múltiple es mucho más picada en apariencia que la estimación espectral de ventana de retraso de la Figura 8 (a) o la estimación WOSA de la Figura 8(b), las cuales tienen un número notablemente mayor de grados de libertad equivalentes ( v=64 y v=59, respectivamente). Sin embargo, la variabilidad en la estimación espectral de papel múltiple es lo suficientemente pequeña como para que el ojo pueda detectar fácilmente la estructura general (cf. S^X (mt) (⋅) con las dos estimaciones espectrales de la Figura 5), y debido a que no está altamente suavizada, la estimación de papel múltiple hace notablemente mejor para capturar la estructura espectral cerca de f=0.
Basándose en los límites de rendimiento, Bronez [16 argumenta que el estimador espectral de papel múltiple tiene propiedades estadísticas superiores a WOSA para SDF con rangos dinámicos muy altos (sin embargo, se requiere más investigación para verificar que estos límites se traduzcan en una ventaja real en la práctica). En comparación con el blanqueado previo, el multitapeado es útil en situaciones en las que la fuga es un problema, pero no es práctico diseñar cuidadosamente los filtros de blanqueado previo (esto ocurre, por ejemplo, en la geofísica de exploración debido al enorme volumen de series temporales recogidas de forma rutinaria). Finalmente, observamos que Thomson y Chave [17] describen un esquema atractivo en el que el multitapering se usa junto con WOSA.