Estimador Consistente
11.2.3 de Redução de Variância
Um exame superficial dos espectral estimativas para a bitola série nas Figuras 5 e 6 revela uma variabilidade substancial entre as frequências, tanto que é difícil discernir a estrutura geral do espectral estimativas sem uma quantidade razoável de estudo. Todos os estimadores espectrais diretos sofrem desta choppiness inerente, que pode ser explicado considerando as propriedades distribuicionais de S^X(d)(f). Primeiro, se f não é muito perto de 0 ou f(N) e se SW(⋅) satisfaz uma ligeira condição de regularidade, em seguida, 2S^w(d)(f)/Sw(f)=dx22; i.é., a rv 2S^w(d)(f)/Sw(f) é, aproximadamente, igual na distribuição de qui-quadrado de rv, com 2 graus de liberdade. Se não for utilizada redução gradual, f é considerado “não muito próximo” de 0 ou f(n) Se 1/(n-p)Δt<f<f(n)-1/(n-p)Δt; se afinando é utilizado, devemos substituir o 1/(n-p)Δt por maior prazo, refletindo o aumento da largura do lóbulo central da janela espectral (por exemplo, o prazo para a Hanning de dados de cone é de aproximadamente 2/(n-p)Dt, então f não é “muito perto” se 2/(n-p)Dt<f<f(N)-2/(n-p)Δt).
uma vez que um Qui-quadrado rv xv2 com V graus de liberdade tem uma variância de 2u, temos a aproximação V=Sw2(f). Este resultado é independente do número de Wt, temos: ao contrário de estatísticas como a média da amostra de rvs gaussianos independentes e identicamente distribuídos, a variância de S^W(d)(f) não diminui para 0 como o tamanho da amostra n-p fica maior (exceto no caso desinteressante Sw(f)=0). Este resultado explica a dispersão das estimativas espectrais directas apresentadas nas figuras 5 e 6. Na terminologia estatística, S^W (d) (f) é um estimador inconsistente de Sw (f).
agora esboçamos três abordagens para obter um estimador consistente de Sw(f). Cada abordagem baseia-se na combinação de VR que, com base em pressupostos adequados, podem ser considerados como estimadores não correlacionados aproximadamente em pares de VR(f). Brevemente, as três abordagens são para
1
bom S^W d)(f) através de frequências, produzindo o que é conhecido como lag janela espectral do estimador;
2
{Xt} (ou {Wt}) em um número de segmentos (alguns dos quais podem se sobrepor), calcular direto espectral de estimativa para cada segmento e, em seguida, a média dessas estimativas em conjunto, produzindo Welch sobreposta segmentaveraging (WOSA) estimador espectral;
3
compute a series of direct spectral estimates for {Wt} using a set of orthogonal data tapers and then average these estimates together, yielding Thomson’s multitaper spectral estimator.
Gal Janela Espectral de Estimadores de gal janela espectral estimador de Sw(⋅) assume a forma
onde Wm(⋅) é uma suavização janela cujo suavização propriedades são controladas pela suavização do parâmetro m. In words, the estimator S^W (lw) (⋅) is obtained by convolving a smoothing window with the direct spectral estimator s^w (d) (⋅). Uma típica janela de alisamento tem a mesma aparência que uma janela espectral. Existe lobo acentral com uma largura que pode ser ajustada pelo parâmetro de suavização m: quanto mais largo este lobo central é, mais suave será o S^W(W) (⋅). Também pode haver um conjunto de sidelobes irritantes que causam vazamento de janela suavizante. A presença de fugas de janelas de suavização é facilmente detectada por sobreposição de parcelas de S^W(lw)(⋅) e S^W(d)(⋅) e à procura de intervalos de frequências onde o primeiro não parece ser uma versão suavizada do segundo.
Se a gente tem feito uso de um AR prewhitening filtro, podemos, então, postcolor S^W(lw)(⋅) para obter um estimador de Sx(⋅), ou seja,
As propriedades estatísticas dos S^W(lw)(.) são tratáveis por causa do seguinte grande resultado da amostra. Se S^W d)(⋅) é, na verdade, o periodogram (i.é., não temos afilado, os valores de Wt), o conjunto de rvs S^W(d)(j/(n−p)Δt),j=1,2,…,j,, são cerca de pairwise não correlacionada, com cada rv, sendo proporcional a um χ22, rv (aqui J é o maior inteiro tal que J/(n-p)<1/2). Se temos usado a afinação para formar Sw (D) (⋅), uma afirmação semelhante é verdadeira sobre um conjunto menor de rvs definidos em uma grade mais grossa de frequências igualmente espaçadas—como o grau de afinação aumenta, o número de rvs Aproximadamente não correlacionados diminui. Sob os pressupostos de que o sdf Sw(⋅) está variando lentamente entre as frequências (prewhitening ajuda a tornar isso verdadeiro) e que o lobo central da janela de alisamento é suficientemente pequeno em comparação com as variações em Sw(⋅), segue-se que S^W(d)(f) em Eq. (11.15) pode ser aproximada por uma combinação linear de χ22 rvs não correlacionados. Um argumento padrão de “graus equivalentes de liberdade” pode então ser usado para aproximar a distribuição de S^W(lw)(f). (ver nQ. (11.17) mais tarde).
existem duas formas práticas de computação S^W (lw) (⋅). A primeira maneira é discretizar Eq. (11.15), produzindo um estimador proporcional a uma convolução da forma ΣkWm(f−fk’)SW(d)(fk’), onde os valores offk’ são alguns conjuntos de frequências igualmente espaçadas. A segunda maneira é lembrar que “convolução em um domínio de Fourier é equivalente à multiplicação no outro” para reescrever Eq. (11.15)as
em que c^τ.W (d), é o estimador acvs dado no Eq. (11.9) correspondente a S^W (d) (.), e (wt.m} é uma janela de lag (isto pode ser considerado como a Transformada de Fourier inversa da janela de suavização Wm (⋅)). Na verdade, porque S^W(d)(.) é um polinômio trigonométrico, todas as convoluções discretas da forma ΣkWm(f−fk’)S^W(d) (fk’) também podem ser computadas via Eq. (11.16) com uma escolha adequada dos valores wt,m (para mais pormenores, ver secção 6.7). As nossas duas formas práticas de computação S^W (l, w) (.) por conseguinte, produzem estimadores equivalentes. A menos que a convolução discreta seja suficientemente curta, NQA. (11.16) é computacionalmente mais rápido de usar.
Estatística teoria sugere que, em premissas razoáveis
para uma boa aproximação,onde v é chamado o equivalente graus de liberdade para S^W(lw)(f) e é dado por v=2(n−p)BwΔt/Ch. Aqui Bw é uma medida da largura de banda da janela de nivelamento Wm (⋅) A) n d pode ser calculada via BW=1/Δt∑T= – (n−p−1)n−p−1wT,m2;;por outro lado,Ch, só depende do cone aplicada para os valores de Wtand pode ser calculado através Ch=(n−p)∑1=p+1nht4Note que, se não explicitamente cone, em seguida, ht=1/n−pand, portanto, Ch>1; para um típico dados cone, a desigualdade de Cauchy diz que Ch>1(por exemplo, Ch≈1.94 para o Hanning de dados de conicidade). Os graus equivalentes de liberdade para S^W(lw)(f)aumentam assim à medida que aumentamos a largura de banda da janela de suavização e diminuímos à medida que aumentamos o grau de redução. A equação (11.17) nos diz que e≈SW (f) E que V≈SW2 (f) / v, assim aumentando v diminui V.
a aproximação em Eq. (11.17)pode ser usado para construir um intervalo de confiança para SW(f) da seguinte forma.Let nv (α) denota o ponto percentual α×100% da xv2distribution; ou seja,P=α.A100(1−2α)% de intervalo de confiança para Sw(f) é, aproximadamente, dado por
A percentagem de pontos de ην(α) são tabulados em numerosos livros didáticos ou pode ser calculado usando-se um algoritmo dado por Melhores e Roberts
O intervalo de confiança de (11.18) é inconveniente em que o seu comprimento é proporcional ao S^W(lw)(f). Por outro lado, o intervalo de confiança correspondente para 10.log10 (SW (f)) (ou seja, SW (f) numa escala de decibéis) é apenas
que tem uma largura que é independente de S^W (lw) (.). Esta é a razão para plotar estimativas sdf em uma escala de decibel (ou logarítmica).
foi discutido na literatura um número desconcertante de diferentes janelas de GAL (ver ). Aqui damos apenas um exemplo, a bem conhecida janela de fag Parzen (Parzen):
onde m é um número inteiro positivo e τ=τ/m. Este gal janela é fácil de calcular e tem sidelobes cujo envelope decai como f-4 para que o alisamento janela de escapamento é raramente um problema. Para uma boa aproximação, a largura de banda da janela de alisamento para a janela de lag Parzen é dada por Bw=1,85/(mΔt). À medida que m aumenta, a largura de banda da janela de alisamento diminui, e o estimador da janela de lag torna-se menos suave na aparência. Os graus equivalentes de liberdade associados são dados Aproximadamente por v=3,71(n-p)/(mCh). A janela de latência de Parzen para m=32 e a janela de alisamento associada são mostradas na Figura 7.
Como exemplo, a Figura 8(a) mostra um postcolored gal janela estimador para o fio de onda de dados do medidor (a curva sólida), juntamente com a correspondente postcolored direto estimador espectral (os pontos, estes retratam a mesma estimativa, como mostrado na Figura 6(b)). A janela de lag do Parzen foi usada aqui com um valor de m = 237 para o parâmetro da janela de suavização (os correspondentes graus equivalentes de liberdade v são 64). Este valor foi escolhido após algumas experiências e parece produzir um estimador de janela de lag que captura todas as características espectrais importantes indicadas pelo estimador espectral direto para frequências entre 0.4 e 4.0 Hz (note, no entanto, que este estimador mancha mal o pico entre 0.0 e 0.4 Hz). Temos também traçado um cruzam cuja altura vertical representa o comprimento de um intervalo de confiança 95% para 10 ⋅ log10(SX(f)) (baseado no postcolored gal janela do estimador) e cuja largura horizontal representa a suavização janela de largura de banda BW
estimadores espectrais de WOSA. Consideremos agora a segunda abordagem comum à redução da variância, a saber, a média do segmento sobreposto de Welch (Welch ; Carter e referências nele). A ideia básica é quebrar uma série cronológica em um número de blocos (i.e., segmentos), calcular uma estimativa espectral direta para cada bloco, e, em seguida, produzir a estimativa espectral WOSA, calculando essas estimativas espectrais juntas. Em geral, os blocos são autorizados a se sobrepor, com o grau de sobreposição sendo determinado pelo grau de afinação—quanto mais pesado o grau de afinação, mais os blocos devem ser sobrepostos (Thomson ). Assim, exceto no início e no final da série de tempo, valores de dados que são fortemente afilado em um bloco são levemente cônicos em outro bloco, de modo que, intuitivamente, estamos retomando a “informação” perdidos devido a afilando-se em um bloco de blocos sobrepostos a ele. Como ele pode ser implementado de forma computacionalmente eficiente (usando o algoritmo de transformação rápida de Fourier) e porque ele pode lidar com séries de tempo muito longas (ou séries de tempo com um espectro variando de tempo), o esquema de estimativa de WOSA é a base para muitos dos analisadores de espectro comerciais no mercado.
para definir o estimador espectral de WOSA, deixe ns representar um tamanho de bloco, e deixe h1,…, HNS ser um leitor de dados. Definimos o direto estimador espectral de Sx(f) para o bloco de ns de dados contíguos valores, começando pelo índice l
(não há nenhuma razão por que não podemos usar um prewhitened série {Wt} aqui, ao invés de incluir Xt, mas prewhitening é raramente usado em conjunto com WOSA, talvez porque bloco de sobreposição é encarada como uma eficiente forma de compensação para os graus de liberdade perdidos devido ao afilamento). O estimador espectral de WOSA de SX (f) é definido como
onde nn é o número total de blocos e s é um número inteiro factor de desvio satisfazendo 0<s≤ns e s(nB-1)=n-ns (nota-se que o bloco para j=0 usa valores de dados χ1,…,Xns, while the block for j = nB-1uses Xn-ns+1,…, Xe).
as grandes propriedades estatísticas de amostra de S^X (wosa) (f) assemelham-se muito às dos estimadores de janelas de lag. em particular, temos a aproximação que VS^X(wosa)(f)/Sx(f)=dXv2, onde o equivalente graus de liberdade v é dado por
(aqui ht=0, por definição, para todo t>ns). Se nos especializarmos para o caso de sobreposição de blocos de 50% (ou seja, s=ns / 2) com um amortecedor de dados (uma recomendação comum na literatura de engenharia), isto pode ser aproximado pela fórmula simples v≈36nB21(19nB-1). Assim, como o número de blocos nB aumenta, os graus equivalentes de liberdade também aumentam, rendendo um estimador espectral com variância reduzida. A menos que SX (⋅) tenha um sdf relativamente sem proezas, nós não podemos, No entanto, fazer o nB arbitrariamente pequeno sem incorrer em viés severo nos estimadores espectrais diretos individuais principalmente devido à perda de resolução. (Para mais pormenores sobre os resultados acima, ver secção 6.17.)
Figura 8 (b) mostra um estimador espectral de WOSA para os dados do gabarito de ondas de fio (a curva sólida). Esta série tem valores de dados n = 4096. Alguns experimentos indicaram que um tamanho de bloco de ns=256 e o taper de dados de Hanning são escolhas razoáveis para estimar a sdf entre 0,4 e 4,0 Hz usando WOSA. Com uma sobreposição de blocos de 50%, o Fator de deslocamento é s=ns/2=128; o número total de blocos é nB=1_δ(n−ns)+1=31; E v, os graus equivalentes de liberdade, é de aproximadamente 59. As 31 estimativas espectrais diretas individuais que foram calculadas em conjunto para formar a estimativa de WOSA são mostradas como os pontos na Figura 8(b).
temos também plotados uma “largura de banda/um intervalo de confiança de” cruzam-se semelhante à Figura 8(a), mas agora a “largura de banda” (i.é., a largura horizontal) é a distância em frequência entre aproximadamente uncorrelated espectral estimativas. Th é a medida da largura de banda é uma função do tamanho do bloco ns e do filtro de dados usado em WOSA. Para a torneira, a largura de banda é de aproximadamente 1,94 / (nsΔt). As criscrosses nas figuras 8(a) e 8 (b) são bastante semelhantes, indicando que as propriedades estatísticas da janela de lag Parzen pós-colorida e as estimativas espectrais de WOSA são comparáveis. : na verdade, as estimativas reais estão de acordo, sendo a estimativa de WOSA ligeiramente mais suave na aparência.
Multitaper Spectral Estimators. Um altemativo interessante para a janela de lag ou estimativa espectral de WOSA é a abordagem multitaper de Thomson . A estimativa espectral Multitaper pode ser considerada como uma forma de produzir um estimador espectral direto com mais do que apenas dois graus equivalentes de liberdade (valores típicos são 4 a 16). Como tal, o método do multitaper é diferente em espírito dos outros dois estimadores em que ele não procura produzir espectros altamente suavizados. Um aumento em graus de liberdade de 2 para apenas 10 é suficiente, no entanto, para encolher a largura de um intervalo de confiança de 95% para a sdf em mais do que uma ordem de magnitude e, portanto, para reduzir a variabilidade na estimativa espectral ao ponto em que o olho humano pode prontamente discem a estrutura geral. São apresentados no Capítulo 7 e no capítulo 7 do presente documento os debates pormenorizados sobre a abordagem multitaper . Aqui apenas esboçamos as ideias principais.
a estimativa espectral do Multitaper baseia-se na utilização de um conjunto de K de dados pers {ht.k;t=1,…, N}, onde k varia de 0 a K-1. Supomos que estes pers são ortonormais (i.e., ∑t=1nht,jht, k=1 Se j = k e 0 se j≠k). O mais simples multitaper do estimador é definido por
(Thomson defende de forma adaptativa a ponderação do S^k,X(mt)(f) ao invés de simplesmente média-los). Uma comparação desta definição para S^k, X (mt) (⋅) com Eq. (118) mostra que s^k,X(mt) (⋅) é de fato apenas um estimador espectral direto, então o estimador multitaper é apenas uma média de estimadores espectrais diretos empregando um conjunto ortonormal de tapers. Sob certas condições suaves,a ortonormalidade dos tapers traduz-se no domínio da frequência como independência aproximada de cada indivíduo s^k, X(mt)(f); ou seja, S^J. X(mt)(f). A independência aproximada por sua vez implica que 2KS^k,X(mt)(f)/SX(f)=dX22k aproximadamente, de modo que os graus equivalentes de liberdade para S^X(mt)(f) é igual ao dobro do número de pessoas empregadas.
o truque chave então é encontrar um conjunto de sequências ortonormais K, cada uma das quais faz um trabalho próprio de afinação. Uma abordagem apelativa é retum para o problema de concentração que nos deu o DPSS taper para uma largura de banda de resolução fixa 2W se agora nos referirmos a este taper como o dpss de ordem zeroth e denotá-lo por {h,,()}, Nós podemos recursivamente construir o K-1 restante “ordem superior” dpss tapers {ht,k} como se segue. Para k=1,…, K-1, Nós definimos o DPSS de ordem kth como o conjunto de números n {ht,k;t=1,…,n} tal que
1
{ht, k} é ortogonal a cada uma das sequências k {ht, ()},…, {ht, (k−1)}ou seja, ∑t=11ht.Jht.k = 0 para j = 0,…,k-1);
2
{ht, k} está normalizada de tal forma que ∑t=1nht, k2=1;
3
sujeito a condições] e 2, a janela espectral hk (⋅) correspondente a {ht.k} maximiza a taxa de concentração
Em palavras, sujeita à restrição de ser ortogonal a todos os de ordem inferior dpss velas, o k-ordem dpss cone é a “ideal” no sentido restrito que sidelobes de sua janela espectral são suprimidas tanto quanto possível, conforme medido pelo rácio de concentração. Os métodos de cálculo dos dispositivos de dados dpss são discutidos no Capítulo 8.
In a series of papers, Slepian (and references there) has extensively studied the nature of dpss. Um fato importante que ele discute é que a taxa de concentração λk(n,W) estritamente diminui à medida que k aumenta de forma tal que λk(n,W) é próxima da unidade para k<2nW Δt, depois do qual se aproxima rapidamente de 0 com o aumento de k (o valor 2nWΔt é às vezes chamado de Shannon número). Uma vez que λk(N,W) deve estar perto da unidade para {ht,k} ser um decent data taper, a estimativa espectral multitaper é restrita ao uso de, no máximo-e, na prática, geralmente menos de— 2nWΔt orthonormal dpss tapers.
um exemplo de estimativa espectral multitaper é mostrado na Figura 9. A coluna de gráficos de esquerda mostra os dispositivos de dados dpss da ordem kth para n = 4096, nW=4/Δt e k variando de 0 (parcela superior) a K-1=5 (parcela inferior). As finas linhas horizontais em cada uma dessas parcelas indicam o nível zero, então, enquanto que o dpss de ordem zeroth é estritamente positivo em todos os lugares (mas bem perto de 0 perto t=1 e t=n), Os superadores de ordem superior assumem valores positivos e negativos. Note também que o zeroth ordem cone fortemente downweights valores das séries de tempo perto de t=1 e t=n, mas que estes valores são sucessivamente mais peso por ordem superior velas (uma interpretação da multitapering é que a ordem superior velas são retomada de informações “perdido” quando”, mas um único cone é usado). A curva Sólida Na Figura 9 (b) mostra uma estimativa espectral multitaper S^X(mt) (⋅) para os dados do gabarito de ondas de fio com base nestes 6 DPSS tapers, enquanto os pontos mostram as seis estimativas espectrais diretas individuais S^K. X(mt) (⋅). Note que o número de tapers que temos usado está abaixo do número Shannon 2nWΔt=8 e que v, os graus equivalentes de liberdade, está aqui 2K=12. A estimativa espectral de multitaper é muito mais choppier na aparência do que a estimativa espectral da janela de lag da figura 8(A) ou a estimativa WOSA da figura 8(b), ambas com um número marcadamente maior de graus equivalentes de liberdade ( v=64 e v=59, respectivamente). No entanto, a variabilidade na estimativa espectral multitarefas é suficientemente pequena para que o olho possa detectar prontamente a estrutura global (cf. S^X (mt) (⋅) com as duas estimativas espectrais na Figura 5), e porque não é muito suavizada, a estimativa multitaper faz marcadamente melhor na captura da estrutura espectral perto de f=0.
Baseado em desempenho limites, Bronez [16 argumenta que o multitaper estimador espectral tem propriedades estatísticas que são superiores a WOSA para sdfs com muito altas faixas dinâmicas (mais investigação é necessária, no entanto, verificar que estes limites se traduzir em uma vantagem real na prática). Em comparação com o pré-Whitening, multitarefa é útil em situações em que a fuga é uma conceção, mas não é prático projetar cuidadosamente filtros pré-Whitening (isso ocorre, por exemplo, na exploração geofísica devido ao enorme volume de séries cronológicas coletadas rotineiramente). Finalmente, notamos que Thomson e Chave [17 descrevem um esquema apelativo no qual multitarefa é usada em conjunto com WOSA.