Stimatore Consistente

11.2.3 Varianza Riduzione

Un rapido esame del spettrale stime per il calibro di cavo di serie di Figure 5 e 6, rivela una sostanziale variabilità tra le frequenze, tanto che è difficile discernere la struttura complessiva del spettrale preventivi senza una discreta quantità di studio. Tutti gli stimatori spettrali diretti soffrono di questa choppiness intrinseca, che può essere spiegata considerando le proprietà distributive di S^X(d)(f). Innanzitutto, se f non è troppo vicino a 0 o f(N) e se SW(⋅) soddisfa una condizione di regolarità lieve, allora 2S^w(d)(f)/Sw(f)=dx22; cioè, il rv 2S^w(d)(f)/Sw(f) è approssimativamente uguale in distribuzione a un rv chi-quadrato con 2 gradi di libertà. Se non si utilizza la rastremazione, f è considerato “non troppo vicino” a 0 o f (N) se 1 / (n-p)Δt< f < f (N)-1 / (n-p)Δt; se si utilizza la rastremazione, dobbiamo sostituire 1/(n-p)Δt con un termine più grande, riflettendo la maggiore larghezza del lobo centrale della finestra spettrale(ad esempio, il termine per il cono dei dati di Hanning è approssimativamente 2/(n-p)Δt quindi f è “non troppo vicino” se 2/(n-p)Δt<f<f(N)-2 / (n-p)Δt).

Poiché un chi-quadrato rv xv2 con v gradi di libertà ha una varianza di 2u, abbiamo l’approssimazione V=Sw2(f). Questo risultato è indipendente dal numero di Wt, abbiamo: a differenza delle statistiche come la media del campione di rv gaussiani indipendenti e identicamente distribuiti, la varianza di S ^ W(d) (f) non diminuisce a 0 quando la dimensione del campione n-p diventa più grande(tranne nel caso poco interessante Sw (f)=0). Questo risultato spiega la rigidità delle stime spettrali dirette mostrate nelle figure 5 e 6. Nella terminologia statistica, S ^ W(d) (f) è uno stimatore incoerente di Sw (f).

Ora delineiamo tre approcci per ottenere uno stimatore coerente di Sw(f). Ogni approccio si basa sulla combinazione di RV che, secondo ipotesi adeguate, possono essere considerati come stimatori non correlati approssimativamente a coppie di SW (f). Brevemente, i tre approcci sono a

1

liscio S^W(d)(f) per le varie frequenze, producendo ciò che è noto come un gal finestra spettrale stimatore;

2

{Xt} (o {Wt}) in un numero di segmenti (alcuni dei quali possono sovrapporsi), calcola diretta spettrale stima per ogni segmento, e quindi in media queste stime insieme, producendo Welch sovrapposti segmentaveraging (WOSA) spettrale stimatore;

3

calcola una serie di stime spettrali dirette per {Wt} usando un insieme di dati ortogonali e poi media queste stime insieme, ottenendo lo stimatore spettrale multitaper di Thomson.

Gal Finestra Spettrale Estimatori di Un gal finestra spettrale stimatore di Sw(⋅) assume la forma

(11.15)S^W(lw)(f)=∫f(N)f(N)Wm(f−f’)S^W(d)(f)df’

dove Wm(⋅) è una lisciatura finestra la cui proprietà leviganti sono controllate dal parametro m. In parole, lo stimatore S^W (lw) (⋅) si ottiene convolvendo una finestra di livellamento con lo stimatore spettrale diretto S^w (d) (⋅). Una tipica finestra di levigatura ha più o meno lo stesso aspetto di una finestra spettrale. C’è un lobo acentrale con una larghezza che può essere regolata dal parametro di levigatura m: più ampio è questo lobo centrale, più liscio sarà S^W(w) (⋅). Ci può anche essere una serie di fastidiosi lobi laterali che causano perdite di finestra levigante. La presenza di perdite di finestra di livellamento è facilmente rilevata sovrapponendo trame di S^W (lw) (⋅) e S^W (d) (⋅) e cercando intervalli di frequenze in cui la prima non sembra essere una versione levigata di quest’ultima.

Se abbiamo fatto uso di un AR prewhitening filtro, possiamo quindi postcolor S^W(lw)(⋅) per ottenere un estimatore di Sx(⋅), vale a dire,

SX(pc)(f)=S^W(tw)(f)|1−∑k=1pϕke−i2πfkΔt|2

Le proprietà statistiche di S^W(lw)(.) sono trattabili a causa del seguente grande risultato del campione. Se S ^ W (d) (⋅) è infatti il periodogramma(cioè, non abbiamo rastremato i valori di Wt), l’insieme di rvs S^W(d) (j/(n−p)Δt),j=1,2,…,j,, sono approssimativamente non correlati a coppie, con ogni rv proporzionale a un χ22, rv(qui J è il numero intero più grande tale che J/(n-p)<1/2). Se abbiamo usato il tapering per formare Sw (d) (⋅), un’affermazione simile è vera su un insieme più piccolo di camper definiti su una griglia più grossolana di frequenze equidistanti—all’aumentare del grado di tapering, il numero di camper approssimativamente non correlati diminuisce. Sotto l’ipotesi che l’sdf Sw (⋅) stia lentamente variando tra le frequenze (il prewhitening aiuta a renderlo vero) e che il lobo centrale della finestra di levigatura sia sufficientemente piccolo rispetto alle variazioni in Sw (⋅), ne consegue che S^W(d) (f) in Eq. (11.15) può essere approssimato da una combinazione lineare di χ22 rv non correlati. Un argomento standard “gradi equivalenti di libertà” può essere quindi utilizzato per approssimare la distribuzione di S^W(lw)(f). (vedi Eq. (11.17) più tardi).

Esistono due modi pratici di calcolare S^W(lw)(⋅). Il primo modo è quello di discretizzare Eq. (11.15), producendo uno stimatore proporzionale a una convoluzione della forma ΣkWm(f−fk’) SW(d) (fk’), dove i valori offk’ sono un insieme di frequenze equidistanti. Il secondo modo è ricordare che “la convoluzione in un dominio di Fourier equivale alla moltiplicazione nell’altro” per riscrivere l’Eq. (11.15)as

(11.16) S^W(lw) (f)=τ τ=−(n−p−1) n−p−1wt,mC^τ.w (e)e-l2n / τΔι

dove C^τ.W (d), è lo stimatore acvs dato in Eq. (11.9) corrispondente a S^W (d) (.), e {peso.m} è una finestra lag (questa può essere considerata come la trasformata di Fourier inversa della finestra di smoothing Wm (⋅)). Infatti, perché S^W (d) (.) è un polinomio trigonometrico, tutte le circonvoluzioni discrete della forma ΣkWm (f-fk’) S^W(d) (fk’) possono anche essere calcolate tramite Eq. (11.16) con una scelta appropriata di wt,m valori (per i dettagli, vedere , Sezione 6.7). I nostri due modi pratici di calcolo S^W (l, w) (.) quindi producono stimatori equivalenti. A meno che la convoluzione discreta sia sufficientemente breve, Eq. (11.16) è computazionalmente più veloce da usare.

teoria Statistica suggerisce che, sotto ipotesi ragionevoli

(11.17)vS^W(lw)(f)Sw(f)=dxv2

con una buona approssimazione,dove v è detta l’equivalente di gradi di libertà per S^W(lw)(f) ed è dato da v=2(n−p)BwΔt/Ch. Qui Bw è una misura della larghezza di banda della finestra di livellamento Wm(⋅)a)n d può essere calcolato tramite BW=1/Δt T T=−(n−p−1) n-p-1wT, m2;;d’altra parte,Ch, dipende dal cono applicata ai valori di Wtand può essere calcolata tramite Ch=(n−p)∑1=p+1nht4Note che, se non esplicitamente cono, quindi ht=1/n−pand, quindi, Ch>1; per un dato tipico cono, la disuguaglianza di Cauchy ci dice che Ch>1(per esempio, Ch≈1.94 per il Hanning dati di cono). I gradi equivalenti di libertà per S ^ W(lw) (f)aumentano quindi man mano che aumentiamo la larghezza di banda della finestra di livellamento e diminuiscono man mano che aumentiamo il grado di assottigliamento. Equazione (11.17) ci dice che E≈SW (f) e che V≈SW2(f)/v,quindi aumentando v diminuisce V.

L’approssimazione in Eq. (11.17) può essere usato per costruire un intervallo di confidenza per SW(f)nel modo seguente.Sia nv (α)che denota il punto percentuale α×100% della distribuzione xv2; cioè,P=α.A100(1−2α)% intervallo di confidenza per Sw(f) è data da

(11.18)

La percentuale di punti ην(α) sono tabulati in numerosi libri di testo o può essere calcolato con un algoritmo dato dai Migliori e Roberts

L’intervallo di confidenza (11.18) è scomodo in quanto la sua lunghezza è proporzionale alla S^W(lw)(f). D’altra parte, il corrispondente intervallo di confidenza per 10.log10(Sw (f)) (cioè, SW (f) su una scala di decibel) è solo

che ha una larghezza indipendente da S^W(lw)(.). Questa è la logica per tracciare le stime sdf su una scala decibel (o logaritmica).

Un numero sconcertante di diverse finestre di ritardo è stato discusso in letteratura (vedi ). Qui diamo solo un esempio, il noto Parzen fag window (Parzen ):

wt.m = 1-6τ∼2 + 6 / τ τ / 3,|τ / ≤m / 22 (1-τ τ)3, m / 2<|τ|≤m0,|τ / > m

dove m è considerato un intero positivo e τ = τ/m. Questa finestra di ritardo è facile da calcolare e ha lobi laterali la cui busta decade come f – 4 in modo che la perdita della finestra di livellamento sia raramente un problema. Per una buona approssimazione, la larghezza di banda della finestra di smoothing per la finestra di Parzen lag è data da Bw=1.85 / (mΔt). Man mano che m aumenta, la larghezza di banda della finestra di livellamento diminuisce e lo stimatore della finestra di ritardo risultante diventa meno uniforme nell’aspetto. I gradi equivalenti di libertà associati sono dati approssimativamente da v = 3,71(n-p)/(mCh). La finestra Parzen lag per m=32 e la relativa finestra smoothing associata sono mostrate nella Figura 7.

Fig.7. Finestra Parzen lag (a) e la corrispondente finestra smoothing (b) per m = 32. La larghezza di banda della finestra di livellamento ÈBW = 0,058.

Ad esempio, la Figura 8 (a) mostra uno stimatore della finestra di ritardo postcolorato per i dati del calibro dell’onda del filo (la curva solida), insieme allo stimatore spettrale diretto postcolorato corrispondente(i punti, questi rappresentano la stessa stima come mostrato nella Figura 6 (b)). La finestra Parzen lag è stata utilizzata qui con un valore di m=237 per il parametro smoothing window (i corrispondenti gradi equivalenti di libertà v sono 64). Questo valore è stato scelto dopo alcuni esperimenti e sembra produrre uno stimatore della finestra di ritardo che cattura tutte le importanti caratteristiche spettrali indicate dallo stimatore spettrale diretto per frequenze comprese tra 0,4 e 4,0 Hz (si noti, tuttavia, che questo stimatore elimina il picco tra 0,0 e 0,4 Hz piuttosto male). Abbiamo anche tracciato un attraversano la cui altezza verticale rappresenta la lunghezza di un intervallo di confidenza 95% per 10 ⋅ log10(SX(f)) (in base al postcolored gal finestra stimatore), e la cui larghezza orizzontale rappresenta la lisciatura finestra di larghezza di banda BW

Fig.8. Postcolored Parzen lag finestra stima spettrale-curva solida su plot—a)-e WOSA stima spettrale—curva solida su (b) – per filo onda gauge serie temporali. Il parametro smoothing window per la finestra Parzen lag era m = 237, ottenendo v = 64 gradi equivalenti di libertà. La stima spettrale di WOSA è stata formata utilizzando un cono dati Hanning su blocchi con 256 punti dati, con blocchi adiacenti sovrapposti del 50%. I gradi equivalenti di libertà per questa stima sono v = 59.

Stimatori spettrali WOSA. Consideriamo ora il secondo approccio comune alla riduzione della varianza, vale a dire la media del segmento sovrapposto di Welch (Welch ; Carter e riferimenti in esso). L’idea di base è quella di suddividere una serie temporale in un numero di blocchi (cioè, segmenti), calcolare una stima spettrale diretta per ogni blocco e quindi produrre la stima spettrale di WOSA facendo una media di queste stime spettrali insieme. In generale, i blocchi possono sovrapporsi, con il grado di sovrapposizione determinato dal grado di affusolamento—più pesante è il grado di affusolamento, più i blocchi devono essere sovrapposti (Thomson ). Quindi, tranne che all’inizio e alla fine della serie temporale, i valori dei dati che sono fortemente rastremati in un blocco sono leggermente rastremati in un altro blocco, quindi intuitivamente stiamo recuperando “informazioni” perse a causa della riduzione in un blocco da blocchi che si sovrappongono. Poiché può essere implementato in modo computazionalmente efficiente (utilizzando l’algoritmo fast Fourier transform) e poiché può gestire serie temporali molto lunghe (o serie temporali con uno spettro variabile nel tempo), lo schema di stima WOSA è la base per molti degli analizzatori di spettro commerciali sul mercato.

Per definire lo stimatore spettrale WOSA, sia ns rappresentare una dimensione di blocco, e sia h1,…, hns sia un cono di dati. Definiamo la diretta spettrale stimatore di Sx(f) per il blocco dei ns dati contigui valori a partire indice l

S^l,X(d)(f)= ∆ T|∑t=1nshtXt−l−1e−l2n/τΔι|2,1≤l≤n+1−ns

(non c’è alcun motivo per cui non possiamo usare un prewhitened serie {Wt} qui piuttosto che Xt, ma prewhitening è raramente utilizzato in combinazione con WOSA, forse a causa del blocco di sovrapposizione è considerato come un efficace modo di compensare i gradi di libertà perduta a causa di tapering). Lo stimatore spettrale WOSA di SX (f) è definito come

(11.19)S ^ X(wosa) (f)=1nB j j=0nB−1S^js+t.x (d) (f)

dove nn è il numero totale di blocchi e s è un fattore di spostamento intero che soddisfa 0 < s≤ns e s (nB-1)=n-ns (si noti che il blocco per j=0 utilizza i valori dei dati χ1,…, Xns, mentre il blocco per j=nB-1uses Xn-ns+1,…, Xe).

Le grandi proprietà statistiche del campione di S^X(wosa)(f) assomigliano molto a quelle degli stimatori delle finestre di ritardo. in particolare, abbiamo l’approssimazione che VS^X(wosa)(f)/Sx(f)=dXv2, dove l’equivalente gradi di libertà v è dato da

v=2nB1+2∑m=1nB−1(1−mna)|∑t=1nshlht+ms|2

(qui ht=0 per definizione, per ogni t>ns). Se ci specializziamo nel caso di sovrapposizione di blocchi al 50% (cioè s=ns/2) con un cono di dati Hanning(una raccomandazione comune nella letteratura ingegneristica), questo può essere approssimato dalla semplice formula v≈36nB21 (19nb-1). Pertanto, all’aumentare del numero di blocchi nB, aumentano anche i gradi equivalenti di libertà, producendo uno stimatore spettrale con varianza ridotta. A meno che SX(⋅) non abbia un sdf relativamente privo di caratteristiche, non possiamo, tuttavia, rendere NB arbitrariamente piccolo senza incorrere in gravi pregiudizi nei singoli stimatori spettrali diretti principalmente a causa della perdita di risoluzione. (Per i dettagli sui risultati di cui sopra, vedere, Sezione 6.17.)

La figura 8 (b) mostra uno stimatore spettrale WOSA per i dati del calibro dell’onda del filo (la curva solida). Questa serie ha n = 4096 valori di dati. Alcuni esperimenti hanno indicato che una dimensione del blocco di ns=256 e il cono dei dati di Hanning sono scelte ragionevoli per stimare l’sdf tra 0,4 e 4,0 Hz usando WOSA. Con una sovrapposizione di blocchi del 50%, il fattore di spostamento è s=ns/2=128; il numero totale di blocchi è nB=1_δ(n−ns)+1=31; e v, i gradi equivalenti di libertà, è circa 59. Le 31 singole stime spettrali dirette che sono state mediate insieme per formare la stima di WOSA sono mostrate come i punti nella Figura 8 (b).

Abbiamo anche tracciato un” intervallo di larghezza di banda/confidenza ” simile a quello della Figura 8 (a), ma ora la “larghezza di banda” (cioè la larghezza orizzontale) è la distanza in frequenza tra stime spettrali approssimativamente non correlate. La misura della larghezza di banda è una funzione della dimensione del blocco ns e del cono dei dati utilizzato in WOSA. Per il cono di Hanning, la larghezza di banda è di circa 1,94/(nsΔt). Gli incroci nelle figure 8 (a) e 8 (b) sono abbastanza simili, indicando che le proprietà statistiche della finestra di Parzen lag postcolored e le stime spettrali di WOSA sono comparabili: in effetti, le stime effettive concordano strettamente, con la stima di WOSA che è leggermente più liscia nell’aspetto.

Stimatori spettrali Multitaper. Un interessante altemativo alla finestra di ritardo o alla stima spettrale di WOSA è l’approccio multitaper di Thomson . La stima spettrale multitaper può essere considerata come un modo per produrre uno stimatore spettrale diretto con più di due gradi di libertà equivalenti (i valori tipici sono da 4 a 16). Come tale, il metodo multitaper è diverso nello spirito dagli altri due stimatori in quanto non cerca di produrre spettri altamente levigati. Un aumento dei gradi di libertà da 2 a soli 10 è sufficiente, tuttavia, per ridurre la larghezza di un intervallo di confidenza del 95% per l’sdf di oltre un ordine di grandezza e quindi per ridurre la variabilità nella stima spettrale al punto in cui l’occhio umano può facilmente discem la struttura complessiva. Discussioni dettagliate sull’approccio multitaper sono dati in e Capitolo 7 di . Qui ci limitiamo a delineare le idee principali.

La stima spettrale Multitaper si basa sull’uso di una serie di K data taper {ht.k;t=1,…, n}, dove k varia da 0 a K-1. Supponiamo che questi coni siano ortonormali (cioè, t t=1nht,jht,k=1 se j=k e 0 se j k k). Lo stimatore multitaper più semplice è definito da

S^X(mt) (f)=1K K K=0K−1S^K,X(mt) (f)withS^k,x (mt) (f)Δt / ∑t=1nht, KXte-i2πftΔι|2

(Thomson sostiene adattivo ponderazione S ^ k, X (mt) (f) piuttosto che semplicemente la media insieme). Un confronto di questa definizione per S ^ k, X (mt) (⋅) con Eq. (118) mostra che S^k,X(mt)(⋅) è in realtà solo uno stimatore spettrale diretto, quindi lo stimatore multitaper è solo una media di stimatori spettrali diretti che impiegano un insieme ortonormale di coni. In determinate condizioni lievi, l’ortonormalità dei coni si traduce nel dominio della frequenza come approssimativa indipendenza di ogni individuo S^k,X(mt)(f); cioè, S^j.X(mt)(f). L’indipendenza approssimativa a sua volta implica che 2KS^k,X(mt)(f)/SX(f)=dX22k approssimativamente, in modo che i gradi equivalenti di libertà per S ^ X(mt)(f) siano pari al doppio del numero di coni di dati impiegati.

Il trucco chiave è quindi trovare un insieme di sequenze ortonormali K, ognuna delle quali fa un corretto lavoro di affusolamento. Un approccio interessante è quello di ritoccare il problema di concentrazione che ci ha dato il cono dpss per una larghezza di banda di risoluzione fissa 2W Se ora ci riferiamo a questo cono come il cono dpss di ordine zeroth e lo denotiamo con {h,, ()}, possiamo costruire ricorsivamente il restante K-1 “ordine superiore” dpss coni {ht, k} come segue. Per k=1,…, K-1, definiamo il cono dpss kth-order come l’insieme di n numeri {ht, k; t=1,…, n} tale che

1

{ht, k} è ortogonale a ciascuna delle sequenze k {ht, ()}, {, {ht,(k−1)} cioè, t t=11ht.Jht.k=0 per j=0,…, k-1);

2

{ht, k} è normalizzato in modo tale che t t=1nht, k2=1;

3

soggetto a condizioni] e 2, la finestra spettrale Hk (⋅) corrispondente a {ht.k} massimizza il rapporto di concentrazione

∫−wwHk(f)df/∫f(N)f(n)Hk(f)df=λk(n,W)

A parole, con l’unico vincolo di essere ortogonale a tutti di ordine inferiore dpss coni, kth-ordine dpss cono è “ottimale” nel senso ristretto che il sidelobes di spettrale finestra vengono soppressi per quanto possibile, come misurato dal rapporto di concentrazione. I metodi per il calcolo dei coni dati dpss sono discussi in, Capitolo 8.

In una serie di documenti, Slepian (e riferimenti in esso) ha ampiamente studiato la natura del dpss. Un fatto importante che discute è che il rapporto di concentrazione λk(n,W) diminuisce rigorosamente quando k aumenta in modo tale che λk(n,W) è vicino all’unità per k<2nw Δt, dopo di che si avvicina rapidamente a 0 con l’aumento di k (il valore 2nWΔt è talvolta chiamato il numero di Shannon). Poiché λk (n,W) deve essere vicino all’unità perché {ht,k} sia un cono di dati decente, la stima spettrale multitaper è limitata all’uso di coni ortonormali dpss al massimo-e, in pratica, di solito meno— 2nWΔt.

Un esempio di stima spettrale multitaper è mostrato in Figura 9. La colonna di sinistra dei grafici mostra i dati dpss di ordine kth per n=4096, nW=4 / Δt e k che vanno da 0 (grafico in alto) a K-1 = 5 (grafico in basso). Le sottili linee orizzontali in ciascuno di questi grafici indicano il livello zero, quindi, mentre il dpss di ordine zero è strettamente positivo ovunque (ma abbastanza vicino a 0 vicino a t=1 e t=n), i coni di ordine superiore assumono valori sia positivi che negativi. Si noti inoltre che il cono di ordine zeroth riduce pesantemente i valori delle serie temporali vicine a t=1 e t=n, ma che questi valori vengono dati successivamente più peso dai coni di ordine superiore (un’interpretazione del multitapering è che i coni di ordine superiore stanno recuperando le informazioni “perse” quando viene utilizzato un singolo cono di dati). La curva solida in Figura 9(b) mostra una stima spettrale multitaper S^X(mt)(⋅) per i dati del calibro dell’onda del filo basati su questi 6 coni dpss, mentre i punti mostrano le sei singole stime spettrali dirette S^K. X(mt)(⋅). Si noti che il numero di coni che abbiamo usato è inferiore al numero di Shannon 2nWΔt=8 e che v, i gradi equivalenti di libertà, è qui 2K=12. La stima spettrale multitaper è molto più choppier in apparenza rispetto sia la stima spettrale finestra lag di Figura 8 (a) o la stima WOSA di Figura 8(b), entrambi i quali hanno un numero nettamente superiore di gradi equivalenti di libertà ( v=64 e v=59, rispettivamente). Tuttavia, la variabilità nella stima spettrale multitaper è abbastanza piccola in modo che l’occhio possa facilmente rilevare la struttura complessiva (cfr. S ^ X (mt) (⋅) con le due stime spettrali in Figura 5), e poiché non è molto levigata, la stima multitaper fa nettamente meglio a catturare la struttura spettrale vicino a f=0.

Fig.9. Stima spettrale multitaper

Basato sui limiti delle prestazioni, Bronez [16 sostiene che lo stimatore spettrale multitaper ha proprietà statistiche superiori a WOSA per sdf con intervalli dinamici molto elevati (sono necessarie ulteriori ricerche, tuttavia, per verificare che questi limiti si traducano in un vantaggio effettivo nella pratica). Rispetto al prewhitening, il multitapering è utile in situazioni in cui la perdita è concem ma non è pratico progettare attentamente i filtri di prewhitening (ciò si verifica, ad esempio, nella geofisica di esplorazione a causa dell’enorme volume di serie temporali raccolte abitualmente). Infine, notiamo che Thomson e Chave [17 descrivono uno schema accattivante in cui il multitapering viene utilizzato in combinazione con WOSA.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.