Consistenty Estimator
11.2.3 Variance Reduction
o examinare sumară a estimărilor spectrale pentru seria de ecartament de sârmă în figurile 5 și 6 relevă o variabilitate substanțială între frecvențe, atât de mult încât este dificil să se discearnă structura generală în estimările spectrale fără o cantitate justă de studiu. Toți estimatorii spectrali direcți suferă de această choppiness inerentă, care poate fi explicată prin luarea în considerare a proprietăților distributive ale S^X(d)(f). În primul rând, dacă f nu este prea aproape de 0 sau f(N) și dacă SW (XV) satisface o condiție de regularitate ușoară, atunci 2S^w(d)(f)/SW(f)=dx22; adică rv 2s^w(d)(f)/SW(f) este aproximativ egal în distribuție cu un RV chi-pătrat cu 2 grade de libertate. În cazul în care nu se utilizează conic, f este considerat “nu prea aproape” de 0 sau f(N)dacă 1/(n-P) (2499>F<) (n) -1/(N-P) (1); dacă se utilizează conic, trebuie să înlocuim 1/(N-P)Octoct cu un termen mai mare, reflectând lățimea crescută a lobului central al ferestrei spectrale(de exemplu, termenul pentru conicul de date Hanning este de aproximativ 2/(n-P)Octict, deci f este “nu prea aproape” dacă 2/(n-p)Hectolixt<f<f(n)-2 / (N-P) Octoct).
deoarece un chi-pătrat RV xv2 cu V grade de libertate are o varianță de 2U, avem aproximarea V=Sw2(f). Acest rezultat este independent de numărul de Wt, avem: spre deosebire de statistici precum media eșantionului RV Gaussian independent și distribuit identic, varianța S^W(d)(f) nu scade la 0 pe măsură ce dimensiunea eșantionului n-p devine mai mare (cu excepția cazului neinteresant Sw(f)=0). Acest rezultat explică variabilitatea estimărilor spectrale directe prezentate în figurile 5 și 6. În terminologia statistică, S^W(d) (f) este un estimator inconsistent al Sw (f).
acum prezentăm trei abordări pentru obținerea unui estimator consecvent al Sw(f). Fiecare abordare se bazează pe combinarea RV-urilor care, sub ipoteze adecvate, pot fi considerate ca estimatori necorelați aproximativ în perechi ai SW(f). Pe scurt, cele trei abordări sunt
1
smooth S^W(d)(f) pe frecvențe, obținându-se ceea ce este cunoscut sub numele de estimator spectral al ferestrei de întârziere;
2
{XT} (sau {Wt}) într-un număr de segmente (dintre care unele se pot suprapune), calculați o estimare spectrală directă pentru fiecare segment și apoi mediați aceste estimări împreună, obținându-se;
3
calculați o serie de estimări spectrale directe pentru {Wt} folosind un set de date ortogonale și apoi mediați aceste estimări împreună, producând Estimatorul spectral Multitaper al lui Thomson.
estimatorii spectrali ai ferestrei de întârziere un estimator spectral al ferestrei de întârziere a Sw (XV) ia forma
în cazul în care WM (XV) este o fereastră de netezire ale cărei proprietăți de netezire sunt controlate de parametrul de netezire m. În cuvinte, Estimatorul S^W(LW) (XV) se obține prin convolvarea unei ferestre de netezire cu Estimatorul spectral direct S^W (D) (XV). O fereastră tipică de netezire are același aspect ca o fereastră spectrală. Există lob acentral cu o lățime care poate fi reglată prin parametrul de netezire m: cu cât acest lob central este mai larg, cu atât va fi mai lin s^W(w) (XV). Poate exista, de asemenea, un set de laturi enervante care provoacă scurgeri de ferestre de netezire. Prezența scurgerilor de ferestre de netezire este ușor de detectat prin suprapunerea parcelelor de S^W(LW) (sec) și S^W(d) (sec) și căutarea unor intervale de frecvențe în care prima nu pare a fi o versiune netezită a celei de-a doua.
Dacă am făcut uz de un AR prewhitening filtru, putem apoi postcolor S^W(lw)(⋅) pentru a obține un estimator de Sx(⋅), și anume,
proprietățile statistice ale S^W(lw)(.) sunt tratabile datorită următorului rezultat mare al eșantionului. Dacă s^W(d) (XV) este de fapt periodograma (adică nu am conicizat valorile Wt), setul de rvs S^W(d)(j/(N−P)XVT), j=1,2,…, j,, sunt aproximativ perechi necorelate, fiecare rv fiind proporțional cu un rv22, RV (aici J este cel mai mare număr întreg astfel încât J/(n-p)<1/2). Dacă am folosit conic pentru a forma Sw (d) (XV), o afirmație similară este adevărată pentru un set mai mic de RV—uri definite pe o rețea mai grosieră de frecvențe la distanțe egale-pe măsură ce gradul de conic crește, numărul de RV-uri aproximativ necorelate scade. Pe baza ipotezelor că SDF SW (XV) variază lent de-a lungul frecvențelor (prewhitening-ul ajută la realizarea acestui lucru) și că lobul central al ferestrei de netezire este suficient de mic în comparație cu variațiile din SW(XV), rezultă că S^W(d) (f) în Eq. (11.15) poate fi aproximată printr-o combinație liniară de RV-uri necorelate de la numărul 22. Un argument standard “grade echivalente de libertate” poate fi apoi utilizat pentru a aproxima distribuția S^W(lw)(f). (a se vedea Eq. (11.17) mai târziu).
există două modalități practice de calcul S^W(LW) (XV). Prima modalitate este de a discretiza Eq. (11.15), obținându−se un estimator proporțional cu o convoluție a formei de formă(F-fk’) SW(d) (fk’), unde valorile offk’ sunt un set de frecvențe la distanțe egale. A doua modalitate este să reamintim că “convoluția într-un domeniu Fourier este echivalentă cu înmulțirea în celălalt” pentru a rescrie Eq. (11.15) ca
unde C^XV.W(d), este Estimatorul acvs dat în Eq. (11.9) corespunzător S^W(d) (.), și {wt.M} este o fereastră lag (aceasta poate fi privită ca transformata Fourier inversă a ferestrei de netezire Wm (XV)). De fapt, pentru că S^W(d)(.) este un polinom trigonometric, toate convoluțiile discrete ale formei(F−fk’)S^W(d)(fk’) pot fi, de asemenea, calculate prin Eq. (11.16) cu o alegere adecvată a valorilor wt,m (Pentru detalii, a se vedea secțiunea 6.7). Cele două moduri practice de calcul S^W (l,w) (.) astfel produce estimatori echivalenți. Cu excepția cazului în care convoluția discretă este suficient de scurtă, Eq. (11.16) este mai rapid de utilizat din punct de vedere al calculului.
teoria statistică sugerează că, sub ipoteze rezonabile
la o aproximare bună, unde v se numește gradele echivalente de libertate pentru S^W(lw) (f) și este dat de v=2 (n−p)BW . Aici Bw este o măsură a lățimii de bandă a ferestrei de netezire Wm (XV)A)n d poate fi calculat prin BW = 1 / hectolitru T=−(n−p−1)n−p−1wT,m2;;pe de altă parte, Ch depinde doar de conicitatea aplicată valorilor Wtși poate fi calculat prin Ch=(n−p) 1=p+1nht4rețineți că, dacă nu se conică în mod explicit, atunci ht=1/n−pși, prin urmare, Ch>1; pentru o conicitate tipică a datelor, inegalitatea Cauchy ne spune că Ch>1(de exemplu, ch 1.94 Pentru conicitatea datelor Hanning). Gradele echivalente de libertate pentru S^W(LW)(f)cresc astfel pe măsură ce creștem lățimea de bandă a ferestrei de netezire și scădem pe măsură ce creștem gradul de conicitate. Ecuația (11.17) ne spune că E SW(F) și că v SW2(F)/V,deci creșterea v scade V.
aproximarea în Eq. (11.17)poate fi utilizat pentru a construi un interval de încredere pentru SW(f) în modul următor.Fie ca NV (XV) să indice punctul procentual 100% din distribuția XV2; adică,p=XV.Intervalul de încredere A100( 1-2 inkt) % pentru Sw (f) este aproximativ dat de
punctele procentuale de(11,18) sunt intabulate în numeroase manuale sau pot fi calculate folosind un algoritm dat de BEST și Roberts
intervalul de încredere de (11,18) este incomod prin faptul că lungimea sa este proporțională cu S^W(LW)(f). Pe de altă parte, intervalul de încredere corespunzător pentru 10.log10 (SW (f)) (adică, SW(f) pe o scară decibeli) este doar
care are o lățime independentă de S^W (lw) (.). Acesta este motivul pentru trasarea estimărilor sdf pe o scară decibel (sau logaritmică).
un număr năucitor de ferestre diferite lag a fost discutat în literatura de specialitate (a se vedea ). Aici dăm un singur exemplu, binecunoscuta fereastră parzen fag (Parzen):
unde m este considerată a fi un număr întreg pozitiv și τ=τ/m. Acest decalaj fereastra este ușor de a calcula și de a sidelobes al cărui plic se descompune ca f-4, astfel încât netezirea fereastra de scurgere este rareori o problemă. Pentru o aproximare bună, lățimea de bandă a ferestrei de netezire pentru fereastra Parzen lag este dată de Bw = 1,85 / (m octoctt). Pe măsură ce m crește, lățimea de bandă a ferestrei de netezire scade, iar Estimatorul ferestrei de întârziere rezultat devine mai puțin neted. Gradele echivalente de libertate asociate sunt date aproximativ de v = 3,71(n-p)/(mCh). Fereastra Parzen lag pentru m = 32 și fereastra de netezire asociată sunt prezentate în Figura 7.
de exemplu, Figura 8 (A) prezintă un estimator al ferestrei de întârziere postcolored pentru datele gabaritului de undă de sârmă (curba solidă), împreună cu Estimatorul spectral direct postcolored corespunzător(punctele, acestea descriu aceeași estimare ca în Figura 6 (b)). Fereastra Parzen lag a fost utilizată aici cu o valoare de m=237 pentru parametrul ferestrei de netezire (gradele echivalente de libertate v corespunzătoare sunt 64). Această valoare a fost aleasă după unele experimentări și pare să producă un estimator al ferestrei de întârziere care surprinde toate caracteristicile spectrale importante indicate de Estimatorul spectral direct pentru frecvențe cuprinse între 0,4 și 4,0 Hz (rețineți, totuși, că acest estimator elimină vârful între 0,0 și 0,4 Hz destul de prost). De asemenea, am trasat o încrucișare a cărei înălțime verticală reprezintă lungimea unui interval de încredere de 95% pentru 10 log10(SX(f)) (pe baza estimatorului ferestrei lag postcolored) și a cărei lățime orizontală reprezintă lățimea de bandă a ferestrei de netezire BW
estimatori spectrali WOSA. Să analizăm acum a doua abordare comună a reducerii varianței, și anume, Media segmentului suprapus de Welch (Welch ; Carter și referințe în acesta). Ideea de bază este de a sparge o serie de timp într-un număr de blocuri (adică., segmente), calculați o estimare spectrală directă pentru fiecare bloc și apoi produceți estimarea spectrală WOSA prin medierea acestor estimări spectrale împreună. În general, blocurile sunt lăsate să se suprapună, gradul de suprapunere fiind determinat de gradul de conicitate—cu cât gradul de conicitate este mai mare, cu atât blocurile ar trebui să fie suprapuse (Thomson ). Astfel, cu excepția începutului și sfârșitului seriei de timp, valorile datelor care sunt puternic conice într-un bloc sunt ușor conice într-un alt bloc, deci intuitiv recapturăm “informațiile” pierdute din cauza conicării într-un bloc din blocurile care se suprapun. Deoarece poate fi implementat într-un mod eficient din punct de vedere al calculului (folosind algoritmul de transformare Fourier rapidă) și pentru că poate gestiona serii de timp foarte lungi (sau serii de timp cu un spectrmm variabil în timp), schema de estimare WOSA este baza multor analizoare de spectru Comerciale de pe piață.
pentru a defini Estimatorul spectral WOSA, lăsați ns să reprezinte o dimensiune a blocului și lăsați h1,…, hns fi un Conic de date. Definim Estimatorul spectral direct al Sx (f) pentru blocul de valori de date contigue ns pornind de la indexul l ca
(nu există niciun motiv pentru care nu putem folosi o serie prewhitened {Wt} aici mai degrabă decât Xt, dar prewhitening-ul este rar utilizat împreună cu WOSA, poate pentru că suprapunerea blocurilor este privită ca o modalitate eficientă de compensare a gradelor de libertate pierdute din cauza conicării). Estimatorul spectral WOSA al SX (f) este definit ca fiind
unde nn este numărul total de blocuri și s este un factor de schimbare a numărului întreg care satisface 0 < s ns și s(nb-1)=n-ns (rețineți că blocul pentru j = 0 utilizează valori de date CTX1,…, Xns, în timp ce blocul pentru j = NB-1utilizează Xn-ns + 1,…, Xe).
proprietățile statistice mari ale eșantionului S^X(wosa)(f) seamănă îndeaproape cu cele ale estimatorilor de ferestre lag. în special, avem aproximarea că VS^x(wosa) (f) / Sx(f) = dXv2,, unde gradele echivalente de libertate v sunt date de
(aici ht = 0 prin definiție pentru toate t > ns). Dacă ne specializăm în cazul suprapunerii blocurilor de 50% (adică s=ns/2) cu o conicitate a datelor Hanning(o recomandare comună în literatura de inginerie), aceasta poate fi aproximată prin formula simplă v 36nb21 (19nb-1). Astfel, pe măsură ce numărul de blocuri nB crește, gradele echivalente de libertate cresc și ele, producând un estimator spectral cu varianță redusă. Cu excepția cazului în care SX (XV) are un sdf relativ lipsit de caracteristici, nu putem, totuși, să facem NB în mod arbitrar mic, fără a suferi o părtinire severă în estimatorii spectrali direcți individuali, în principal din cauza pierderii rezoluției. (Pentru detalii privind rezultatele de mai sus , a se vedea secțiunea 6.17.)
figura 8(b) prezintă un estimator spectral WOSA pentru datele gabaritului undelor de sârmă (curba solidă). Această serie are n = 4096 valori de date. Unele experimente au indicat că o dimensiune a blocului de ns = 256 și conicitatea datelor Hanning sunt alegeri rezonabile pentru estimarea sdf între 0,4 și 4,0 Hz folosind WOSA. Cu o suprapunere de bloc de 50%, factorul de deplasare este s=ns/2=128; Numărul total de blocuri este NB=1_ hectolitru(n−ns)+1=31; și v, gradele echivalente de libertate, este de aproximativ 59. Cele 31 de estimări spectrale directe individuale care au fost mediate împreună pentru a forma estimarea WOSA sunt prezentate ca puncte în Figura 8(b).
am trasat, de asemenea, un “interval de lățime de bandă/încredere” încrucișat similar cu cel din Figura 8(a), dar acum “lățimea de bandă” (adică lățimea orizontală) este distanța în frecvență dintre estimările spectrale aproximativ necorelate. Măsura lățimii de bandă este o funcție a dimensiunii blocului ns și a conicului de date utilizat în WOSA. Pentru conicitatea Hanning, lățimea de bandă este de aproximativ 1,94/(nscictt). Încrucișările din figurile 8(a) și 8(b) sunt destul de similare, indicând faptul că proprietățile statistice ale ferestrei Parzen lag postcolored și estimările spectrale WOSA sunt comparabile: într-adevăr, estimările reale sunt de acord îndeaproape, estimarea WOSA fiind ușor mai netedă în aparență.
Estimatori Spectrali Multitaper. Un altemativ interesant fie pentru fereastra lag, fie pentru estimarea spectrală WOSA este abordarea multitaper a Thomson . Estimarea spectrală Multitaper poate fi privită ca o modalitate de a produce un estimator spectral direct cu mai mult de două grade echivalente de libertate (valorile tipice sunt de la 4 la 16). Ca atare, metoda multitaper este diferită în spirit de ceilalți doi estimatori prin faptul că nu încearcă să producă Spectre foarte netezite. O creștere a gradelor de libertate de la 2 la doar 10 este suficientă, totuși, pentru a micșora lățimea unui interval de încredere de 95% pentru sdf cu mai mult decât un ordin de mărime și, prin urmare, pentru a reduce variabilitatea estimării spectrale până la punctul în care ochiul uman poate discem cu ușurință structura generală. Discuții detaliate cu privire la abordarea multitaper sunt prezentate în și Capitolul 7 din . Aici doar schițăm ideile principale.
estimarea spectrală Multitaper se bazează pe utilizarea unui set de K date conice {ht.k; t=1,…, n}, unde k variază de la 0 la K-1. Presupunem că aceste conice sunt ortonormale (adică, inkt t = 1nht, jht, k = 1 Dacă j = k și 0 dacă j inkt k). Cel mai simplu estimator multitaper este definit de
(Thomson susține ponderarea adaptivă A S^k, X(mt) (f), mai degrabă decât simpla mediere a acestora împreună). O comparație a acestei definiții pentru S^k, X (mt) (XV) cu Eq. (118) arată că s^k,X(mt) (XV) este de fapt doar un estimator spectral direct, deci Estimatorul multitaper este doar o medie a estimatorilor spectrali direcți care utilizează un set ortonormal de conici. În anumite condiții ușoare, ortonormalitatea conicilor se traduce în domeniul frecvenței ca independență aproximativă a fiecărui individ S^k, X(mt)(f); adică s^j.X(mt)(f). Independența aproximativă implică,la rândul său, că 2KS^k, X(mt)(f)/SX(f)=dx22k aproximativ, astfel încât gradele echivalente de libertate pentru S^X(mt)(f) este egal cu dublul numărului de date conice utilizate.
trucul cheie este atunci să găsești un set de K secvențe ortonormale, fiecare dintre ele făcând o treabă adecvată de conicitate. O abordare atrăgătoare este de a reveni la problema de concentrare care ne-a dat conicitatea dpss pentru o lățime de bandă de rezoluție fixă 2W dacă ne referim acum la această conicitate ca conicitate DPSS de ordinul zero și o denotăm cu {h,,()}, putem construi recursiv restul de K-1 “ordin superior” DPSS se îngustează {ht,k} după cum urmează. Pentru k = 1,…, K-1, definim conicitatea dpss de ordinul K Ca set de n numere {ht, k; t=1,…, n} astfel încât
1
{ht,k} să fie ortogonală pentru fiecare dintre secvențele k {ht,()},…,{ht,(k−1)}adică, t=11ht.Jht.k = 0 pentru j = 0,…, k-1);
2
{ht, K} este normalizat astfel încât t=1nht,K2=1;
3
sub rezerva unor condiții] și 2, fereastra spectrală HK (XV) corespunzătoare {ht.k} maximizează raportul de concentrație
în cuvinte, sub rezerva constrângerii de a fi ortogonal la toate dpss de ordin inferior, conicitatea dpss de ordinul K este “optimă” în sensul restricționat că lobii laterali ai ferestrei sale spectrale sunt suprimați cât mai mult posibil măsurat prin raportul de concentrație. Metodele de calculare a datelor DPSS sunt discutate în Capitolul 8.
într-o serie de lucrări, Slepian (și referințele din acestea) a studiat pe larg natura dpss. Un fapt important pe care îl discută este acela că raportul de concentrație(n,W) scade strict pe măsură ce k crește în așa fel încât(N,W) este aproape de unitate pentru k<2NW), după care se apropie rapid de 0 odată cu creșterea (valoarea 2NW) este uneori numită numărul Shannon). Din moment ce XVK(n,W) trebuie să fie aproape de unitate pentru ca {ht,k} să fie o conicitate decentă a datelor, estimarea spectrală multitaper este limitată la utilizarea a cel mult-și, în practică, de obicei mai puțin de— 2NW centuri ortonormale DPSS.
un exemplu de estimare spectrală multitaper este prezentat în Figura 9. Coloana din stânga a parcelelor prezintă datele DPSS de ordinul K pentru n = 4096, NW=4/Octoctt și k variind de la 0 (graficul de Sus) La K-1=5 (graficul de jos). Liniile orizontale subțiri din fiecare dintre aceste parcele indică nivelul zero, deci, în timp ce DPSS de ordinul zero este strict pozitiv peste tot (dar destul de aproape de 0 lângă t=1 și t=n), conicurile de ordin superior își asumă atât valori pozitive, cât și negative. Rețineți, de asemenea, că valorile de conicitate de ordinul zero reduc puternic valorile seriilor de timp apropiate de t=1 și t=n, dar că aceste valori sunt date succesiv mai multă greutate de către conicurile de ordin superior (o interpretare a multitapering-ului este că conicurile de ordin superior recapturează informații “pierdute” atunci când se folosește doar o singură conicitate de date). Curba solidă din Figura 9 (b) prezintă o estimare spectrală multitaper S^X(mt) (XV) pentru datele gabaritului de undă de sârmă bazate pe aceste 6 DPSS se îngustează, în timp ce punctele arată cele șase estimări spectrale directe individuale S^K. X(mt) (XV). Rețineți că numărul de conice pe care le-am folosit este sub numărul Shannon 2NW octoctt=8 și că v, gradele echivalente de libertate, este aici 2K=12. Estimarea spectrală multitaper are un aspect mult mai choppier decât estimarea spectrală a ferestrei lag din Figura 8(A) sau estimarea WOSA din Figura 8(b), ambele având un număr semnificativ mai mare de grade echivalente de libertate ( v=64 și v=59, respectiv). Cu toate acestea, variabilitatea estimării spectrale multitaper este suficient de mică, astfel încât ochiul să poată detecta cu ușurință structura generală (cf. S ^ X(mt) (XV) cu cele două estimări spectrale din Figura 5) și, deoarece nu este foarte netezită, estimarea multitaper se descurcă semnificativ mai bine la captarea structurii spectrale lângă f=0.
pe baza limitelor de performanță, Bronez [16 susține că Estimatorul spectral multitaper are proprietăți statistice superioare WOSA pentru sdfs cu intervale dinamice foarte mari (cu toate acestea, sunt necesare mai multe cercetări pentru a verifica dacă aceste limite se traduc într-un avantaj real în practică). În comparație cu prewhitening, multitapering-ul este util în situațiile în care scurgerea este un concem, dar nu este practic să proiectați cu atenție filtrele de prewhitening (acest lucru se întâmplă, de exemplu, în geofizica explorării datorită volumului enorm de serii de timp colectate în mod obișnuit). În cele din urmă, observăm că Thomson și Chave [17 descrie o schemă atrăgătoare în care multitapering este utilizat împreună cu WOSA.