konsistent Estimator

11.2.3 Variansreduktion

en kortvarig undersøgelse af spektralestimaterne for trådmålerserien i figur 5 og 6 afslører betydelig variation på tværs af frekvenser, så meget, at det er vanskeligt at skelne den samlede struktur i spektralestimaterne uden en rimelig mængde undersøgelse. Alle direkte spektrale estimatorer lider af denne iboende hakkethed, hvilket kan forklares ved at overveje fordelingsegenskaberne for S^(d)(f). For det første, hvis f ikke er for tæt på 0 eller f(n), og hvis sv (liter) opfylder en mild regelmæssighedstilstand, så er 2S^v(d)(f)/sv(f)=dh22; dvs.rv 2S^v(d)(f)/sv(f) omtrent lige stor i fordeling til en chi-firkantet rv med 2 frihedsgrader. Hvis der ikke anvendes tilspidsning, betragtes f som” ikke for tæt ” på 0 eller f(N), hvis 1 / (n-p) – ret< – f < – f (N) -1 / (n-p) – Rett; hvis der anvendes tilspidsning, skal vi erstatte 1/(n-p)krudt med et større udtryk, hvilket afspejler den øgede bredde af spektralvinduets centrale lap(for eksempel er udtrykket for Hanning-datatilspidsen cirka 2/(n-p)krudt, så f er “ikke for tæt”, hvis 2/(n-p)krudt<f<f(N)-2 / (n-p)krudt).

da en chi-firkantet rv 2 med V frihedsgrader har en varians på 2u, har vi tilnærmelsen V=S2(f). Dette resultat er uafhængigt af antallet af vægt, vi har: i modsætning til statistikker som f.eks prøve gennemsnit af uafhængige og identisk distribuerede gaussiske RV ‘ er, variansen af S^v(d)(f) falder ikke til 0, når prøvestørrelsen n-p bliver større (undtagen i det uinteressante tilfælde SV(f)=0). Dette resultat forklarer choppiness af de direkte spektrale estimater vist i figur 5 og 6. I statistisk terminologi er S^H(d) (f) en inkonsekvent estimator af SV (f).

vi skitserer nu tre tilgange til opnåelse af en konsekvent estimator af SV(f). Hver tilgang er baseret på en kombination af RV ‘ er, der under passende antagelser kan betragtes som tilnærmelsesvis parvise ukorrelerede estimatorer af SV(f). Kort sagt er de tre tilgange til

1

glat S^B(d) (f) på tværs af frekvenser, hvilket giver det, der er kendt som en lagvinduespektral estimator;

2

i et antal segmenter (hvoraf nogle kan overlappe hinanden), beregne et direkte spektralt skøn for hvert segment og derefter gennemsnitlige disse estimater sammen, hvilket giver;

3

Beregn en række direkte spektrale estimater for {vægt} ved hjælp af et sæt ortogonale datafasninger og gennemsnit derefter disse estimater sammen, hvilket giver Thomsons multitaper spektral estimator.

Lagvinduespektral estimatorer en lagvinduespektral estimator af SV (larr) tager form

(11.15)S^V(LV)(f)=larr−f(N)f(N)masseødelæggelsesvåben(F−F’)S^v(d)(f’) df’

hvor masseødelæggelsesvåben er et udjævningsvindue, hvis udjævningsegenskaber styres af udjævningsparameteren m. I ord opnås estimatoren S^V (lv) (lv) ved at sammenlægge et udjævningsvindue med den direkte spektrale estimator S^v(d) (LV). Et typisk udjævningsvindue har stort set det samme udseende som et spektralt vindue. Der er acentral lobe med en bredde, der kan justeres ved hjælp af udjævningsparameteren m: jo bredere denne centrale lobe er, jo glattere S^B(b) (r) vil være. Der kan også være et sæt irriterende sidelober, der forårsager udjævning af vindueslækage. Tilstedeværelsen af udjævning af vindueslækage registreres let ved at overlejre plots af S^V(lv) (lv) og S^v(d) (lv) og kigge efter frekvensområder, hvor førstnævnte ikke ser ud til at være en glat version af sidstnævnte.

Hvis vi har gjort brug af en AR prewhitening filter, kan vi så postcolor S^W(lw)(⋅) for at opnå en estimator af Sx(⋅), nemlig

SX(pc)(f)=R^W(tw)(f)|1−∑k=1pϕke−i2πfkΔt|2

De statistiske egenskaber af S^W(lw)(.) kan spores på grund af følgende store prøveresultat. Hvis S^H (D) (kr) faktisk er periodogrammet (dvs. vi har ikke tilspidset værdierne for KR), er sættet af rvs S^H(d) (j/(n−p) kr), j=1,2,…, j,, er omtrent parvis ukorrelerede, idet hver rv er proportional med en kr22, rv (her er J det største heltal, således at J/(n-P)<1/2). Hvis vi har brugt tilspidsning til at danne SV(d) (kr), gælder en lignende erklæring over et mindre sæt RV ‘er defineret på et grovere gitter med lige store frekvenser—når graden af tilspidsning stiger, falder antallet af ca.ukorrelerede RV’ er. Under antagelserne om, at sdf SV (kurr) langsomt varierer på tværs af frekvenser (forhvidning hjælper med at gøre dette sandt), og at udjævningsvinduets centrale lap er tilstrækkelig lille sammenlignet med variationerne i kurr (kurr), følger det, at S^H(d)(f) i EKV. (11.15) kan tilnærmes ved hjælp af en lineær kombination af ukorrelerede RV ‘ er med rr22. Et standardargument” ækvivalente frihedsgrader ” kan derefter bruges til at tilnærme fordelingen af S^V(LV)(f). (jf. (11.17) senere).

der er to praktiske måder at beregne S^V(lv) (lv). Den første måde er at diskretisere EKV. (11.15), hvilket giver en estimator, der er proportional med en konvolution af formen(f−fk’)SV(d)(fk’), hvor værdierne offk’ er et sæt frekvenser med lige stor afstand. Den anden måde er at huske, at “foldning i et Fourier-domæne svarer til multiplikation i det andet” for at omskrive EKV. (11.15) som

(11.16)S^V(LV)(f)=ret=−(n−p−1)n−p−1VT,mc^ret.V (e) e-L2N / l

hvor C ^ LR.V (d), er acvs-estimatoren angivet i EKV. (11.9) svarende til S^B (d) (.), og {VT.m} er et lag-vindue (dette kan betragtes som den inverse Fourier-transformation af udjævningsvinduet masseødelæggelsesvåben (venstre)). Faktisk fordi S^H (d) (.) er et trigonometrisk polynom, alle diskrete omvæltninger af formen (f-fk’) S^H(d) (fk’) kan også beregnes via EKV. (11.16) med et passende valg af vægt,m-værdier (for detaljer, Se afsnit 6.7). Vores to praktiske måder at beregne S^H (l,H) (.) giver således ækvivalente estimatorer. Medmindre den diskrete konvolution er tilstrækkelig kort, EKV. (11.16) er beregningsmæssigt hurtigere at bruge.

statistisk teori antyder, at under rimelige antagelser

(11.17)vS^V(LV)(f)sv(f)=dv2

til en god tilnærmelse,hvor v kaldes de ækvivalente frihedsgrader for S^V(LV)(f) og er givet af v=2(n−P)SV . Her er BV et mål for båndbredden af udjævningsvinduet masseødelæggelsesvåben (lp) a) n d kan beregnes via BV=1 / Lprp=−(n−p−1) lprprp,m2;;på den anden side afhænger Ch kun af den tilspidsning,der anvendes på værdierne for vægtog kan beregnes via Ch=(n−p)−kursen 1=p+1nht4bemærk, at hvis vi ikke eksplicit tilspidser, så ht=1/n-pand derfor Ch>1; for en typisk datatilspidsning fortæller Cauchy-uligheden os, at Ch>1(for eksempel ch-kursen 1.94 for Hanning-datatilspidsen). De tilsvarende frihedsgrader for S^V(f) øges således, når vi øger udjævningsvinduets båndbredde og falder, når vi øger graden af tilspidsning. Ligning (11.17) fortæller os, at e-Kr(f) og at V-KR2 (f)/v,så stigende v falder V.

tilnærmelsen i EKV. (11.17)kan anvendes til at konstruere et konfidensinterval for SV(f) på følgende måde.Lad NV (kr.) betegne kr. 100% procentpoint af kv2distributionen; dvs. p=kr.A100 (1-2 liter)% konfidensinterval for SV(f) er omtrent givet af

(11.18)

procentpoint-kursen er opstillet i adskillige lærebøger eller kan beregnes ved hjælp af en algoritme givet af Best og Roberts

konfidensintervallet på(11.18) er ubelejligt, idet dets længde er proportional med S^V (LV) (f). På den anden side er det tilsvarende konfidensinterval for 10.log10 (SV (f)) (dvs. SV (f) på en decibel skala) er bare

som har en bredde, der er uafhængig af S^B (LV) (.). Dette er begrundelsen for at plotte sdf-estimater på en decibel (eller logaritmisk) skala.

et forvirrende antal forskellige lagvinduer er blevet diskuteret i litteraturen (se ). Her giver vi kun et eksempel, det velkendte parse fag-vindue (Parse ):

vægt.m=1-6τ∼2+6|τ∼|3,|τ|≤m/22(1-τ∼)3,m/2<|τ|≤m0,|τ|>m

, hvor m er taget for at være et positivt heltal, og τ=τ m/m. Denne lag-vinduet er let at beregne og har sidelobes, hvis konvolut henfalder som f-4, så udjævning vindue lækage er sjældent et problem. Til en god tilnærmelse er udjævningsvinduets båndbredde for vinduet med forsinkelse givet af BV=1,85 / (m krart). Når m øges, formindskes udjævningsvinduets båndbredde, og den resulterende lagvinduestimator bliver mindre glat i udseende. De tilhørende ækvivalente frihedsgrader gives ca. v=3,71(n-p)/(mCh). Vinduet med forsinkelse for m=32 og det tilhørende udjævningsvindue er vist i Figur 7.

Fig.7. Parset lagvindue (A) og det tilsvarende udjævningsvindue (b) for m = 32. Udjævningsvinduets båndbredde erbv = 0,058.

som et eksempel viser figur 8(A) en postfarvet lagvinduestimator for trådbølgemåledataene (den faste kurve) sammen med den tilsvarende postfarvede direkte spektrale estimator (prikkerne viser disse det samme skøn som vist i figur 6(b)). Her blev der brugt et vindue med en værdi på m=237 til udjævningsvindueparameteren (de tilsvarende ækvivalente frihedsgrader v er 64). Denne værdi blev valgt efter nogle eksperimenter og ser ud til at producere en lagvinduestimator, der fanger alle de vigtige spektrale funktioner, der er angivet af den direkte spektrale estimator for frekvenser mellem 0,4 og 4,0 timer (Bemærk dog, at denne estimator udtværer toppen mellem 0,0 og 0,4 timer temmelig dårligt). Vi har også tegnet en kryds og tværs, hvis lodrette højde repræsenterer længden af et 95% konfidensinterval for 10 liter log10(S (F)) (baseret på den postfarvede lagvinduestimator), og hvis vandrette bredde repræsenterer udjævningsvinduets båndbredde BV

Fig.8. Efterfarvet parset lag vindue spektral estimat-solid kurve på plot (A)—og vosa spektral estimat-solid kurve på (b)—til trådbølgemåler tidsserier. Udjævningsvindueparameteren for vinduet med forsinkelse var m = 237, hvilket gav v = 64 ækvivalente frihedsgrader. Det spektrale estimat blev dannet ved hjælp af en Hanning data konisk på blokke med 256 datapunkter, med tilstødende blokke overlappende med 50%. De tilsvarende frihedsgrader for dette skøn er v = 59.

Spectral Estimators. Lad os nu overveje den anden fælles tilgang til variansreduktion, nemlig det overlappede segment gennemsnit (Carter og referencer deri). Den grundlæggende ide er at bryde en tidsserie i et antal blokke (dvs., segmenter), beregne et direkte spektralt skøn for hver blok, og fremstil derefter vosa-spektralestimatet ved at gennemsnit disse spektrale estimater sammen. Generelt får blokkene overlapning, hvor graden af overlapning bestemmes af graden af tilspidsning—jo tungere graden af tilspidsning er, desto mere skal blokkene overlappes (Thomson ). Således, undtagen i begyndelsen og slutningen af tidsserien, er dataværdier, der er stærkt tilspidsede i en blok, let tilspidsede i en anden blok, så intuitivt genvinder vi “information”, der er mistet på grund af tilspidsning i en blok fra blokke, der overlapper den. Fordi det kan implementeres på en beregningseffektiv måde (ved hjælp af Fast Fourier-transformationsalgoritmen), og fordi det kan håndtere meget lange tidsserier (eller tidsserier med en tidsvarierende spektmm), er vosa-estimeringsskemaet grundlaget for mange af de kommercielle spektrumanalysatorer på markedet.

for at definere vosa spektral estimator, lad ns repræsentere en blokstørrelse, og lad h1,…, hns være en data tilspidsning. Vi definerer den direkte spektrale estimator af SC(f) for blokken af NS sammenhængende dataværdier, der starter ved indeks l som

S^L, H (d) (f)=Lr|LR t=1nshttst-l−1E-l2n/LR / 2,1 LRR N + 1-ns

(der er ingen grund til, at vi ikke kan bruge en forudhviddet serie her snarere end en, men forhvidning bruges sjældent sammen med vosa, måske fordi overlapning af blokke betragtes som en effektiv måde at kompensere for de frihedsgrader, der er gået tabt på grund af tilspidsning). Estimatoren er defineret til at være

(11.19) S^S (vosa) (f)=1NB j = 0NB−1s^js+t. S (d) (f)

hvor nn er det samlede antal blokke, og s er en heltalskiftfaktor, der tilfredsstiller 0<s-ns ns og s(nB-1)=n-NS (bemærk, at blokken for j=0 bruger dataværdier-J1,…, NNS, mens blokken for j=nB-1uses NN-NS+1,…).

de store stikprøvestatistiske egenskaber for S^(vosa)(f) ligner meget lagvinduestimatorernes. især har vi den tilnærmelse, at VS^(V) (f) / S(f)=dv2,, hvor de ækvivalente frihedsgrader V er givet af

v=2nb1+2 list m=1NB−1(1−mna)|list t=1nshlht + ms|2

(her ht=0 per definition for alle t> ns). Hvis vi specialiserer os i tilfælde af 50% blokoverlapning (dvs.s=ns/2) med en Hanning data taper (en fælles anbefaling i ingeniørlitteraturen), kan dette tilnærmes ved hjælp af den enkle formel V-kur 36nB21(19nb-1). Således, som antallet af blokke nB stiger, de tilsvarende frihedsgrader øges også, hvilket giver en spektral estimator med reduceret varians. Vi kan dog ikke gøre nB vilkårligt lille uden at pådrage sig alvorlig bias i de individuelle direkte spektrale estimatorer hovedsageligt på grund af tab af opløsning. (For detaljer om ovenstående resultater, Se afsnit 6.17.)

figur 8 (b) viser en vosa-spektral estimator for trådbølgemålerdataene (den faste kurve). Denne serie har n=4096 dataværdier. Nogle eksperimenter viste, at en blokstørrelse på ns=256 og Hanning data taper er rimelige valg til estimering af sdf mellem 0,4 og 4,0 HS ved hjælp af vosa. Med en blokoverlapning på 50% er skiftfaktoren s=ns/2=128; det samlede antal blokke er NB=1_ liter(N−NS)+1=31; og v, de ækvivalente frihedsgrader, er cirka 59. De 31 individuelle direkte spektrale estimater, der blev gennemsnitligt sammen for at danne vosa-estimatet, vises som prikkerne i figur 8(b).

vi har også tegnet et “båndbredde/konfidensinterval” på kryds og tværs svarende til det på figur 8(A), men nu er “båndbredden” (dvs.den vandrette bredde) afstanden i frekvens mellem omtrent ukorrelerede spektrale estimater. Th er måling af båndbredde er en funktion af blokstørrelsen ns og datatilspidsen, der bruges i vosa. For Hanning-konus er båndbredden cirka 1,94 / (ns-Kert). Krydsningerne i figur 8 (A) og 8 (b) er ret ens, hvilket indikerer, at de statistiske egenskaber for det postfarvede Pars-lagvindue og de spektrale estimater er sammenlignelige: faktisk er de faktiske skøn nøje enige, idet vosa-estimatet er lidt glattere i udseende.

Multitaper Spektral Estimatorer. En interessant altemativ til enten lag vindue eller vosa spektral estimering er Thomson ‘ s multitaper tilgang . Multitaper spektral estimering kan betragtes som en måde at producere en direkte spektral estimator med mere end blot to ækvivalente frihedsgrader (typiske værdier er 4 til 16). Som sådan er multitaper-metoden forskellig i ånd fra de to andre estimatorer, idet den ikke søger at producere stærkt glatte spektre. En stigning i frihedsgrader fra 2 til kun 10 er imidlertid nok til at formindske bredden af et 95% konfidensinterval for sdf med mere end en størrelsesorden og dermed reducere variabiliteten i det spektrale skøn til det punkt, hvor det menneskelige øje let kan skelne den samlede struktur. Detaljerede drøftelser om multitaper tilgang er givet i og kapitel 7 af . Her skitserer vi blot de vigtigste ideer.

Multitaper spektral estimering er baseret på brugen af et sæt K data tapers {ht.k; t=1,…, n}, hvor k spænder fra 0 til K-1. Vi antager, at disse tilspidsninger er orthonormale (dvs., list t=1nht,jht, k=1 hvis j=k og 0 hvis j list k). Den simpliest multitaper estimator er defineret af

S^H(mt)(f)=1K K=0K−1S^K,H(mt)(f)med s^k,h(mt)(f) HRT / HRT t=1nht, HRT-i2 HRT HRT|2

(Thomson går ind for adaptivt vægtning af S^k, H(mt) (f) snarere end blot at Gennemsnit dem sammen). En sammenligning af denne definition for S^k, K (mt) (LR) med Ek. (118) viser,at S^k, H (mt) (Krot) faktisk kun er en direkte spektral estimator, så multitaper estimatoren er kun et gennemsnit af direkte spektrale estimatorer, der anvender et ortonormalt sæt tilspidsninger. Under visse milde forhold oversættes ortonormaliteten af tilspidserne til frekvensdomænet som omtrentlig uafhængighed af hver enkelt person S^k, h(mt)(f); dvs.S^j.H(mt)(f). Tilnærmelsesvis uafhængighed indebærer igen,at 2KS^k, h(mt)(f)/S(f)=dh22k ca., således at de ækvivalente frihedsgrader for S^H(mt)(f) er lig med det dobbelte af antallet af anvendte datatapere.

det vigtigste trick er så at finde et sæt k ortonormale sekvenser, som hver især gør en properjob af aftagende. En tiltalende tilgang er at genoprette koncentrationsproblemet, der gav os DPSS-tilspidsningen for en fast opløsningsbåndbredde 2V hvis vi nu henviser til denne tilspidsning som nulordens DPSS-tilspidsning og betegner den med {h,, ()}, kan vi rekursivt konstruere de resterende K-1 “højere orden” dpss-tilspidsninger {ht, k} som følger. For k=1,…, K-1,Vi definerer KTH-order dpss tilspidsning som sæt af N numre {ht, k;t=1,…, n} sådan, at

1

{ht,k} er ortogonal til hver af k−sekvenserne {ht,()},…,{ht,(k-1)}dvs.Jht.k=0 for j=0,…, k-1);

2

{ht, k} er normaliseret således, at kur t=1nht, k2=1;

3

med forbehold af betingelser] og 2, det spektrale vindue Hk (ret) svarende til {ht.k} maksimerer koncentrationsforholdet

kr-kr (f)df / Kr-F (N) F (N) Hk (f)df=kr (n, v)

med ord, underlagt begrænsningen af at være ortogonal for alle dpss-tilspidsninger i lavere orden, er kth-ordens DPSS-tilspidsning “optimal” i begrænset forstand, at sideloberne i dets spektrale vindue undertrykkes så meget som muligt målt ved koncentrationsforholdet. Metoder til beregning af dpss-datafaserne diskuteres i kapitel 8.

i en række papirer har Slepian (og referencer deri) grundigt undersøgt arten af dpss. Et vigtigt faktum,han diskuterer,er, at koncentrationsforholdet lurt(n, v) falder strengt, når k stiger på en sådan måde, at lurt(n, V) er tæt på Enhed for k<2NV lurt, hvorefter det hurtigt nærmer sig 0 med stigende k (værdien 2NV lurt kaldes undertiden Shannon-nummeret). Da det skal være tæt på Enhed for {ht,k} for at være en anstændig datatap, er multitaper spektral estimering begrænset til brugen af højst-og i praksis normalt mindre end— 2n.

et eksempel på multitaper spektral estimering er vist i figur 9. Den venstre kolonne af plots viser KTH-order dpss-data tilspidses for n=4096, NV=4/K, og K spænder fra 0 (øverste plot) til K-1=5 (nederste plot). De tynde vandrette linjer i hvert af disse plot angiver nulniveauet, så mens nulordens DPSS er strengt positivt overalt (men ganske tæt på 0 nær t=1 og t=n), antager de højere ordens tilspidsninger både positive og negative værdier. Bemærk også, at nulordens tilspidsning kraftigt nedvægte værdier af tidsserierne tæt på t=1 og t=n, men at disse værdier successivt gives mere vægt af de højere ordens tilspidsninger (en fortolkning af multitapering er, at de højere ordens tilspidsninger genvinder information “tabt”, når der bruges en enkelt data tilspidsning). Den faste kurve i figur 9(b) viser et multitaper-spektral estimat S^H(mt) (LR) for trådbølgemåledataene baseret på disse 6 dpss-tilspidsninger, mens prikkerne viser de seks individuelle direkte spektrale estimater S^K. H(mt) (LR). Bemærk, at antallet af tilspidsninger, som vi har brugt, er under Shannon-tallet 2NV-kr=8, og at v, de tilsvarende frihedsgrader, er her 2k=12. Multitaper spektral estimat er meget choppier i udseende end enten lag vindue spektral estimat af figur 8(A) eller vosa estimat af figur 8(b), som begge har et markant højere antal ækvivalente frihedsgrader ( henholdsvis v=64 og v=59). Ikke desto mindre er variabiliteten i multitaper spektral estimatet lille nok, så øjet let kan registrere den samlede struktur (jf. Med de to spektrale estimater i figur 5), og fordi det ikke er meget glattet, gør multitaper estimatet markant bedre til at fange spektralstrukturen nær f=0.

Fig.9. Multitaper spektral estimering

16 hævder, at multitaper spektral estimator har statistiske egenskaber, der er bedre end vosa for SDF ‘ er med meget høje dynamiske intervaller (der kræves dog mere forskning for at verificere, at disse grænser oversættes til en faktisk fordel i praksis). I sammenligning med forhvidning er multitapering nyttig i situationer, hvor lækage er en concem, men det er ikke praktisk at omhyggeligt designe forhvidningsfiltre (dette forekommer for eksempel i efterforskningsgeofysik på grund af den enorme mængde tidsserier, der rutinemæssigt indsamles). Endelig bemærker vi, at Thomson og Chave [17 beskrive en tiltalende ordning, hvor multitapering bruges sammen med vosa.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.