Consistent Estimator
11.2.3 Variantievermindering
een vluchtig onderzoek van de spectrale schattingen voor de serie draadmeters in de figuren 5 en 6 toont een aanzienlijke variabiliteit tussen frequenties aan, zozeer zelfs dat het moeilijk is de algemene structuur van de spectrale schattingen te onderscheiden zonder een behoorlijke hoeveelheid onderzoek. Alle directe spectrale schatters lijden aan deze inherente choppiness, die kan worden verklaard door rekening te houden met de verdelingseigenschappen van S^X(d)(f). Ten eerste, als f niet te dicht bij 0 of f(N) en als SW(⋅) voldoet aan een milde regelmaat voorwaarde, dan 2S^w(d)(f)/Sw(f)=dx22; dat wil zeggen, de rv 2S^w(d)(f)/Sw(f) is ongeveer gelijk in verdeling aan een chi-kwadraat rv met 2 vrijheidsgraden. Indien geen tapering wordt toegepast, wordt f als “niet te dicht” bij 0 of f(N) beschouwd indien 1 / (n-p)Δt<f<f(N)-1 / (N-p)Δt; als tapering wordt gebruikt, moeten we 1/(n-p)Δt vervangen door een grotere term, die de grotere breedte van de centrale kwab van het spectrale venster weergeeft (bijvoorbeeld, de term voor de Hanning data taper is ongeveer 2/(N-p)Δt dus f is “niet te dichtbij” als 2/(N-p)Δt<f<f(N)-2/(N-p)Δt).
aangezien een chi-kwadraat rv xv2 met V vrijheidsgraden een variantie van 2u heeft, hebben we de benadering V=Sw2(f). Dit resultaat is onafhankelijk van het aantal gew.: in tegenstelling tot statistieken zoals het steekproefgemiddelde van onafhankelijke en identiek gedistribueerde Gaussiaanse rvs, neemt de variantie van S^W(d)(f) niet af tot 0 naarmate de steekproefgrootte n-p groter wordt (behalve in het oninteressante geval Sw(f)=0). Dit resultaat verklaart de onnauwkeurigheid van de directe spectrale schattingen in de figuren 5 en 6. In statistische terminologie is S^W (d) (f) een inconsistente schatter van Sw(f).
we schetsen nu drie benaderingen voor het verkrijgen van een consistente schatter van Sw(f). Elke benadering is gebaseerd op het combineren van RV ‘ s die, onder geschikte aannames, kunnen worden beschouwd als ongeveer paarsgewijs ongecorreleerde schatters van SW(f). In het kort zijn de drie benaderingen
1
glad S^W(d)(f) over frequenties, wat een zogenaamde lag window spectral estimator oplevert;
2
{Xt} (of {Wt}) in een aantal segmenten (waarvan sommige elkaar kunnen overlappen), een directe spectrale schatting voor elk segment berekent en deze schattingen vervolgens samen gemiddeld, wat Welch ‘ s overlapped segmentaveraging (WOSA) spectrale estimator oplevert.;
3
Bereken een reeks directe spectrale schattingen voor {Wt} met behulp van een set orthogonale data tapers en gemiddelde deze schattingen samen, wat resulteert in Thomson ‘ s multitaper spectrale estimator.
Lag Window spectral Estimators een lag window spectral estimator van Sw(⋅) heeft de vorm
waar Wm (⋅) een gladmakend venster is waarvan de gladmakende eigenschappen worden gecontroleerd door de gladmakende parameter m. In woorden, de schatter S^W(LW)(⋅) wordt verkregen door het convolveren van een gladmakend venster met de directe spectrale schatter s^w(d)(⋅). Een typisch gladmakend venster heeft ongeveer hetzelfde uiterlijk als een spectraal venster. Er is een centrale kwab met een breedte die kan worden aangepast door de smoothing parameter m: hoe breder deze centrale kwab is, hoe gladder S^W(W)(⋅) zal zijn. Er kan ook een reeks vervelende zijlobes zijn die gladde raamlekkage veroorzaken. De aanwezigheid van gladde ruit lekkage wordt gemakkelijk gedetecteerd door overlappende plots van S^W(LW)(⋅) en S^W(d)(⋅) en op zoek naar frequentiebereiken waar de eerste niet lijkt te zijn een gladgestreken versie van de laatste.
als we gebruik hebben gemaakt van een AR prewhitening filter, kunnen we dan postcolor S^W(lw)(⋅) om een schatter van Sx (⋅) te verkrijgen, namelijk
de statistische eigenschappen van S^W (lw) (.) zijn tractable vanwege de volgende grote steekproef resultaat. Als S^W (D) (⋅) in feite het parodiogram is(dat wil zeggen, we hebben de waarden van Wt niet afgebouwd), zijn de verzameling rvs S^W(d) (j/(N−p) Δt), j=1,2,…,j,, ongeveer paarsgewijs niet gecorreleerd, waarbij elke rv evenredig is met een χ22, rv(hier is J het grootste gehele getal zodanig dat J/(n-p)<1/2). Als we tapering hebben gebruikt om Sw(d) (⋅) te vormen, is een vergelijkbare uitspraak waar over een kleinere set rvs gedefinieerd op een grover raster van gelijke frequenties—naarmate de mate van tapering toeneemt, neemt het aantal ongeveer ongecorreleerde rvs af. Onder de aannames dat de sdf Sw (⋅) langzaam varieert over de frequenties (prewhitening helpt dit waar te maken) en dat de centrale kwab van het afvlakvenster voldoende klein is in vergelijking met de variaties in Sw (⋅), volgt hieruit dat S^W(d) (f) in Eq. (11.15) kan worden benaderd door een lineaire combinatie van niet-gecorreleerde χ22 rvs. Een standaard” equivalente vrijheidsgraden ” argument kan dan worden gebruikt om de verdeling van S^W(lw)(f) te benaderen. (zie Eq. (11.17) later).
er zijn twee praktische manieren om S^W(LW) (⋅) te berekenen. De eerste manier is om EQ discreet te maken. (11.15), wat een schatter oplevert die evenredig is met een convolutie van de vorm ΣkWm(f−fk’) SW(d) (fk’), waarbij de waarden offk’ een verzameling van gelijk verdeelde frequenties zijn. De tweede manier is om te herinneren dat “convolutie in een Fourier domein is gelijk aan vermenigvuldiging in de andere” om EQ te herschrijven. (11.15) als
waarbij c^τ.W (d), is de acvs estimator gegeven in Eq. (11.9) overeenkomend met S^W (d) (.), en {wt.m} is een vertragingsvenster (dit kan worden beschouwd als de inverse fouriertransformatie van het smoothing window Wm (⋅)). In feite, omdat S^W (d) (.) is een trigonometrische veelterm, alle discrete convoluties van de vorm ΣkWm(f−fk’)S^W(d) (fk’) kunnen ook worden berekend via Eq. (11.16) met een passende keuze van wt,m-waarden (voor details, zie punt 6.7). Onze twee praktische manieren om S^W(l,w)(.) dus opbrengst gelijkwaardige schatters. Tenzij de discrete convolutie voldoende kort is, Eq. (11.16) is rekenkundig sneller te gebruiken.
statistische theorie suggereert dat,onder redelijke veronderstellingen
bij een goede benadering, waarbij v de equivalente vrijheidsgraden voor S^W(lw)(f) wordt genoemd en wordt gegeven door v=2(n−p)BwΔt/Ch. Hier is Bw een maat voor de bandbreedte van het gladmakende venster Wm (⋅) A) n d kan worden berekend via BW = 1 / Δt T T=-(n−p−1)n−p−1WT, m2;;aan de andere kant hangt Ch alleen af van de taper toegepast op de waarden van Wtand kan worden berekend via Ch=(n−p)∑1=p+1nht4Note dat,als we niet expliciet taper, dan ht=1/n−pand dus Ch>1; Voor een typische data taper, de Cauchy ongelijkheid vertelt ons dat Ch>1(bijvoorbeeld Ch≈1,94 voor de Hanning data taper). De equivalente vrijheidsgraden voor S^W(lw)(f)nemen dus toe naarmate we de bandbreedte van het gladde venster verhogen en nemen af naarmate we de mate van tapering verhogen. Vergelijking (11.17) vertelt ons dat E≈SW (f) en dat V≈SW2 (f)/v, dus het verhogen van v vermindert V.
de benadering in Eq. (11.17)kan worden gebruikt om een betrouwbaarheidsinterval voor SW(f) op de volgende manier te construeren.Laat nv (α) De α×100% procentpunt van de xv2distributie aangeven,d.w.z. P=α.A100 (1−2α)% betrouwbaarheidsinterval voor Sw (f) wordt ongeveer gegeven door
de procentpunten ην (α) worden in talrijke handboeken in tabelvorm weergegeven of kunnen worden berekend met behulp van een algoritme van Best en Roberts
het betrouwbaarheidsinterval van (11.18) is onhandig omdat de lengte evenredig is met S^W(lw) (f). Aan de andere kant, het overeenkomstige betrouwbaarheidsinterval voor 10.log10 (Sw (f)) (d.w.z., SW (f) op een decibel schaal) is gewoon
die een breedte heeft die onafhankelijk is van S^W (lw) (.). Dit is de reden voor het plotten van SDF-schattingen op een decibel (of logaritmische) schaal.
in de literatuur is een verbijsterend aantal verschillende lag-vensters besproken (zie ). Hier geven we slechts één voorbeeld, het bekende Parzen fag venster (Parzen ):
waarbij m wordt beschouwd als een positief geheel getal en τ=τ/m. Dit vertragingsvenster is gemakkelijk te berekenen en heeft zijobenen waarvan de envelop vervalt als f-4, zodat het gladstrijken van raamlekkage zelden een probleem is. Om een goede benadering, de gladmakende venster bandbreedte voor de Parzen lag venster wordt gegeven door Bw = 1.85 / (mΔt). Naarmate m toeneemt, neemt de bandbreedte van het gladde venster af en wordt de resulterende lag window estimator minder glad in uiterlijk. De bijbehorende equivalente vrijheidsgraden worden ongeveer gegeven door v = 3,71(n-p)/(mCh). Het Parzen lag-venster voor m=32 en het bijbehorende gladmakende venster zijn weergegeven in Figuur 7.
als voorbeeld, Figuur 8(a) toont een postcolored lag window estimator voor de draad Golf gauge data (de vaste curve), samen met de overeenkomstige postcolored direct spectral estimator (de punten, deze tonen dezelfde schatting als weergegeven in Figuur 6(b)). Het Parzen lag venster werd hier gebruikt met een waarde van m = 237 voor de smoothing window parameter (de overeenkomstige equivalente vrijheidsgraden v is 64). Deze waarde werd na enige experimenten gekozen en lijkt een lag window estimator te produceren die alle belangrijke spectrale kenmerken registreert die door de directe spectrale estimator voor frequenties tussen 0,4 en 4,0 Hz worden aangegeven (merk echter op dat deze estimator de piek tussen 0,0 en 0,4 Hz nogal slecht uitstrijkt). We hebben ook een kriskras uitgezet waarvan de verticale hoogte de lengte vertegenwoordigt van een 95% betrouwbaarheidsinterval voor 10 log log10 (SX (f)) (gebaseerd op de postcolored lag window estimator) en waarvan de horizontale breedte de afvlakkende vensterbandbreedte BW vertegenwoordigt
WOSA spectrale schatters. Laten we nu eens kijken naar de tweede gemeenschappelijke benadering van variantie reductie, namelijk, overlappende segment middeling Welch ‘ s (Welch ; Carter en verwijzingen daarin). Het basisidee is om een tijdreeks in een aantal blokken (d.w.z., segmenten), berekenen een directe spectrale schatting voor elk blok, en vervolgens produceren de WOSA spectrale schatting door middel van deze spectrale schattingen samen. In het algemeen mogen de blokken overlappen, waarbij de mate van overlapping wordt bepaald door de mate van tapering—hoe zwaarder de mate van tapering, hoe meer de blokken moeten worden overlapt (Thomson ). Dus, behalve aan het begin en het einde van de tijdreeks, data waarden die sterk taps in een blok zijn licht taps in een ander blok, dus intuïtief zijn we heroveren “informatie” verloren als gevolg van taps in een blok van blokken overlappende het. Omdat het kan worden geïmplementeerd op een computationeel efficiënte manier (met behulp van de fast Fourier transform algoritme) en omdat het kan omgaan met zeer lange tijdreeksen (of tijdreeksen met een tijd variërende spectmm), de WOSA schatting schema is de basis voor veel van de commerciële spectrum analyzers op de markt.
om de wosa spectrale schatter te definiëren, laat ns een blokgrootte vertegenwoordigen, en laat h1,…, hns een data taper. We definiëren de directe spectrale schatter Sx(f) voor het blokkeren van ns aaneengesloten data waarden vanaf index l
(er is geen reden waarom we geen gebruik maken van een prewhitened serie {Wt} liever hier dan Xt, maar prewhitening wordt zelden gebruikt in combinatie met WOSA, misschien omdat het blok overlappende wordt beschouwd als een efficiënte manier van compensatie voor de graden van vrijheid verloren door afbouwen). De wosa spectrale schatter van SX (f) is gedefinieerd als
waarbij nn het totale aantal blokken is en s een gehele verschuivingsfactor is die voldoet aan 0<s≤ns en s(nB-1)=n-ns (merk op dat het blok voor j = 0 gegevenswaarden χ1 gebruikt…,XNS, terwijl het blok voor j = nB-1 gebruikt Xn-ns+1,…, Xe).
de grote statistische steekproefeigenschappen van S^X (wosa) (f) lijken sterk op die van lag window schatters. in het bijzonder hebben we de benadering dat VS^X (wosa) (f) / Sx(f) = dXv2, waar de equivalente vrijheidsgraden v worden gegeven door
(hier ht = 0 per definitie voor alle t>ns). Als we ons specialiseren in het geval van 50% block overlap (d.w.z. s=ns/2) met een Hanning data taper(een veel voorkomende aanbeveling in de technische literatuur), kan dit worden benaderd met de eenvoudige formule v≈36nB21 (19nB-1). Dus, als het aantal blokken nB toeneemt, nemen de equivalente vrijheidsgraden ook toe, wat een spectrale schatter met verminderde variantie oplevert. Tenzij SX (⋅) een relatief karakterloze sdf heeft, kunnen we nB echter niet willekeurig klein maken zonder ernstige vooringenomenheid in de individuele directe spectrale schatters, voornamelijk als gevolg van verlies van resolutie. (Voor details over de bovenstaande resultaten, Zie punt 6.17.)
Figuur 8 (b) toont een WOSA spectrale schatter voor de gegevens van de draadgolfmeter (de vaste curve). Deze serie heeft n = 4096 gegevenswaarden. Sommige experimenten gaven aan dat een blokgrootte van ns=256 en de Hanning data taper redelijke keuzes zijn voor het schatten van de sdf tussen 0,4 en 4,0 Hz met behulp van WOSA. Bij een 50% blokoverlapping is de verschuivingsfactor s = ns / 2 = 128; het totale aantal blokken is nB = 1_δ (n−ns)+1=31; en v, de equivalente vrijheidsgraden, is ongeveer 59. De 31 individuele directe spectrale schattingen die samen werden gemiddeld om de WOSA schatting te vormen worden weergegeven als de punten in Figuur 8 (b).
we hebben ook een” bandbreedte/betrouwbaarheidsinterval “uitgezet die vergelijkbaar is met die op Figuur 8(a), maar nu is de” bandbreedte ” (d.w.z. de horizontale breedte) de afstand in frequentie tussen ongeveer ongecorreleerde spectrale schattingen. Th is de maat van de bandbreedte is een functie van de blokgrootte ns en de data taper gebruikt in WOSA. Voor de Hanning taper is de Bandbreedte ongeveer 1,94/(nsΔt). De kriskras in Figuur 8 (A) en 8 (b) zijn vrij gelijkaardig, wat erop wijst dat de statistische eigenschappen van de postcolored Parzen lag window en WOSA spectrale schattingen vergelijkbaar zijn: de werkelijke ramingen zijn het inderdaad met elkaar eens, waarbij de WOSA-raming iets soepeler lijkt.
Multitaper Spectrale Schatters. Een interessant alternatief voor ofwel lag window of WOSA spectrale schatting is de multitaper benadering van Thomson . Multitaper spectrale schatting kan worden beschouwd als een manier om een directe spectrale schatter te produceren met meer dan slechts twee gelijkwaardige vrijheidsgraden (typische waarden zijn 4 tot 16). Als zodanig is de multitaper-methode in geest verschillend van de andere twee schatters in die zin dat het niet streeft naar sterk gladgestreken spectra te produceren. Een verhoging van de vrijheidsgraden van 2 tot slechts 10 is echter voldoende om de breedte van een 95% betrouwbaarheidsinterval voor het sdf met meer dan een orde van grootte te verkleinen en aldus de variabiliteit in de spectrale schatting te verminderen tot het punt waarop het menselijk oog gemakkelijk de totale structuur kan discem. Gedetailleerde besprekingen over de multitaper-aanpak worden gegeven in en hoofdstuk 7 van . Hier schetsen we slechts de belangrijkste ideeën.
multitaper spectrale schatting is gebaseerd op het gebruik van een set k data tapers {ht.k; t = 1,…, n}, waarbij k varieert van 0 tot K-1. We gaan ervan uit dat deze tapers orthonormaal zijn (d.w.z. ∑t=1nht, jht,k=1 als j=k en 0 als j≠k). De simplifest multitaper estimator wordt gedefinieerd door
(Thomson pleit voor een adaptieve weging van de S^k, X (mt) (f) in plaats van ze gewoon samen te gemiddelden). Een vergelijking van deze definitie voor s^k, X (mt) (⋅) met Eq. (118) toont aan dat s^k,X(mt) (⋅) in feite slechts een directe spectrale schatter is, dus de multitaper schatter is slechts een gemiddelde van directe spectrale schatters die gebruik maken van een orthonormale set van tapers. Onder bepaalde milde omstandigheden vertaalt de orthonormaliteit van de tapers zich in het frequentiedomein Als geschatte onafhankelijkheid van elk individu s^k,X(mt)(f); d.w.z., S^j.X(mt)(f). De geschatte onafhankelijkheid impliceert op zijn beurt dat 2ks^k,X(mt)(f)/SX(f)=dx22k ongeveer, zodat de equivalente vrijheidsgraden voor S^X(mt)(f) gelijk is aan tweemaal het aantal gebruikte data tapers.
de belangrijkste truc is dan om een set van K orthonormale sequenties te vinden, die elk een goede functie van taps toelopende. Een aantrekkelijke benadering is om terug te komen op het concentratieprobleem dat ons de DPSS taper gaf voor een vaste resolutie bandbreedte 2W als we nu verwijzen naar deze taper als de nulde-orde DPSS taper en het aanduiden door {h,,()}, kunnen we recursief de resterende K-1 “hogere orde” DPSS tapers {ht,k} als volgt construeren. Voor k = 1,…, K-1, definiëren we de KTH-orde DPSS taper als de verzameling van n getallen {ht,k;t=1,…, n} zodanig dat
1
{ht, k} orthogonaal is aan elk van de k-sequenties {ht, ()},…, {ht,(k−1)} d.w.z., ∑t=11ht.Jht.k = 0 voor j = 0,…, k-1);
2
{ht, k} is genormaliseerd zodanig dat ∑t=1nht, k2=1;
3
onder voorwaarden] en 2, het spectrale venster Hk(⋅) overeenkomend met {ht.K} maximaliseert de concentratieverhouding
met andere woorden, onder voorbehoud van de beperking van orthogonaal te zijn voor alle lagere orde DPSS tapers, is de kth-orde dpss taper “optimaal” in de beperkte zin dat de zijkanten van zijn spectrale venster zoveel mogelijk worden onderdrukt zoals gemeten door de concentratieverhouding. Methoden voor het berekenen van de DPSS data tapers worden besproken in , hoofdstuk 8.
in een reeks papers heeft Slepian (en verwijzingen daarin) de aard van dpss uitgebreid bestudeerd. Een belangrijk feit dat hij bespreekt is dat de concentratieverhouding λk(n,W) strikt afneemt naarmate K zodanig toeneemt dat λk(n,W) dicht bij eenheid ligt voor k<2nW Δt, waarna het snel 0 nadert met toenemende k (de waarde 2nWΔt wordt soms het Shannon-getal genoemd). Aangezien λk (n,W) dicht bij de eenheid moet liggen om {ht,k} een behoorlijke dataafname te kunnen zijn, is multitaper spectrale schatting beperkt tot het gebruik van maximaal-en in de praktijk meestal minder dan— 2nWΔt orthonormale DPSS-tapers.
een voorbeeld van spectrale multitaperschatting is weergegeven in Figuur 9. De linkerkolom van de percelen toont de K-de-orde dpss-gegevens taps toelopend voor n = 4096, nW=4 / Δt, en k variërend van 0 (bovenste plot) tot K-1=5 (onderste plot). De dunne horizontale lijnen in elk van deze plots geven het nulniveau aan, dus, terwijl de nulde-orde dpss overal strikt positief is (maar vrij dicht bij 0 in de buurt van t=1 en t=n), nemen de hogere orde tapers zowel positieve als negatieve waarden aan. Merk ook op dat de nulth-order taper zwaar downweights waarden van de tijdreeks dicht bij t=1 en t=n, maar dat deze waarden achtereenvolgens meer gewicht worden gegeven door de hogere orde tapers (een interpretatie van multitapering is dat de hogere orde tapers zijn het heroveren van informatie “verloren” wanneer maar een enkele data taper wordt gebruikt). De vaste kromme in Figuur 9(b) toont een multitaper spectrale schatting S^X(mt)(⋅) voor de gegevens van de draadgolfmeter op basis van deze 6 DPSS taps, terwijl de punten de zes individuele directe spectrale schattingen S^K. X(mt) (⋅) tonen. Merk op dat het aantal tapers dat we hebben gebruikt lager is dan het Shannon-nummer 2nWΔt=8 en dat v, de equivalente vrijheidsgraden, hier 2K=12 is. De spectrale schatting van multitaper is veel scherper dan de spectrale schatting van het lagvenster van Figuur 8 (a) of de WOSA-schatting van Figuur 8(b), die beide een aanzienlijk hoger aantal equivalente vrijheidsgraden hebben ( respectievelijk v=64 en v=59). Niettemin is de variabiliteit in de spectrale schatting van multitapers klein genoeg, zodat het oog de algemene structuur gemakkelijk kan detecteren (cf. S^X (mt) (⋅) met de twee spectrale schattingen in Figuur 5), en omdat het niet erg glad is, doet de multitaper schatting aanzienlijk beter in het vastleggen van de spectrale structuur in de buurt van f=0.
op basis van prestatiegrenzen stelt Bronez [16 dat de multitaper spectral estimator statistische eigenschappen heeft die superieur zijn aan WOSA voor sdfs met zeer hoge dynamische bereiken (meer onderzoek is echter vereist om te controleren of deze grenzen zich in de praktijk vertalen in een daadwerkelijk voordeel). In vergelijking met prewhitening, multitapering is nuttig in situaties waar lekkage is een concem, maar het is niet praktisch om zorgvuldig te ontwerpen prewhitening filters (dit gebeurt in, bijvoorbeeld, exploratie geofysica als gevolg van de enorme hoeveelheid tijdreeksen routinematig verzameld). Tot slot merken we op dat Thomson en Chave [17 een aantrekkelijk schema beschrijven waarin multitapering wordt gebruikt in combinatie met WOSA.