konsekvent Estimator

11.2.3 Variansreduktion

en kortfattad undersökning av de spektrala uppskattningar för tråd gauge serien i figurerna 5 och 6 avslöjar betydande variabilitet över frekvenser, så mycket så att det är svårt att urskilja den övergripande strukturen i spektrala uppskattningar utan en hel del studier. Alla direkta spektrala estimatorer lider av denna inneboende choppiness, vilket kan förklaras genom att överväga fördelningsegenskaperna hos S^X(d)(f). För det första, om f inte är för nära 0 eller f(n) och om sw (GHz) uppfyller ett milt regularitetsförhållande, då 2S^w(D)(f)/Sw(f)=dx22; dvs rv 2s^w(d)(f)/Sw(f) är ungefär lika i fördelning till en chi-kvadrat rv med 2 frihetsgrader. Om avsmalnande inte används, f anses vara “inte för nära” till 0 eller f (N) om 1 / (n-p)okt <f<f (N) -1 / (n-p)okt; om avsmalnande används, måste vi ersätta 1/(n-p)avsmalnande med en större term, vilket återspeglar den ökade bredden av den centrala loben av det spektrala fönstret(till exempel termen för Hanning data avsmalning är ungefär 2/(n-p)avsmalnande så f är “inte för nära” om 2/(n-p)avsmalnande<f<f(N)-2 / (n-p)avsmalnande).

eftersom en chi-kvadrat rv xv2 med v frihetsgrader har en varians på 2U, har vi approximationen V=Sw2(f). Detta resultat är oberoende av antalet Wt, vi har: till skillnad från statistik som provmedelvärdet för oberoende och identiskt distribuerade gaussiska husvagnar minskar variansen för S^W(d)(f) inte till 0 eftersom provstorleken n-p blir större (utom i det ointressanta fallet Sw(f)=0). Detta resultat förklarar hackigheten hos de direkta spektrala uppskattningarna som visas i figurerna 5 och 6. I statistisk terminologi är S^W(d) (f) en inkonsekvent estimator av Sw (f).

vi skisserar nu tre metoder för att få en konsekvent uppskattning av Sw(f). Varje tillvägagångssätt bygger på att kombinera husvagnar som, under lämpliga antaganden, kan betraktas som ungefär parvis okorrelerade uppskattningar av SW(f). Kortfattat är de tre tillvägagångssätten att

1

släta S^W(d)(f) över frekvenser, vilket ger det som kallas en fördröjningsfönster spektral estimator;

2

{Xt} (eller {Wt}) i ett antal segment (varav några kan överlappa), beräkna en direkt spektral uppskattning för varje segment och sedan genomsnittliga dessa uppskattningar tillsammans, vilket ger Welchs överlappade segmentaveraging (WOSA) spektral estimator;

3

beräkna en serie direkta spektrala uppskattningar för {Wt} med hjälp av en uppsättning ortogonala data smalnar och sedan genomsnittliga dessa uppskattningar tillsammans, vilket ger Thomsons multitaper spektral estimator.

eftersläpning fönster spektrala estimatorer en eftersläpning fönster spektral estimator av Sw (kubi) har formen

(11.15)S^W (lw) (f)=bisexuell-f (N) f(N)Wm (f−F’)S^W (d) (f’) df’

där WM (Xiaomi) är ett utjämningsfönster vars utjämningsegenskaper styrs av utjämningsparametern m. I ord erhålls estimatorn S^W(lw) (xhamster) genom att sammankoppla ett utjämningsfönster med den direkta spektrala estimatorn s^w(d) (xhamster). Ett typiskt utjämningsfönster har ungefär samma utseende som ett spektralfönster. Det finns encentral lob med en bredd som kan justeras med utjämningsparametern m: ju bredare denna centrala lob är, desto mjukare S^W(w) (xhamster) kommer att vara. Det kan också finnas en uppsättning irriterande sidelobes som orsakar utjämning av fönsterläckage. Förekomsten av utjämningsfönsterläckage detekteras lätt genom att överlagra tomter av S^W(lw) (GHz) och S^W(d) (IE) och letar efter frekvensområden där den förra inte verkar vara en jämn version av den senare.

Om vi har gjort användningen av en AR-prewhitening filter, kan vi då postcolor S^W(lw)(⋅) för att erhålla en estimator av Sx(⋅), nämligen

SX(pc)(f)=S^W(tw)(f)|1−∑k=1pϕke−i2πfkΔt|2

De statistiska egenskaperna hos S^W(lw)(.) är tractable på grund av följande stora provresultat. Om S^W (D) (GHz) i själva verket är periodogrammet(dvs. vi har inte avsmalnat värdena för Wt), är uppsättningen rvs S^W(d) (j/(n−p) RV), j=1,2,…, j,, ungefär parvis okorrelerade, där varje rv är proportionell mot en rv22, rv(här är J det största heltalet så att J/(n-p)<1/2). Om vi har använt avsmalnande för att bilda Sw(d) (xhamster), är ett liknande uttalande sant över en mindre uppsättning husvagnar definierade på ett grovare rutnät med lika åtskilda frekvenser—när graden av avsmalnande ökar minskar antalet ungefär okorrelerade husvagnar. Under antagandena att SDF Sw (GHz) långsamt varierar mellan frekvenser (förvitning bidrar till att göra detta sant) och att utjämningsfönstrets centrala lob är tillräckligt liten jämfört med variationerna i Sw(ie), följer det att S^W(d) (f) i Eq. (11.15)kan approximeras med en linjär kombination av okorrelerade husbilar i 22 år. Ett standardargument” ekvivalenta frihetsgrader ” kan sedan användas för att approximera fördelningen av S^W(lw)(f). (se Eq. (11.17) senare).

det finns två praktiska sätt att beräkna S^W (LW) (xhamster). Det första sättet är att diskretisera Eq. (11.15), vilket ger en estimator som är proportionell mot en faltning av formen Exporkwm(f−fk’) SW(d) (fk’), där värdena offk’ är någon uppsättning lika fördelade frekvenser. Det andra sättet är att komma ihåg att “faltning i en Fourier-domän motsvarar multiplikation i den andra” för att skriva om Eq. (11.15)som

(11.16) S^W(lw) (f)=0=−(n−p−1) n−p−1WT,mc^0.w (e) e−l2n/kg

där C^kg.W (d), är acvs-uppskattaren som anges i Eq. (11.9) motsvarande S^W (d) (.), och {wt.m} är ett fördröjningsfönster (detta kan betraktas som den inversa Fouriertransformen av utjämningsfönstret Wm (POV)). Faktum är att S^W(d)(.(f−fk’)S^W(d) (fk’) kan också beräknas via Eq. (11.16) med ett lämpligt val av wt,m-värden (för detaljer, se avsnitt 6.7). Våra två praktiska sätt att beräkna S^W (l,w) (.) ger således ekvivalenta estimatorer. Om inte den diskreta faltningen är tillräckligt kort, Eq. (11.16) är beräkningsmässigt snabbare att använda.

Statistisk teori antyder att under rimliga antaganden

(11.17)vS^W (lw) (f) Sw (f)=dxv2

till en god approximation, där v kallas motsvarande frihetsgrader för S^W (lw) (f) och ges av v = 2 (n−p)BW . Här är Bw ett mått på bandbredden för utjämningsfönstret Wm (POV) a) n d kan beräknas via BW=1 / Wow t=−(n−p−1) # n-p-1WT, m2;;å andra sidan beror Ch bara på den avsmalning som tillämpas på värdena på Wtoch kan beräknas via Ch=(n−p) 1=p+1nht4notera att om vi inte uttryckligen avsmalnar,då ht=1/n−pand därmed Ch>1; för en typisk dataavsmalning berättar Cauchy-ojämlikheten att Ch>1(till exempel ch 1.94 för Hanning-dataavsmalningen). Motsvarande frihetsgrader för S^W(lw)(f)ökar således när vi ökar utjämningsfönstrets bandbredd och minskar när vi ökar graden av avsmalnande. Ekvation (11.17) berättar för oss att e 0 SW(F) och att v 2 SW(F)/V,vilket ökar v minskar V.

approximationen i ekv. (11.17)kan användas för att konstruera ett konfidensintervall för SW(f) på följande sätt.Låt NV (GHz)beteckna 100% procentenhet av xv2distributionen, dvs. p=IE.A100 (1-2 kg)% konfidensintervall för Sw(f) ges ungefär av

(11.18)

procentenheterna i tabellen i flera läroböcker eller kan beräknas med hjälp av en algoritm som ges av Best och Roberts

konfidensintervallet för(11.18) är obekvämt eftersom dess längd är proportionell mot S^W (LW) (f). Å andra sidan motsvarande konfidensintervall för 10.log10 (Sw (f)) (dvs SW (f) på en decibelskala) är bara

som har en bredd som är oberoende av S^W (lw) (.). Detta är motiveringen för att plotta SDF-uppskattningar på en decibel (eller logaritmisk) skala.

ett förvirrande antal olika lag-fönster har diskuterats i litteraturen (se ). Här ger vi bara ett exempel, det välkända parzen fag-fönstret (Parzen ):

wt.m=1-6τ∼2+6|τ∼|3,|τ|≤m/22(1-τ∼)3,m/2<|τ|≤m0,|τ|>m

där m är tagna för att vara ett positivt heltal och τ=τ/m. Denna lag fönstret är lätt att beräkna och har sidelobes vars kuvert sönderfall som f-4 så att utjämning fönster läckage är sällan ett problem. Till en bra approximation ges utjämningsfönstrets bandbredd för parzen lag-fönstret av Bw=1.85/(m oskit). När m ökar minskar utjämningsfönstrets bandbredd och den resulterande fördröjningsfönsteruppskattaren blir mindre jämn i utseende. De associerade ekvivalenta frihetsgraderna ges ungefär av v = 3,71(n-p)/(mCh). Parzen lag-fönstret för m = 32 och dess tillhörande utjämningsfönster visas i Figur 7.

Fig.7. Parzen lag fönster (A) och motsvarande utjämning fönster (b) för m = 32. Utjämningsfönstret bandbredd isBw = 0.058.

som ett exempel, figur 8 (A) visar en postcolored lag fönster estimator för wire wave gauge data (den fasta kurvan), tillsammans med motsvarande postcolored direct spectral estimator(punkterna, dessa visar samma uppskattning som visas i Figur 6 (b)). Parzen lag-fönstret användes här med ett värde på m=237 för utjämningsfönsterparametern (motsvarande ekvivalenta frihetsgrader v är 64). Detta värde valdes efter några experiment och verkar producera en fördröjningsfönsteruppskattare som fångar alla viktiga spektralfunktioner som indikeras av den direkta spektrala uppskattaren för frekvenser mellan 0,4 och 4,0 Hz (Observera dock att denna uppskattare smutsar ut toppen mellan 0,0 och 0,4 Hz ganska dåligt). Vi har också plottat en kors och tvärs vars vertikala höjd representerar längden på ett 95% konfidensintervall för 10 msk log10 (SX (f)) (baserat på postcolored lag window estimator) och vars horisontella bredd representerar utjämningsfönstret bandbredd BW

Fig.8. Postcolored Parzen lag fönster spektral uppskattning-fast kurva på tomten (en)—och WOSA spektral uppskattning-fast kurva på (b)—för trådvågmätare tidsserier. Utjämningsfönsterparametern för parzen lag-fönstret var m = 237, vilket gav v = 64 ekvivalenta frihetsgrader. WOSA – spektraluppskattningen bildades med hjälp av en Hanning-dataavsmalning på block med 256 datapunkter, med intilliggande block överlappande med 50%. Motsvarande frihetsgrader för denna uppskattning är v = 59.

WOSA spektral estimatorer. Låt oss nu överväga det andra gemensamma tillvägagångssättet för variansreduktion, nämligen Welchs överlappade segment i genomsnitt (Welch ; Carter och referenser däri). Grundtanken är att bryta en tidsserie i ett antal block (dvs., segment), beräkna en direkt spektral uppskattning för varje block, och sedan producera WOSA spektral uppskattning genom att i genomsnitt dessa spektrala uppskattningar tillsammans. I allmänhet får blocken överlappa varandra, med graden av överlappning bestämd av graden av avsmalnande—ju tyngre graden av avsmalnande, desto mer bör blocken överlappas (Thomson ). Således, förutom i början och slutet av tidsserien, är datavärden som är kraftigt avsmalnande i ett block lätt avsmalnande i ett annat block, så intuitivt återtar vi “information” förlorad på grund av avsmalnande i ett block från block som överlappar det. Eftersom det kan implementeras på ett beräkningseffektivt sätt (med hjälp av Fast Fourier transform-algoritmen) och eftersom det kan hantera mycket långa tidsserier (eller tidsserier med en tidsvarierande spektmm) är WOSA-uppskattningssystemet grunden för många av de kommersiella spektrumanalysatorerna på marknaden.

för att definiera WOSA spektral estimator, låt ns representerar en blockstorlek, och låt h1,…, hns vara en data Kona. Vi definierar den direkta spektrala estimatorn för Sx (f) för blocket av NS sammanhängande datavärden som börjar vid index l som

S^l, X (d) (f)=Accuit|accuit t=1nshtxt−l-1E-l2n / accuit / 2,1 accuit l accuit n+1−ns

(det finns ingen anledning till att vi inte kan använda en förvit serie {Wt} här snarare än Xt, men förvitning används sällan i samband med WOSA, kanske för att blocköverlappning betraktas som ett effektivt sätt att kompensera för de frihetsgrader som förlorats på grund av avsmalnande). WOSA spektral estimator av SX (f) definieras som

(11.19) S^X (wosa) (f)=1NB 2b = 0NB-1s^js + t. x (d) (f)

där nn är det totala antalet block och s är ett heltal shift faktor som uppfyller 0< s bisexuell ns och s(nB-1)=n-ns (Observera att blocket för j=0 använder datavärden jacob1,…, Xns, medan blocket för j=nB-1använder Xn-ns + 1,…, Xe).

de stora provstatistiska egenskaperna hos S^X(wosa) (f) liknar nära de för lag-fönsterberäkare. i synnerhet har vi approximationen att VS^X (wosa) (f)/Sx (f)=dXv2,, där ekvivalenta frihetsgrader v ges av

v=2nb1 + 2 msk m=1NB−1 (1-mna)|msk t=1nshlht+ms|2

(här ht = 0 per definition för alla t> ns). Om vi är specialiserade på fallet med 50% blocköverlappning (dvs. s=ns/2) med en Hanning-dataavsmalning(en vanlig rekommendation i ingenjörslitteraturen), kan detta approximeras med den enkla formeln V 36nb21 (19nb-1). Således, när antalet block nB ökar, ökar motsvarande frihetsgrader också, vilket ger en spektral estimator med reducerad varians. Om inte SX (Xiaomi) har en relativt formlös sdf, kan vi dock inte göra nB godtyckligt liten utan att drabbas av allvarlig bias i de enskilda direkta spektrala uppskattarna, främst på grund av förlust av upplösning. (För mer information om ovanstående resultat, se avsnitt 6.17.)

figur 8 (b) visar en WOSA spektral estimator för wire wave gauge data (den fasta kurvan). Denna serie har n = 4096 datavärden. Vissa experiment indikerade att en blockstorlek på ns=256 och Hanning-dataavsmalningen är rimliga val för att uppskatta sdf mellan 0,4 och 4,0 Hz med WOSA. Med en överlappning på 50% av blocket är skiftfaktorn s=ns / 2=128; det totala antalet block är nB=1_ IC(N−NS)+1=31; och v, motsvarande frihetsgrader, är ungefär 59. De 31 individuella direkta spektrala uppskattningarna som var i genomsnitt tillsammans för att bilda WOSA-uppskattningen visas som punkterna i Figur 8(b).

vi har också plottat ett” bandbredd/konfidensintervall “kors och tvärs som liknar det på Figur 8(A), men nu är” bandbredden ” (dvs. den horisontella bredden) avståndet i frekvens mellan ungefär okorrelerade spektrala uppskattningar. Th är mått på bandbredd är en funktion av blockstorleken ns och data Kona används i WOSA. För Hanning-avsmalningen är bandbredden ungefär 1,94 / (ns uscrt). Korsningarna i figurerna 8 (A) och 8 (b) är ganska lika, vilket indikerar att de statistiska egenskaperna hos det postfärgade parzen lag-fönstret och WOSA-spektralberäkningarna är jämförbara: faktum är att de faktiska uppskattningarna är nära överens, med WOSA-uppskattningen som är något mjukare i utseende.

Multitaper Spektrala Estimatorer. En intressant altemativ till antingen lag fönster eller WOSA spektral uppskattning är Multitaper tillvägagångssätt Thomson . Multitaper spektral uppskattning kan betraktas som ett sätt att producera en direkt spektral estimator med mer än bara två ekvivalenta frihetsgrader (typiska värden är 4 till 16). Som sådan skiljer sig multitapermetoden i anda från de andra två uppskattarna genom att den inte försöker producera mycket utjämnade spektra. En ökning av frihetsgrader från 2 till bara 10 räcker dock för att krympa bredden på ett 95% konfidensintervall för sdf med mer än en storleksordning och därmed minska variationen i spektraluppskattningen till den punkt där det mänskliga ögat lätt kan diskemera den övergripande strukturen. Detaljerade diskussioner om multitaper-metoden ges i och kapitel 7 i . Här skissar vi bara de viktigaste ideerna.

multitaper spektral uppskattning är baserad på användningen av en uppsättning K data tapers {ht.k; t=1,…, n}, där k sträcker sig från 0 till K-1. Vi antar att dessa avsmalningar är ortonormala (dvs. Den enklaste multitaper estimatorn definieras av

S^X (mt) (f) = 1K kg K = 0K−1S^K, X (mt) (f) med ^ k, x(mt) (f) KG|KG T = 1nht, KXte-I2 kg|2

(Thomson förespråkar adaptivt viktning av S^k, X(mt)(f) snarare än att bara medelvärdera dem tillsammans). En jämförelse av denna definition för S^k, x (mt) (Taiwan) med Eq. (118) visar att S^k,x (mt) (Xiaomi) I själva verket bara är en direkt spektral estimator, så multitaper estimatorn är bara ett genomsnitt av direkta spektrala estimatorer som använder en ortonormal uppsättning av smalnar. Under vissa milda förhållanden översätts ortonormaliteten hos avsmalningarna till frekvensdomänen som ungefärligt oberoende för varje individ S^k, X(mt) (f); dvs S^j.X(mt) (f). Ungefärligt oberoende innebär i sin tur att 2KS^k,x(mt)(f)/SX(f)=dx22k ungefär, så att motsvarande frihetsgrader för S^X(mt)(f) är lika med dubbelt så många data som används.

nyckeltricket är då att hitta en uppsättning K-ortonormala sekvenser, som var och en gör ett korrekt jobb av avsmalnande. Ett tilltalande tillvägagångssätt är att retumera till koncentrationsproblemet som gav oss dpss-avsmalningen för en fast upplösningsbandbredd 2W om vi nu hänvisar till denna avsmalning som zeroth-order dpss-avsmalning och betecknar den med {h,,()}, kan vi rekursivt konstruera de återstående K-1 “högre order” dpss-avsmalningarna {ht,k} enligt följande. För k=1,…, K-1, Vi definierar kth-order dpss-avsmalningen som uppsättningen n-nummer {ht, k; t=1,…, n} så att

1

{ht,k} är ortogonalt till var och en av k−sekvenserna {ht,()},…,{ht,(k-1)}dvs, t=11ht.Jht.k = 0 för j = 0,…, k-1);

2

{ht, k} är normaliserad så att t=1nht,k2=1;

3

med förbehåll för Villkor] och 2, Det spektrala fönstret Hk (GHz) motsvarande {ht.k} maximerar koncentrationskvoten

cu−wwHk (f) DF / cu-f (N) f(n)Hk (f) DF = cu (n, W)

i ord, med förbehåll för begränsningen att vara ortogonal mot alla lägre ordningens dpss-avsmalningar, är kth-ordningens DPSS-avsmalning “optimal” i begränsad mening att sidloberna i dess spektralfönster undertrycks så mycket som möjligt mätt med koncentrationsförhållandet. Metoder för beräkning av dpss data tapers diskuteras i kapitel 8.

i en serie artiklar har Slepian (och referenser däri) omfattande studerat DPS: s natur. Ett viktigt faktum som han diskuterar är att koncentrationsförhållandet jacobk(n,W) strikt minskar när k ökar på ett sådant sätt att jacobk(n,W) är nära enhet för k<2NW Jacobt, varefter det snabbt närmar sig 0 med ökande k (värdet 2NW jacobt kallas ibland Shannon-numret). Eftersom xiaolk(n,W) måste vara nära enhet för att {ht,k} ska vara en anständig dataavsmalning, är multitaper spektral uppskattning begränsad till användningen av högst-och i praktiken vanligtvis mindre än— 2NW Accord orthonormal dpss avsmalnar.

ett exempel på multitaper spektral uppskattning visas i Figur 9. Den vänstra kolumnen av tomter visar kth-ordningens DPSS-data smalnar av för n = 4096, nW=4/Augbt och k som sträcker sig från 0 (övre plot) till K-1=5 (nedre plot). De tunna horisontella linjerna i var och en av dessa tomter indikerar nollnivån, så medan zeroth-order DPS är strikt positiv överallt (men ganska nära 0 nära t=1 och t=n), antar de högre ordningens avsmalningar både positiva och negativa värden. Observera också att zeroth-order avsmalnar kraftigt nedvikter värden för tidsserierna nära t=1 och t=n, men att dessa värden ges successivt mer vikt av de högre ordningens avsmalningar (en tolkning av multitapering är att de högre ordningens avsmalningar återfångarinformation “förlorad” när men en enda dataavsmalning används). Den fasta kurvan i Figur 9(b) visar en multitaperspektral uppskattning S^X(mt) (xhamster) för trådvågmätardata baserat på dessa 6 dpss-avsmalnar, medan prickarna visar de sex individuella direkta spektrala uppskattningarna S^K. x(mt) (xhamster). Observera att antalet avsmalningar som vi har använt ligger under Shannon-numret 2NW occarat=8 och att v, motsvarande frihetsgrader, är här 2K=12. Multitaper spektral uppskattning är mycket choppier utseende än antingen lag fönster spektral uppskattning av figur 8(A) eller WOSA uppskattning av figur 8(b), som båda har ett markant högre antal ekvivalenta frihetsgrader ( v=64 och v=59, respektive). Icke desto mindre är variationen i multitaperspektraluppskattningen liten nog så att ögat lätt kan upptäcka den övergripande strukturen (jfr. S^X(mt) (db) med de två spektrala uppskattningarna i Figur 5), och eftersom den inte är mycket jämn, gör multitaper-uppskattningen markant bättre för att fånga spektralstrukturen nära f=0.

Fig.9. Multitaper spektral uppskattning

baserat på prestandagränser, Bronez [16 hävdar att multitaper spektral estimator har statistiska egenskaper som är överlägsna WOSA för SDF med mycket höga dynamiska intervall (mer forskning krävs dock för att verifiera att dessa gränser översätts till en faktisk fördel i praktiken). I jämförelse med prewhitening är multitapering användbar i situationer där läckage är en concem men det är inte praktiskt att noggrant utforma prewhitening-filter (detta sker till exempel i prospekteringsgeofysik på grund av den enorma volymen tidsserier som rutinmässigt samlas in). Slutligen noterar vi att Thomson och Chave [17 beskriver ett tilltalande schema där multitapering används tillsammans med WOSA.

Lämna ett svar

Din e-postadress kommer inte publiceras.