spójny Estymator
11.2.3 redukcja wariancji
pobieżne badanie estymatorów widmowych dla serii mierników drutu na rysunkach 5 i 6 ujawnia znaczną zmienność w zakresie częstotliwości, tak bardzo, że trudno jest dostrzec ogólną strukturę w estymat widmowy bez sporej ilości badań. Wszystkie estymatory widmowe bezpośrednie cierpią z powodu tej wrodzonej choppiness, co można wyjaśnić rozważając własności dystrybucyjne S^X (d) (f). Po pierwsze, jeśli f nie jest zbyt blisko 0 lub f (N) i jeśli SW (⋅) spełnia łagodny warunek regularności, to 2S^w(d) (f)/Sw(f)=dx22; tj., rv 2s^w(d) (f)/Sw(f) jest w przybliżeniu równy rozkładowi do kwadratu chi RV z 2 stopniami swobody. Jeśli nie stosuje się zwężania, f uważa się za “nie za blisko” do 0 lub f (n), Jeśli 1 / (n-p)Δt< f< f (n) -1 / (n-p)Δt; jeśli używane jest zwężanie, musimy zastąpić 1 / (n-p)Δt przez większy termin, odzwierciedlający zwiększoną szerokość centralnego płata okna spektralnego(na przykład termin dla stożka danych Hanninga wynosi w przybliżeniu 2/(n-p)Δt, więc f jest “nie za blisko”, jeśli 2/(n-p)Δt<f<f(n)-2/(n-p)Δt).
ponieważ chi-kwadrat RV xv2 z V stopniami swobody ma wariancję 2U, mamy przybliżenie V = Sw2 (f). Wynik ten jest niezależny od liczby Wt, mamy: w przeciwieństwie do statystyk, takich jak średnia z próby niezależnych i identycznie rozłożonych RVs Gaussa, wariancja s^W(d)(f) nie zmniejsza się do 0, gdy wielkość próby N-p staje się większa (z wyjątkiem nieciekawego przypadku Sw(f)=0). Wynik ten wyjaśnia rozdrobnienie bezpośrednich oszacowań widmowych pokazanych na rysunkach 5 i 6. W terminologii statystycznej s^W(d)(f) jest niespójnym estymatorem Sw(f).
przedstawiamy teraz trzy podejścia do uzyskania spójnego estymatora Sw (f). Każde podejście opiera się na połączeniu rvs, które przy odpowiednich założeniach można uznać za w przybliżeniu parami nieskorelowanych estymatorów SW(f). Krótko mówiąc, trzy podejścia są do
1
gładkie s^W(d)(f) na częstotliwościach, dając to, co jest znane jako Estymator widmowy okna opóźnienia;
2
{Xt} (lub {wt}) na liczbę segmentów (z których niektóre mogą się nakładać), obliczyć bezpośrednie oszacowanie widmowe dla każdego segmentu, a następnie uśrednić te szacunki razem, dając Estymator widmowy Welcha zachodzący na siebie segmentaveraging (wosa) ;
3
Oblicz serię bezpośrednich oszacowań widmowych dla {Wt} za pomocą zestawu ortogonalnych stożków danych, a następnie uśredniaj te oszacowania razem, uzyskując wielozadaniowy Estymator widmowy Thomsona.
Estymatory widmowe okna Lag Estymator widmowy okna lag SW (⋅) przyjmuje postać
gdzie WM (⋅) jest oknem wygładzającym, którego właściwości wygładzające są kontrolowane przez parametr wygładzający m. W słowach Estymator s^W(lw)(⋅) otrzymuje się przez splatanie okna wygładzającego z bezpośrednim estymatorem widmowym s^W (d) (⋅). Typowe okno wygładzające ma taki sam wygląd jak okno widmowe. Istnieje płat centralny o szerokości, którą można regulować za pomocą parametru wygładzania M: im szerszy jest ten płat centralny, tym gładsze będzie S^W(w) (⋅). Istnieje również zestaw irytujących okien bocznych, które powodują wygładzanie wycieku okna. Obecność wygładzającego wycieku okna można łatwo wykryć, nakładając wykresy s^W (lw) (⋅) i S^W (d) (⋅) i szukając zakresów częstotliwości, w których pierwsza z nich nie wydaje się wygładzoną wersją drugiej.
jeśli użyliśmy filtra wstępnego AR, możemy postcolor s^W(lw) (⋅), aby uzyskać Estymator Sx (⋅), a mianowicie
właściwości statystyczne S^W(lw) (.) są tractable ze względu na następujący duży wynik próbki. Jeśli S^W (D) (⋅) jest w rzeczywistości periodogramem (tzn. nie zmniejszyliśmy wartości Wt), zbiór rvs s^W(D) (j/(n−P) Δt), j=1,2,…, j,, są w przybliżeniu parami nieskorelowanymi, przy czym każdy RV jest proporcjonalny do χ22, rv (tutaj J jest największą liczbą całkowitą taką, że J/(n-p)< 1/2). Jeśli użyliśmy zwężania do utworzenia Sw (d) (⋅), podobne stwierdzenie jest prawdziwe dla mniejszego zestawu rvs zdefiniowanego na grubszej siatce równo rozmieszczonych częstotliwości-wraz ze wzrostem stopnia zwężania zmniejsza się liczba w przybliżeniu nieskorelowanych rvs. Zgodnie z założeniami, że sdf Sw (⋅) powoli zmienia się w różnych częstotliwościach (wstępne bicie pomaga to urzeczywistnić) i że centralny płat okna wygładzającego jest wystarczająco mały w porównaniu do zmian w Sw (⋅), wynika z tego, że s^W(d) (f) w korektorze. (11.15) może być przybliżony przez liniową kombinację nieskorelowanych χ22 RVs. Standardowy argument “równoważnych stopni swobody” może być następnie użyty do przybliżenia rozkładu s^W(lw)(f). (patrz Eq. (11.17) później).
istnieją dwa praktyczne sposoby obliczania S^W(lw)(⋅). Pierwszym sposobem jest dyskrecja Eq. (11.15), dając Estymator proporcjonalny do splotu postaci ΣkWm(f−fk’) SW(d) (fk’), gdzie wartości offk ‘ są pewnym zbiorem równomiernie rozłożonych częstotliwości. Drugim sposobem jest przypomnienie sobie, że” splot w jednej domenie Fouriera jest równoważny mnożeniu w drugiej”, aby przepisać Eq. (11.15) as
gdzie c^τ.W (d), jest estymatorem acvs podanym w równaniu. (11.9) odpowiadający S^W (d) (.), oraz {wt.m} jest oknem opóźnienia (można to uznać za odwrotną transformatę Fouriera okna wygładzającego wm (⋅)). W rzeczywistości, ponieważ S^W (d) (.) jest wielomianem trygonometrycznym, wszystkie dyskretne sploty postaci ΣkWm (f−fk’)s^W (D) (fk’) można również obliczyć za pomocą Eq. (11.16) z odpowiednim wyborem wartości wt, m (szczegóły patrz punkt 6.7). Nasze dwa praktyczne sposoby obliczania S^W(l, w) (.) a zatem estymatory ekwiwalentne. O ile splot dyskretny nie jest wystarczająco krótki, Eq. (11.16) jest obliczeniowo szybszy w użyciu.
teoria statystyczna sugeruje, że przy rozsądnych założeniach
do dobrego przybliżenia,gdzie v nazywa się równoważnymi stopniami swobody dla S^W(lw)(f) i jest dana przez v=2(n−p)BwΔt/Ch. Tutaj BW jest miarą Szerokości pasma okna wygładzającego Wm (⋅) a) n d można obliczyć za pomocą BW=1/Δt∑T=−(n−p−1) n-p-1WT, m2;;z drugiej strony,Ch zależy tylko od stożka zastosowanego do wartości Wtand można obliczyć za pomocą Ch = (n−p)∑1=p+1nht4 uwaga: jeśli nie wyraźnie stożka, to ht = 1/N−pand stąd Ch>1; dla typowego stożka danych, nierówność Cauchy ‘ ego mówi nam, że ch>1(na przykład ch≈1,94 dla stożka danych Hanning). Równoważne stopnie swobody dla S^W (lw) (f) zwiększają się wraz ze zwiększeniem szerokości okna wygładzającego i zmniejszają się wraz ze zwiększeniem stopnia zwężenia. Równanie (11.17) mówi nam, że E≈SW (f) i że V≈SW2 (f) / v, więc zwiększenie V zmniejsza V.
przybliżenie w korektorze. (11.17) można wykorzystać do skonstruowania przedziału ufności dla SW (f) w następujący sposób.Niech nv (α)oznacza α×100% punktu procentowego dystrybucji XV2, tzn. P=α.A100 (1-2α) % przedział ufności dla Sw (f) wynosi w przybliżeniu
punkty procentowe ην (α) są tabelaryczne w wielu podręcznikach lub można je obliczyć za pomocą algorytmu podanego przez Besta i Robertsa
przedział ufności (11,18) jest niewygodny, ponieważ jego długość jest proporcjonalna do S^W(lw) (f). Z drugiej strony, odpowiedni przedział ufności dla 10.log10 (Sw (f)) (tj. SW (f) w skali decybelowej) jest po prostu
która ma szerokość niezależną od S^W (lw) (.). Jest to uzasadnienie dla wykreślania oszacowań sdf w skali decybelowej (lub logarytmicznej).
Tutaj podajemy tylko jeden przykład, dobrze znane okno Parzen fag (Parzen):
gdzie m przyjmuje się jako dodatnią liczbę całkowitą, a τ = τ / m. to okno opóźnienia jest łatwe do obliczenia i ma bocznice, których Obwiednia rozpada się jako f-4, więc wygładzanie wycieku okna rzadko stanowi problem. W dobrym przybliżeniu szerokość pasma okna wygładzającego dla okna opóźnienia Parzen jest podana przez Bw=1.85/(mΔt). Wraz ze wzrostem m zmniejsza się przepustowość okna wygładzającego, a wynikowy Estymator okna opóźnienia staje się mniej gładki w wyglądzie. Powiązane równoważne stopnie swobody są podane w przybliżeniu przez v=3,71 (n-p)/(mCh). Okno opóźnienia parzena dla m = 32 i związane z nim okno wygładzania przedstawiono na fig. 7.
jako przykład, Fig. 8(A) pokazuje postkolorowy Estymator okna Opóźnienia dla danych z miernika fali drutu (krzywa stała), wraz z odpowiednim postkolorowanym bezpośrednim estymatorem widmowym(kropki, przedstawiają te same estymatory, jak pokazano na fig.6 (b)). Dla parametru okna wygładzającego użyto okna opóźnienia Parzena o wartości m=237 (odpowiednikiem równoważnych stopni swobody v jest 64). Wartość ta została wybrana po pewnych eksperymentach i wydaje się, że tworzy Estymator okna opóźnienia, który przechwytuje wszystkie ważne cechy widmowe wskazane przez bezpośredni Estymator widmowy dla częstotliwości między 0,4 A 4,0 Hz (należy jednak zauważyć, że Estymator ten rozmazuje szczyt między 0,0 a 0,4 Hz raczej źle). Wykreśliliśmy również krzyżyk, którego wysokość w pionie odpowiada długości 95% przedziału ufności dla 10 ⋅ log10(SX (f)) (w oparciu o postcolored lag window estimator) i którego szerokość w poziomie odpowiada wygładzającej szerokości okna BW
Estymatory widmowe WOSA. Rozważmy teraz drugie wspólne podejście do redukcji wariancji, a mianowicie uśrednianie segmentów pokrywających się Welcha (Welch; Carter i odniesienia w nim). Podstawową ideą jest rozbicie szeregu czasowego na kilka bloków (tj., segmenty), Oblicz bezpośrednie oszacowanie widmowe dla każdego bloku, a następnie wyprodukuj oszacowanie widmowe WOSA, uśredniając te szacunki widmowe razem. Ogólnie rzecz biorąc, bloki mogą się nakładać, a stopień ich nakładania zależy od stopnia zwężenia-im większy stopień zwężenia, tym bardziej bloki powinny się nakładać (Thomson). Tak więc, z wyjątkiem samego początku i końca szeregów czasowych, wartości danych, które są mocno zwężone w jednym bloku, są lekko zwężone w innym bloku, więc intuicyjnie odzyskujemy” informacje ” utracone z powodu zwężenia się w jednym bloku z bloków nakładających się na niego. Ponieważ może być zaimplementowany w wydajny obliczeniowo sposób (przy użyciu algorytmu szybkiej transformacji Fouriera) i ponieważ może obsługiwać bardzo długie szeregi czasowe (lub szeregi czasowe o zmiennym spektrum czasowym), schemat estymacji wosa jest podstawą wielu komercyjnych analizatorów widma dostępnych na rynku.
aby zdefiniować Estymator widmowy WOSA, niech ns reprezentuje rozmiar bloku, A niech H1,…, HNS być stożek danych. Definiujemy Estymator widmowy bezpośredni Sx (f) dla bloku NS ciągłych wartości danych zaczynających się od indeksu l jako
(nie ma powodu, dla którego nie możemy użyć tutaj prewhitened series {Wt} zamiast Xt, ale prewhitening jest rzadko używany w połączeniu z WOSA, być może dlatego, że nakładanie się bloków jest uważane za skuteczny sposób kompensacji stopni swobody utraconych w wyniku zwężania). Estymator widmowy WOSA SX (f) jest zdefiniowany jako
gdzie nn jest całkowitą liczbą bloków, A S jest całkowitym współczynnikiem przesunięcia spełniającym 0<s≤NS i s (nB-1)=N-ns (zauważ, że blok dla j=0 używa wartości danych χ1,…, Xns, natomiast blok dla J=nB-1, xn-ns+1,…, Xe).
duże właściwości statystyczne próbki S^X(wosa)(f) bardzo przypominają te z estymatorów okien lagów. w szczególności mamy przybliżenie, które VS^X(wosa)(f)/Sx(f)=dXv2, gdzie równoważne stopnie swobody v są podane przez
(tutaj HT = 0 z definicji dla wszystkich t>ns). Jeśli specjalizujemy się w przypadku 50% nakładania się bloków (tj. s = NS/2) ze stożkiem danych Hanninga (wspólne zalecenie w literaturze inżynierskiej), można to przybliżać za pomocą prostego wzoru V≈36nb21(19nb-1). Tak więc, wraz ze wzrostem liczby bloków nB, wzrasta również równoważny stopień swobody, dając Estymator widmowy ze zmniejszoną wariancją. O ile SX (⋅) nie ma stosunkowo łatwego sdf, nie możemy jednak uczynić nB arbitralnie małym bez poniesienia poważnego odchylenia w poszczególnych bezpośrednich estymat widmowych głównie z powodu utraty rozdzielczości. (Szczegółowe informacje na temat powyższych wyników, patrz punkt 6.17.)
Fig.8(b) przedstawia Estymator widmowy WOSA dla danych z pomiaru fali drutu (krzywa stała). Ta seria ma N = 4096 wartości danych. Niektóre eksperymenty wykazały, że rozmiar bloku NS=256 i stożek danych Hanninga są rozsądnymi wyborami do oszacowania sdf między 0,4 A 4,0 Hz przy użyciu WOSA. Przy nakładaniu się bloku 50% współczynnik przesunięcia wynosi s=NS / 2=128; całkowita liczba bloków wynosi nB=1_δ(n−ns)+1 = 31; A V, równoważne stopnie swobody, wynosi około 59. 31 indywidualnych bezpośrednich oszacowań spektralnych, które uśredniono razem, tworząc oszacowanie WOSA, przedstawiono jako kropki na fig. 8 (b).
wykreśliliśmy również” pasmo/przedział ufności “krzyżujący się podobnie do tego na rysunku 8(a), ale teraz” pasmo ” (tj. szerokość pozioma) jest odległością w częstotliwości między mniej więcej nieskorelowanymi szacunkami widmowymi. Th jest miarą przepustowości jest funkcją rozmiaru bloku ns i stożka danych używanego w WOSA. Dla stożka Hanninga szerokość pasma wynosi około 1,94/(nsΔt). Krzyżyki na rysunkach 8(a) i 8 (b) są dość podobne, co wskazuje, że właściwości statystyczne postcolored Parzen lag window i szacunki widmowe Wosa są porównywalne: rzeczywiście, rzeczywiste szacunki są ściśle zgodne, a szacunki WOSA są nieco gładsze w wyglądzie.
Wielozadaniowe Estymatory Widmowe. Ciekawym altematywem do estymacji widmowej lag window lub wosa jest podejście Multitaper Thomsona . Wielostopniowa estymacja spektralna może być traktowana jako sposób wytwarzania bezpośredniego estymatora spektralnego o więcej niż dwóch równoważnych stopniach swobody (typowe wartości to 4 do 16). Jako taka, metoda wielostopniowa różni się duchem od pozostałych dwóch estymatorów tym, że nie dąży do wytworzenia wysoce wygładzonych widm. Zwiększenie stopnia swobody od 2 do zaledwie 10 jest jednak wystarczające, aby zmniejszyć Szerokość 95% przedziału ufności dla sdf o więcej niż rząd wielkości, a tym samym zmniejszyć zmienność estymacji spektralnej do punktu, w którym ludzkie oko może łatwo rozpoznać ogólną strukturę. Szczegółowe dyskusje na temat podejścia multitaper znajdują się w Rozdziale 7 . Tutaj tylko szkicujemy główne idee.
wielostopniowa estymacja spektralna opiera się na użyciu zestawu K danych stożków {ht.k; t=1,…, n}, gdzie k waha się od 0 do K-1. Zakładamy, że te stożki są ortonormalne (tj. ∑t=1nht,jht,k=1, jeśli j=k i 0, jeśli j≠K). Najprostszy Estymator wielozadaniowy jest zdefiniowany przez
(Thomson zaleca adaptacyjne ważenie S^k, X (mt) (f) zamiast po prostu uśredniać je razem). Porównanie tej definicji dla S^k,X(mt)(⋅) z Eq. (118) pokazuje,że S^k, X (mt) (⋅) jest w rzeczywistości tylko bezpośrednim estymatorem widmowym, więc Estymator wielostopniowy jest tylko średnią bezpośrednich estymatorów widmowych wykorzystujących ortonormalny zestaw stożków. W pewnych łagodnych warunkach ortonormalność stożków przekłada się na dziedzinę częstotliwości jako przybliżoną niezależność każdego osobnika S^k, X (mt) (f); tj. S^j.X(mt) (f). Przybliżona niezależność z kolei implikuje, że 2KS^k, X (mt) (f) / SX(f)=dx22k w przybliżeniu, tak że równoważne stopnie swobody dla S^X(mt) (f) jest równa dwukrotności liczby zastosowanych stożków danych.
kluczową sztuczką jest znalezienie zbioru sekwencji ortonormalnych K, z których każda wykonuje właściwą pracę zwężania. Jednym z atrakcyjnych podejść jest powrót do problemu koncentracji, który dał nam stożek DPSS dla stałej szerokości pasma 2W jeśli teraz odwołujemy się do tego stożka jako stożka DPSS zerowego rzędu i oznaczamy go przez {h,,()}, możemy rekurencyjnie skonstruować Pozostałe stożki DPSS K-1 “wyższego rzędu” {ht,k} w następujący sposób. Dla k=1,…, K-1, definiujemy stożek KTH rzędu dpss jako zbiór n liczb {ht,k;t=1,…, n} takie, że
1
{ht,k} jest prostopadłe do każdej z sekwencji k {ht,()},…,{ht, (k−1)} tj., ∑t = 11ht.Jht.k=0 for J = 0,…, k-1);
2
{HT, k} jest znormalizowane tak, że ∑t=1nht, k2=1;
3
z zastrzeżeniem warunków] i 2, okno widmowe HK (⋅) odpowiadające {ht.K} maksymalizuje stosunek stężenia
w słowach, z zastrzeżeniem ograniczenia prostopadłości do wszystkich stożków DPSS niższego rzędu, stożek DPSS rzędu kth jest “optymalny” w ograniczonym sensie, że boki jego okna spektralnego są tłumione w miarę możliwości, mierząc stosunek stężenia. Metody obliczania stożków danych dpss omówiono w rozdziale 8.
w serii artykułów, Slepian (i odniesienia do nich) szeroko zbadał naturę dpss. Ważnym faktem jest to,że stosunek stężenia λk(n, W) ściśle zmniejsza się wraz ze wzrostem k w taki sposób, że λk (n,W) jest bliskie jedności dla k<2NW Δt, po czym szybko zbliża się do 0 ze wzrostem K (wartość 2nWΔt jest czasami nazywana liczbą Shannona). Ponieważ λk (n,W) musi być bliskie jedności,aby {ht, k} był przyzwoitym stożkiem danych, wielostopniowe szacowanie spektralne jest ograniczone do użycia co najwyżej— a w praktyce zwykle mniej niż-2nwδt ortonormalnych stożków DPSS.
przykład wielostopniowej estymacji spektralnej przedstawiono na fig.9. Lewa kolumna Wykresów pokazuje stożki danych DPSS rzędu kth dla N=4096, nW=4/Δt i K w zakresie od 0 (górny wykres) do K-1 = 5 (dolny Wykres). Cienkie poziome linie na każdym z tych wykresów wskazują poziom zerowy, więc podczas gdy DPSS zerowego rzędu jest wszędzie ściśle dodatni (ale dość blisko 0 w pobliżu T=1 i t=n), stożki wyższego rzędu przyjmują zarówno wartości dodatnie, jak i ujemne. Zauważ również, że stożek zerowego rzędu mocno obniża wartości szeregów czasowych bliskich t=1 i t=n, ale wartości te są sukcesywnie ważone przez stożki wyższego rzędu (jedną z interpretacji wielowarstwowości jest to, że stożki wyższego rzędu odzyskują informacje “utracone”, gdy używany jest tylko pojedynczy stożek danych). Stała krzywa na fig. 9(b) pokazuje wielowarstwowe oszacowanie spektralne S^X (mt) (⋅) dla danych z pomiaru fali drutu opartych na tych 6 stożkach dpss, podczas gdy kropki pokazują sześć indywidualnych bezpośrednich oszacowań spektralnych s^K. X (mt) (⋅). Zauważ, że liczba stożków, których użyliśmy, jest poniżej liczby Shannona 2nWΔt=8 i że V, równoważne stopnie swobody, wynosi tutaj 2k = 12. Widmowy estymat wielostopniowy ma znacznie lepszy wygląd niż widmowy estymat okna opóźnienia z fig. 8 (A) lub estymat WOSA z fig. 8 (b), z których oba mają znacznie większą liczbę równoważnych stopni swobody ( odpowiednio v=64 I V=59). Niemniej jednak, zmienność w oszacowaniu spektralnym multitaper jest na tyle mała, że oko może łatwo wykryć ogólną strukturę (por. S^X (mt) (⋅) z dwoma szacunkami widmowymi na fig. 5), a ponieważ nie jest wysoce wygładzony, oszacowanie wielostopniowe znacznie lepiej wychwytuje strukturę widmową w pobliżu f=0.
opierając się na granicach wydajności, Bronez [16 twierdzi, że Estymator spektralny multitaper ma właściwości statystyczne, które są lepsze niż wosa dla SDF o bardzo wysokich zakresach dynamicznych (wymagane jest jednak więcej badań, aby sprawdzić, czy te granice przekładają się na rzeczywistą przewagę w praktyce). W porównaniu do wstępnego oczyszczania, wielowarstwowość jest przydatna w sytuacjach, gdy wyciek jest concem, ale nie jest praktyczne staranne zaprojektowanie filtrów wstępnego oczyszczania (dzieje się tak na przykład w geofizyce eksploracyjnej ze względu na ogromną ilość szeregów czasowych rutynowo gromadzonych). Na koniec zauważamy, że Thomson i Chave [17] opisują atrakcyjny schemat, w którym multitapering jest używany w połączeniu z WOSA.