Chris powiedział
06 sie 2018
jedną z najfajniejszych rzeczy, jakie kiedykolwiek dowiedziałem się o fizjologii sensorycznej, jest to, jak system słuchowy jest w stanie zlokalizować Dźwięki · Aby określić, czy dźwięk dochodzi z prawej czy z lewej strony, mózg wykorzystuje różnice między uszami w amplitudzie i czasie. Jak pokazano na rysunku poniżej, jeśli dźwięk jest głośniejszy w prawym uchu w porównaniu do lewego ucha, prawdopodobnie pochodzi z prawej strony. Im mniejsza jest ta różnica, tym dźwięk jest bliżej linii środkowej (i.e płaszczyzna pionowa przechodząca od przodu do tyłu). Podobnie, jeśli dźwięk dociera do prawego ucha przed lewym, prawdopodobnie dochodzi z prawego. Im mniejsza różnica czasu, tym bliżej linii środkowej. Jest fascynująca literatura na temat mechanizmów neuronalnych.
głośność między uszami i różnice czasowe są dość przydatne, ale niestety nadal pozostawiają wiele niejasności. Na przykład, dźwięk z przodu po prawej stronie będzie miał dokładnie takie same różnice głośności i różnic czasowych, jak dźwięk z tyłu po prawej stronie.
system ten nie tylko pozostawia niejasności między przodem i tyłem, ale także pozostawia niejasności Między górą i dnem. W rzeczywistości istnieje cały stożek zamieszania, którego ten system nie może zdezorientować. Dźwięk ze wszystkich punktów wzdłuż powierzchni stożka będzie miał takie same różnice głośności między uszami i różnice czasowe.
podczas gdy ten system pozostawia stożek zamieszania, ludzie nadal są w stanie określić lokalizację dźwięków z różnych punktów na stożku, przynajmniej do pewnego stopnia. Jak możemy to zrobić?
o dziwo jesteśmy w stanie to zrobić ze względu na kształt naszych uszu i głowy. Kiedy dźwięk przechodzi przez nasze uszy i głowę, pewne częstotliwości są tłumione bardziej niż inne. Krytycznie, wzór tłumienia jest w dużym stopniu zależny od kierunku dźwięku.
ten wzorzec tłumienia zależnego od lokalizacji nazywa się Funkcją transferu związanego z głową (hrtf) i teoretycznie może to być wykorzystane do rozróżnienia lokalizacji wzdłuż stożka zamieszania. Przykład czyjegoś HRTF jest pokazany poniżej, z częstotliwością na osi poziomej i kątem biegunowym na osi pionowej. Gorętsze kolory oznaczają mniejsze tłumienie (tzn. większą moc). Jeśli Twoja głowa i uszy dały ci ten HRTF, możesz zdecydować, że dźwięk dochodzi z przodu, jeśli ma większą moc wysokiej częstotliwości niż można się spodziewać.
obraz HRTF z rozdziału psychoakustyki Simona Carlile w podręczniku Sonifikacji.
ten system brzmi dobrze w teorii, ale czy faktycznie używamy tych wskazówek w praktyce? W 1988 Frederic Wightman i Doris Kistler przeprowadzili genialny zestaw eksperymentów (1, 2), aby pokazać, że ludzie naprawdę używają hrtf do wnioskowania lokalizacji. Po pierwsze, zmierzyli HRTF każdego uczestnika, wkładając mały mikrofon do uszu i odtwarzając dźwięki z różnych lokalizacji. Następnie stworzyli cyfrowy filtr dla każdej lokalizacji i każdego uczestnika. Oznacza to, że filtry te wdrożyły HRTF każdego uczestnika. Na koniec umieścili słuchawki na słuchaczach i odtwarzali do nich dźwięki, za każdym razem przekazując dźwięk przez jeden z filtrów cyfrowych. O dziwo uczestnicy byli w stanie poprawnie odgadnąć “lokalizację” dźwięku, w zależności od tego, który filtr został użyty, mimo że dźwięk pochodził ze słuchawek. Znacznie lepiej radzili sobie także z lokalizacją dźwięku, gdy używali własnego HRTF, niż czyjegoś hrtf.
dalsze dowody na tę hipotezę pochodzą z Hofman et al., 1998, który pokazał, że używając kit do zmiany kształtu uszu ludzi, byli w stanie zmienić HRTFs, a tym samym zakłócić lokalizację dźwięku. Co ciekawe, ludzie byli w stanie szybko nauczyć się lokalizacji dźwięku za pomocą nowych plików hrtf.
zdjęcie z Hofman et al., 1998
ostatnia ciekawostka: aby poprawić lokalizację dźwięku humanoidalnych robotów, naukowcy z Japonii przywiązali sztuczne uszy do głowic robotów i zaimplementowali wyrafinowane algorytmy do wnioskowania o lokalizacji dźwięku. Oto kilka zdjęć robotów.
ich papier jest trochę śmieszny i ma pewne wątpliwe uzasadnienie nie tylko używania mikrofonów w wielu miejscach, ale pomyślałem, że fajnie było zobaczyć, jak te zasady są stosowane.