Chris sa
06 Aug 2018
en av coolaste saker jag någonsin lärt mig om sensorisk fysiologi är hur hörselsystemet kan hitta ljud. För att avgöra om ljudet kommer från höger eller vänster använder hjärnan skillnader mellan öronen i amplitud och timing. Som visas i figuren nedan, om ljudet är högre i höger öra jämfört med vänster öra, kommer det förmodligen från höger sida. Ju mindre den skillnaden är, ju närmare ljudet är till mittlinjen (i.e vertikalplanet går från framsidan till baksidan). På samma sätt, om ljudet kommer till ditt högra öra före vänster öra, kommer det förmodligen från höger. Ju mindre tidsskillnaden desto närmare är den mittlinjen. Det finns en fascinerande litteratur om de neurala mekanismerna bakom detta.
inter-ear loudness och timing skillnader är ganska användbara, men tyvärr lämnar de fortfarande mycket tvetydighet. Till exempel kommer ett ljud från höger fram att ha exakt samma ljudstyrka skillnader och tidsskillnader som ett ljud från höger bak.
detta system lämnar inte bara tvetydigheter mellan fram och bak, det lämnar också tvetydigheter mellan topp och ner. Faktum är att det finns en hel kon av förvirring som inte kan disambigueras av detta system. Ljud från alla punkter längs ytan av konen kommer att ha samma inter-ear loudness skillnader och tidsskillnader.
medan detta system lämnar en kon av förvirring, kan människor fortfarande bestämma platsen för ljud från olika punkter på konen, åtminstone till viss del. Hur kan vi göra detta?
otroligt, Vi kan göra detta på grund av formen på våra öron och huvuden. När ljudet passerar genom våra öron och huvud dämpas vissa frekvenser mer än andra. Kritiskt är dämpningsmönstret mycket beroende av ljudriktning.
detta platsberoende dämpningsmönster kallas en Huvudrelaterad överföringsfunktion (HRTF) och i teorin kan detta användas för att disambiguera platser längs konen av förvirring. Ett exempel på någons HRTF visas nedan, med frekvens på den horisontella axeln och polär vinkel på den vertikala axeln. Varmare färger representerar mindre dämpning (dvs. mer kraft). Om ditt huvud och öron gav dig denna HRTF kan du bestämma att ett ljud kommer framifrån om det har mer högfrekvent effekt än du förväntar dig.
HRTF-bild från Simon Carliles psykoakustiska kapitel i Sonifieringshandboken.
detta system låter bra i teorin, men använder vi faktiskt dessa ledtrådar i praktiken? 1988 utförde Frederic Wightman och Doris Kistler en genial uppsättning experiment (1, 2) för att visa att människor verkligen använder HRTF för att härleda plats. Först mätte de HRTF för varje deltagare genom att sätta en liten mikrofon i öronen och spela ljud från olika platser. Därefter skapade de ett digitalt filter för varje plats och varje deltagare. Det vill säga, dessa filter implementerade varje deltagares HRTF. Slutligen placerade de hörlurar på lyssnarna och spelade ljud till dem, varje gång de passerade ljudet genom ett av de digitala filtren. Otroligt nog kunde deltagarna korrekt gissa ljudets” plats”, beroende på vilket filter som användes, även om ljudet kom från hörlurar. De var också mycket bättre på ljudlokalisering när de använde sin egen HRTF, snarare än någon annans HRTF.
ytterligare bevis för denna hypotes kommer från Hofman et al., 1998, som visade att genom att använda putty för att omforma människors öron kunde de ändra HRTF: erna och därmed störa ljudlokalisering. Intressant nog kunde människor snabbt lära sig hur man lokaliserar ljud med sina nya HRTF: er.
bild från Hofman et al., 1998
ett sista roligt faktum: för att förbättra ljudlokaliseringen av humanoidrobotar bifogade forskare i Japan konstgjorda öron till robothuvudena och implementerade några sofistikerade algoritmer för att härleda ljudplats. Här är några bilder på robotarna.
deras papper är lite löjligt och har några tvivelaktiga motiveringar för att inte bara använda mikrofoner på flera platser, men jag tyckte det var kul att se dessa principer tillämpas.