Soundscape Analyse: van theorie naar technologie

Van theorie naar technologie

Op basis van de soundscapetheorie heeft SoundAppraisal unieke technologie ontwikkelt die geluidsomgevingen typeert in termen van geluidsbelevingscategorieën of “sound appraisals” zoals die zijn weergegeven in de figuur 1. Onze unieke technologie simuleert het menselijk vermogen om geluidsomgevingen te herkennen. Het kan onderscheid maken tussen de verschillende typen geluidsbeleving en geeft daarmee inzicht in de kwaliteiten van verschillende geluidsomgevingen. In de onderstaande tekst wordt de toepassing van deze technologie in soundscape analyses uitgelegd.

geluidsbeleving+veiligheid

*Figuur 1: Categorieen van geluidsbeleving*

Soundscape-analyse

Geluidsanalyse op basis van de soundscape-gedachte gaat over het vaststellen van hoorbare veiligheid. Mensen (en dieren) analyseren geluid door dit te splitsen in ‘percepten’. Het klinkt heel logisch dat we het gefluit van een vogel onderscheiden van spraak, een autopassage of het geluid van de airconditioning. Maar hoe mens en dier dat doen, heeft de wetenschap nog niet volledig ontrafeld.1 Wij hebben in de afgelopen jaren technologie ontwikkeld die het menselijke vermogen om geluid in percepten te scheiden goed simuleert.

Het geluid van een bron heeft altijd een structuur in tijd en in frequentie (temporele en spectrale structuur). Geluid kent bijvoorbeeld een begin- en een eindtijd en een laagste en een hoogste frequentie. Figuur 2 laat dit zien aan de hand van gekleurde blokken. De kleuren komen overeen met de belevingen in Figuur 1.

Verdeling tijd-frequentievlak over categorieën van geluidsbeleving

Figuur 2 Verdeling tijd-frequentievlak over categorieën van geluidsbeleving

De meeste omgevingsgeluiden zijn ruisachtig. Geluiden van levende wezens (maar ook alarmen, kerkklokken en muziek) hebben vaak een complexe tonale structuur. Ze zijn hier in geel weergegeven, als patronen van horizontale lijnen. Een deken van achtergrondgeluid (lichtblauw) en de (rode) maskerende voorgrondgeluiden zijn vervelend, doordat ze gewenste geluiden (geel en groen) maskeren. Tijd loopt in deze figuur van links naar rechts en de verticale as staat voor frequenties met voor hogere frequenties ook een hogere positie.

Figuur 1 geeft voor de vier hoofdkwadranten van beleving (chaotisch, levendig, saai, en kalm) een overzicht van de typische belevingscomponenten. Groen en geel zijn bronnen die je graag wilt horen, omdat ze op een normale, hoorbare veilige situatie duiden. De groene blokken zijn doorgaans niet erg luid en van natuurlijke oorsprong. De gele blokken corresponderen doorgaans met de geluiden van levende wezens die vaak complexe patronen van tonen produceren (hier weergegeven als horizontale gele lijntjes). De blauwe en rode blokken zijn doorgaans luider en maskeren (overstemmen) de gewenste gele en groene geluiden deels of geheel.

De brede groene achtergrond en de donkergroene voorgrond vertellen je waar je bent en of het veilig is. We noemen dit de natuurlijke achtergrond. Deze is vaak niet erg luid en vol met subtiele structuren. De natuurlijke achtergrond is daarom gemakkelijk te maskeren. Vandaar dat de groene kleur in Figuur 2 “onderop” ligt.

Het blauwe vlak bij saai is een deken van min of meer stationair geluid, bijvoorbeeld van een airconditioning of een verre snelweg. Het kan ook de som zijn van alle stadsgeluiden (die ’s nachts veel minder ‘dik’ is dan overdag). De stationaire deken maakt het moeilijk om de natuurlijke achtergrond te horen en dus om vast te stellen of het veilig is.

De rode blokken zijn maskerende voorgrondbronnen die de luisteraar doorgaans niets brengen, maar het wel moeilijk maken om veiligheid vast te stellen. Denk aan passerende auto’s en vliegtuigen, maar ook rammelende karretjes.

Figuur 2 Grafische weergave scheiding

Het blijkt dat de verschillende kleuren overeenstemmen met de snelheid van veranderingen in de bron: spraak en vogelgeluiden veranderen heel snel, ruim binnen de seconde. Auto- en vliegtuigpassages veranderen langzamer, meer in de orde van seconden tot een minuut, terwijl het geluid van de spits of de geluiden van het weer nog langzamer veranderen. Dit leidt tot de volgende tabel.

Tabel – De vier geluidsomgevingen en hun eigenschappen

Chaotisch Hoogste achter- en voorgrondniveaus. Veel, complexe, gemixte, deels gemaskeerde, vervormde events die het moeilijk maken om het signaal te analyseren. Hier domineren maskerende voorgrondbronnen. Vooral in de minuut voorgrond (rood) Levendig Hogere achter- en voorgrondniveaus veroorzaakt door meerdere events (geel). Relatief veel events met een complexe interne structuur. Maar niet te veel of te divers en altijd indicatief voor veiligheid, doordat ze verbonden zijn met ontspannen activiteiten. Vooral in de seconde voorgrond.
Saai Hoger achtergrondniveau (lichtblauw) doordat stationaire niet-natuurlijke bronnen natuurlijke structuren maskeren. Weinig voorgrond door hoge waarden in de uur voor- en achtergrond. Kalm Lage achtergrondniveaus (groen) met relatief veel kleine natuurlijke structuren (donkergroen) in de seconde voorgrond.

We hebben van deze “ontwikkelingssnelheidsverschillen” gebruik gemaakt om een scheidingsfilter te ontwikkelen die de verschillende componenten scheidt.

Figuur 3 Het scheidingsalgoritme

We halen eerst de snelste geluiden (geel) uit het signaal: dat is de voorgrond die zich sneller ontwikkeld dan 1 sec. Dan blijft er een variant van het signaal over (rood) waar vervolgens de een langzamere (sneller dan 60 sec) voorgrond uit weg gefilterd wordt. Vervolgens verandert het signaal nog maar langzaam. Toch kan hier nog een voorgrond (blauw) uitgehaald worden (met alles sneller dan 1 uur). Wat er over blijft is een uurachtergrond. Deze is in het plaatje echter niet te onderscheiden.

Aan de rechterkant van Figuur 3 is het effect van de voorgrond in termen van het maskeren van de achtergrond zichtbaar gemaakt. De voorgrond is er wel, maar bijna alles daarvan wordt gemaskeerd door de de rode bijdrage. Dit houdt een verarming van geluidsomgeving is: wat er verarmt is zijn de indicatoren voor veiligheid.

Gelaagde beleving

Vanuit de soundscape-gedachte is de geluidsomgeving opgebouwd uit verschillende lagen. In de nacht zijn deze minder luid of ‘dunner’ dan overdag en is het relatief stil. ’s Nachts zijn er in de stad vooral stationaire stadsgeluiden te horen: geluid van gebouwen (denk aan airco’s) en industrie, het geruis van bomen en bijvoorbeeld het geluid van ver verkeer. Gaande de dag nemen de activiteiten – en daarmee het geluid – toe en worden de lagen ‘dikker’. Zo leidt veel verkeer tot een onplezierige, saaie ‘geluidslaag’ die veel plezierige, lokale geluidjes maskeert (zie Figuur 1 linksonder). In de ochtend, zeker in het voorjaar, is er vaak een vogelkoor dat juist als plezierig en rustgevend wordt ervaren (rechtsonder). Gedurende de dag vinden er steeds meer activiteiten plaats: zoals praten, lachen en fietsen. Wanneer het aantal maskerende voorgrondgeluiden (denk aan auto’s, scooters, gettoblasters en werkgeluid) sterk toeneemt, dan kan de omgeving al snel chaotisch worden (linksboven).

Volgens de soundscapetheorie gebruiken we ons gehoor om te checken of het veilig is of onveilig. Daarbij letten we op de sterkte van het geluid (harde geluiden duiden op grote bronnen en mogelijk gevaar) en de kleine, subtiele geluiden die ons vertellen of de omgeving normaal en veilig is. Als de subtiele geluiden gemaskeerd worden door luidere bronnen die niet direct duiden op veiligheid (maskerend voorgrondgeluid), ervaren we in lichte mate hinder: we moeten nu bewust – in plaats van onbewust – bepalen of het veilig is. We worden gedwongen te luisteren naar iets waar we liever geen aandacht aan besteden.

Doordat maskerende voorgrondgeluiden (weergegeven in rood in Figuur 2 doorgaans veel langer duren dan de veilige, subtiele geluiden, kunnen we ze dus op basis van hun temporele ontwikkeling detecteren en scheiden. Dat is de basis van één van onze methoden om hinderlijkheidsverschillen in kaart te brengen.


  1. Er is een wetenschappelijk vakgebied dat Auditory Scene Analysis heet. Dat is een vakgebied dat sinds de jaren 90 tot belangrijke inzichten in onze auditieve perceptie heeft geleid. Echter dat vakgebied richt zich vooral op de perceptie van specifieke toontjes, pulsjes en ruisjes. Het richt zich zeker niet op realistische geluidsbronnen zoals scooters, regen, en passerende zeeschepen. De technologie van SoundAppraisal is Auditory Scene Analysis zoals het oorspronkelijk bedoeld was. ↩︎