In opdracht van NS-reizigers heeft SoundAppraisal belevingsonderzoek gedaan in treinen. De vraag was 1) hoe groot was de rol van geluid en 2) wat maakt een reis comfortabel en wat onaangenaam. De onderzoek omvatte geluidsopnamen met belevingsinformatie via de MoSART-app en een uitgebreide signaalanalyse om signaalcomponenten te koppelen aan hoe reizigers de treinreis beleven. Hiervoor hebben we een deel van de resultaten in een aantal diagrammen samengevat.
Kleurcodering: In alle plaatjes is gebruik gemaakt van de normale verkeerslicht codering
- Groen: altijd goed
- Geel + oranje: uitkijken, meestal OK, of op de grens
- Rood: te vermijden, of over de grens
Na deze sectie worden de signaal beschrijvingen (zoals “Short FG_tones”) nader uitgelegd in een tabel.
Perceptuele organisatie
Er lijken verschillende perceptuele domeinen te zijn. Eigenlijk zijn die al intuïtief bekend omdat we er woorden voor hebben: ‘gebabbelʼ, ‘geroezemoesʼ, ‘rumoerʼ, ‘herrieʼ/‘chaosʼ. Het leuke van dit project is dat we duidelijke aanwijzingen krijgen wanneer en waarom we van het ene domein naar het andere gaan.
Figuur 1: Verschillende perceptuele domeinen georganiseerd volgens de prevalentie van spraak en treingeluid. De schuine balken geven een interactie effect aan tussen spraak en treingeluid.
Figuur 1 geeft de belangrijkste perceptuele domeinen aan die we uit de data lijken te halen. Voor elk van de domeinen hebben we al passende namen en dat suggereert dat het het nauw aansluit bij intuïties. Wanneer een balk schuin getekend is geeft dat aan dat een een interactie effect is tussen de trein en de spraak. Uit de data krijgen we hier aanwijzingen voor. Maar om daar meer over te zeggen is gerichter onderzoek nodig. Op zich zit hier niet zo veel nieuws in. Het is allemaal nogal voorspelbaar. Het vernieuwende zit in de volgende figuur.
Figuur 2: Link met signaal componenten. De verschillende signaal descriptoren (zie tabel hieronder) die we hebben ontwikkeld zijn indicatief voor de perceptuele organisatie.
Figuur 2 geeft aan welke signaal descriptoren indicatief zijn voor de verschillende perceptuele domeinen. FG verwijst naar ForeGround (voorgrond) en trekt gemakkelijk aandacht omdat het ruim luider (>12 dB) is dan de achtergond. BG verwijst naar BackGround’ (achtergrond) en omdat ze amper (<6 dB) boven de achtergrond uitkomt trekt het minder aandacht. Lange tonen zijn langer dan 250 ms en korte tonen korter.
In de praktijk is er altijd een combinatie van de descriptoren. Bijvoorbeeld bij goed verstaanbare gesprekken horen lange voorgrond tonen (Long FG tones) maar dat gaat ook altijd gepaard met de korte variant (Short FG tones). Bij geroezemoes zijn er veel Short FG tones, maar ook veel Short BG_tones. Lange voorgrond tonen (Long FG tones) worden door het geroezemoes opgebroken en komen veel minder voor. De overgang naar rumoer treedt op als mensen over elkaarʼs spraak heen proberen te komen (Lombard reflex) en dan komen er veel Loud FG_tones.
Het plaatje heeft in de x-as (treingeluid) richting te maken met de ontwikkeling van het achtergrond (trein)geluid en het steeds luider en complexer worden daarvan. Veel trein geluid houdt in dat het niet meer gemakkelijk te negeren valt. Doordat treinen machinaal geluid produceren zitten er veel relatief lang durende tonen in de achtergrond.
In de y-richting (spraakrichting) heeft het te maken met verstaanbaarheid als functie van het aantal sprekers. In de diagonale richting (van linksonder naar rechtsboven) gaat het om de interactie effecten tussen spraak en treingeluid. Hier wordt in de volgende sectie nader op ingegaan.
Interpretatie van de verschillende componenten
Component Interpretatie
Loud Long FG_tone | Luide spraak (deels dicht bij de tablet) en alarm signalen, |
---|---|
MeanEdBE> 70, meanFGBG>12 dB en duur > 250ms | |
Loud short FG_tone | Typisch de toppen (formanten en laagste harmonischen) van Lombard spraak) |
MeandBE> 70, meanFGBG>12 dB en duur < 250ms | |
Short FG_tone | Vooral goed verstaanbare spraak |
MeanFGBG>6 dB en duur < 250ms | |
Long FG_tone | Goed verstaanbare spraak componenten. Bijvoorbeeld van sprekers dicht bij de tablet. Wellicht ook prominente treincomponenten, typisch in frequentie veranderend, zoals bij optrekken van de trein. |
MeanFGBG>6 dB en duur > 250ms | |
Short BG_tone | Gemurmel (niet goed verstaanbare spraak) en achtergrond trein componenten, die of deels door spraak gemaskeerd worden, of veranderende trein componenten zijn zoals optredend bij het optrekken, afremmen en soms bij het openen en sluiten van duren. In het algemeen geven deze componenten kleuring aan de achtergrond wat vaak als plezierig wordt ervaren. |
MeanFGBG< 6 dB en duur < 250ms | |
Long BG_tone | Stationaire componenten in de trein. Dest te complexer het treingeluid des te meer van dit soort componenten voor zullen komen. |
MeanFGBG< 6 dB en duur > 250ms |
Figuur 3 geeft aan hoe de verschillende domeinen samenhangen met het aantal sprekers en het treingeluid. Dit is weergegeven vanuit het perspectief van een reiziger. De eigen spraak met een gesprekspartner is dichtbij en daarom vrij luid (en binnen de galmstraal). De spraak van anderen is verder weg (en buiten de galmstraal). De eigen spraak kan daarom luid worden opgenomen door de tablet.
Intermezzo: “galmstraal”
De galmstraal is een maat voor de bijdrage van ruimteakoestiek bij het geluid dat de oren opvangen. Binnen de galmstraal is het directe geluid van een spreker (hier typisch de reisgenoot) dominant, buiten de galmstraal is de som van alle reflecties van het geluid sterker dan het directe geluid (overige reizigers en de trein zelf). In een trein is de galmstraat idealiter in de orde van de afstand tussen twee zitplaatsen tegenover elkaar, zeg een tot 2 meter. Een te klein galmstraal houdt in dat sprekers elkaar niet gemakkelijk kunnen verstaan. Wordt het te groot dan zijn de andere gesprekken te verstaanbaar (en storend in een stilte coupé). En bovendien verliezen we dan een gevoel van privacy.
Wil de spraak van anderen goed verstaanbaar zijn, dan moet het een hoge voorgrond-achtergrond (FG/BG) ratio hebben. De blauwe lijn geeft aan dat de spraak een voldoende FG/BG ratio geeft als het erboven ligt. Rustig gebabbel ligt onder de noodzakelijke FG/BG ratio en is niet goed verstaanbaar. Een (luider) gesprek van iemand die de stem verheft (Lombard spraak) wel. Des te drukker het wordt, des te meer gaan sprekers elkaar maskeren en des te luider ze gaan spreken (weer Lombard spraak). Dan komen ze buiten het spraakblok en wordt het eerst als rumoerig (mogelijk ook gezellig) en later chaotisch (onplezierig) ervaren. Hoe dan ook verlaagt het het treincomfort.
Aan de linkerkant, met weinig sprekers is er niet zo veel interactie tussen spraak en trein geluid, maar speelt er wat anders. Onder het niveau van spraak ligt een balk (in de figuur niet optimaal aangegeven) die je “Sense of Place” zou kunnen noemen. Hier zitten de subtiele geluiden die onze hersenstam nodig heeft om te bepalen of de plek veilig is. Dit deel laat ons ergens thuis voelen (of niet). Ook in een trein is dit belangrijk. Doodstil is niet goed, dat geeft geen indicatoren om veiligheid vast te stellen.
Naarmate de trein luider wordt, is er minder ruimte voor deze subtiele geluiden en dus voelen mensen zich minder verbonden met een veilige omgeving. Heel concreet: in een luidere trein kan je gemakkelijk van achter aangevallen worden omdat de trein de nadering van een aanvaller maskeert. Dat geeft mensen, hoe wel ze (op hoger cognitief niveau) echt wel weten dat dat niet gebeurt, een minder comfortabel (want minder veilig) gevoel.
Figuur 4 geeft de relatie aan tussen de verschillende signaal beschrijvingen en de interactie effecten tussen trein en sprekers. Het geeft aan waar in het signaalevidentie te vinden is voor een bepaald effect.
Bijvoorbeeld als lange en korte BG geluiden een hoge FG/BG ratio hebben, zoals links in Figuur 4, zijn ze zeer hoorbaar en gemakkelijk storend, zeker als ze ook veel voorkomen. Dan heeft de trein een complex geluid dat gemakkelijk (ongewenst) de aandacht trekt. Aan de rechterkant van Figuur 4 drukt het treingeluid, het geluid van de sprekers omhoog en krijgen we veel luide korte FG-tones. De omroep- en alarmsignalen zijn zo gemaakt dat ze daar weer bovenuit komen.
In het midden is een gebied met veel groen gedomineerd door een beperkt aantal short “BG_Tones”: deze dragen bij aan een aangename (inherent veilige) sense of place.
Automatische vaststelling van beleving
Bovenstaande houdt in dat we in staat zijn om een systeem te maken dat automatisch de reizigerbeleving in treinen kan voorspellen/meten. Een manier om dat te doen is om in MoSART gerichter te vragen hoe mensen het geluid ervaren: als stilte, rustig treingeluid, en alles ertussen tot rumoer en chaos. Hierna hebben we een stevige fundering om op basis van objectieve informatie te werken aan het verbeter van de reisbeleving in treinen.
Aanbevelingen over treinontwerp
HiFi
Het soundscape concept HiFi en LoFi (zoals hier in originele vorm geformuleerd) is een zinvol concept
The hi-fi soundscape is one in which discrete sounds can be heard clearly because of the low ambient noise level … In the hi-fi soundscape, sounds overlap less frequently; there is perspective – foreground and background … In a low-fi soundscape individual acoustic signals are obscured in an overdense population of sounds … Perspective is lost … there is no distance; only presence. There is cross-talk on all the channels, and in order for the most ordinary sounds to be heard they have to be increasingly amplified. (R. Murray Schaffer, Tuning of the World. p. 43. Destiny Books. 1993)
We maken onderscheidt tussen twee soorten geluiden: spraak- en treingeluiden. Met beide moet in de designfase rekening worden gehouden.
Spraak
- Voorkom dat mensen elkaar gaan overschreeuwen We verwachten dat wat meer akoestische demping in het spraak gebied helpt met het voorkomen van situaties waar men in drukte elkaar gaat overschreeuwen. Design technisch komt dit neer op het vergroten van de galmstraal (reverbration radius).
- Mensen willen elkaar wel horen, maar niet naar elkaar moeten luisteren Dit gaat deels over het zelfde punt. Maar nu ook met de nadruk op dat men elkaar wel wil blijven horen – zodat het auditieve systeem weet dat er andere mensen zijn die zich veilig voelen. De demping moet dus niet te groot worden.
Treingeluiden
- Stille treinen zijn goed Dit is nogal voor de hand liggend. Maar niet in eerste instantie omdat mensen zoveel moeite met geluid hebben. Het gaat veel meer over de Foreground-Background (FGBG) ratio die hoger wordt wanneer de trein stiller is.
- Een stille trein mag best gehoord worden Maar als de trein stil is, dan mogen er best componenten in de trein zitten die hoorbaar “treingeluiden” zijn. Dan weet het auditieve systeem waar het is en dat geeft ook een gevoel van veiligheid.
Kijk uit met alarmgeluid
- Alarmen en soortgelijke geluiden dragen niet bij aan het reiscomfort. Deels of grotendeels omdat ze gehoord worden door mensen die er geen behoefte aan of belang in hebben. Dit erodeert het effect van de alarmen, waardoor ze nog intrusiever worden gemaakt om nog aandacht te kunnen trekken. Een soort wapenwedloop die wellicht geen goed idee is.
- Bij achteruitrijdende trucks maken ze nu gebruik van richtbare (ruizige) alarm geluiden die veel minder intrusies zijn als je niet bent waar het alarm wellicht zinvol is.
- Het is ook mogelijk om alarmen adaptief te maken qua geluidsniveau. Dan zijn ze altijd goed hoorbaar omdat ze bijvoorbeeld 15 dB boven de lokale achtergrond zijn.
Als een trein niet stil, probeer het geluid te vereenvoudigen (tentatief)
- Luide treinen die ook nog eens veel verschillende componenten in het geluid hebben zijn belastender dan even luide treinen met een eenvoudiger spectrogram. Het maskeren van hoorbare pieken (foor het toevoegen van breedbandige ruis) kan wel eens effectief zijn in het verbeteren van de geluidskwaliteit van de trein.