DCASE.

Op 16 en 17 november vond DCASE plaats in München, dé workshop voor Detection and Classification of Auditory Scenes and Events. Wetenschappers uit allerlei hoeken en vakgebieden kwamen samen om de resultaten te bespreken van de challenge die was uitgezet: “Wie kan als beste met behulp van een computermodel geluiden en geluidsomgevingen herkennen”?

De DCASE challenge werd voor de tweede achtereenvolgende keer uitgezet om onderzoekers aan te moedigen moeilijke problemen op te lossen die te maken hebben met ‘alledaagse geluiden’: geluid dat overal om ons heen aanwezig is, soms buiten en soms binnenshuis, en in allerlei klassen en omgevingen onder te brengen is. Bijvoorbeeld: het rinkelen van kopjes, het slaan met een deur, of een auto die voorbij rijdt. Al die geluiden komen in ons dagelijks leven voor, vaak op een specifieke plek of tijd. Het is een hele uitdaging om met behulp van algoritmes dit soort geluiden of geluidsomgevingen te herkennen. Wat voor onze oren een peuleschil is zorgt voor de grootst mogelijke problemen wanneer we het willen automatiseren. Bijvoorbeeld wanneer het in een opname een klein beetje waait, of er veel geluiden tegelijk hoorbaar zijn.

Het doel van de DCASE workshop is om elkaar uit te dagen het beste te presteren op vier vastgelegde challenges: Het herkennen van de hele geluidsomgeving, het herkennen van zeldzame geluiden, het herkennen van alle geluiden in een alledaagse omgeving, en het herkennen van geluiden die te maken hebben met transportatie (bijvoorbeeld voor zelfrijdende auto’s). Elke challenge vereist weer een andere aanpak, en elk probleem wordt vergezeld van een set van geluiden als trainingsmateriaal, waarmee deelnemers een computermodel moeten ontwikkelen die de taak aflegt. Daarna wordt het model opgestuurd en door de organisatoren getoetst met nieuwe geluiden. Degene die het beste scoort op die nieuwe geluiden wint de challenge.

Het is goed dat onderzoekers op deze manier aangespoord worden om problemen in de echte wereld op te lossen, en het competitieve karakter zorgt voor leuke inzendingen. Zo was er onder de inzendingen een onderzoek gepresenteerd dat met neuro-evolutie geluiden probeert te herkennen. De meeste winnaars hebben uiteindelijk veel inspiratie geput uit onderzoek naar visuele herkenning. De laatste jaren zijn in dat vakgebied enorme vooruitgangen geboekt, die nu langzaam doorsijpelen naar geluidsherkenning. Al met al heb ik veel inspiratie opgedaan in München. Het is op de eerste plaats belangrijk om betrokken te blijven bij het onderzoeksgebied waarin je wilt innoveren, maar bovendien is het superleuk om anderen te spreken die net zo enthousiast worden als jij, over zo’n leuk onderwerp als geluid :-).

Benieuwd naar de resultaten? Die vind je hier.

Arryon

Leave a comment: