Robot met supergehoor (video)

In de dagelijkse kakofonie van geluid om ons heen kan het menselijk gehoor feilloos een enkele geluidsbron eruit pikken en zich daar op richten. Zo kunnen we een gesprek volgen in een relatief lawaaiige omgeving. Ook vertellen kleine geluiden ons dingen over de wereld om ons heen. Een zachtjes dichtvallende deur maakt ons er bijvoorbeeld op alert dat onze partner thuiskomt. Honda Research Institute heeft nu een robot ontwikkeld die de wereld van geluid om zich heen kan begrijpen.

De HEARBO (Hearing Bot) is een robot die ontwikkeld is in het Honda Research Institute in Japan. De taak van de robot is om de geluiden om zich heen te interpreteren. Op de internationale IEEE-bijeenkomst dit jaar over intelligente robots en systemen werden verschillende publicaties gepresenteerd die HEARBO’s functionaliteiten beschrijven.

Robot luistert aandachtig

Met de droom van een futuristische robotbutler in het achterhoofd, proberen onderzoekers de robots stemcommando’s te laten herkennen van een paar meter afstand. Normaliter wordt dit gedaan met een methode die ‘beamforming’ heet. Hiermee wordt een geluidsopname gemaakt van een pratend persoon, en na enkele ruisfilters wordt er een spraakherkenningsalgoritme op losgelaten.

3-stappensysteem

HEARBO gaat een stapje verder dan de ‘beamforming’ techniek die tot nu toe veel gebruikt is. De robot kan zelfs een geluid herkennen als de tv aanstaat, de kinderen in een hoek aan het spelen zijn en de deurbel gaat. De onderzoekers doen dit met een 3-stappensysteem: lokalisatie, scheiding en herkenning. Dit systeem, HARK genoemd, kan geluiden herkennen uit een mix, gebaseerd op waar in een ruimte het geluid vandaan komt.

Belangrijke ruis

De gedachtegang van de onderzoekers is dat je niet simpelweg ‘ruis’ moet wegfilteren, omdat de definitie van ruis afhankelijk is van de situatie. Een huilende baby bijvoorbeeld kan aangeduid worden als ruis, of juist heel belangrijke informatie geven in bepaalde situaties.

Voorbeeld

In de video hieronder is HEARBO omgeven door drie geluidsbronnen: een piepende wekker, een luidspreker met muziek en een persoon die aan het praten is. De robot kan feilloos zijn aandacht één voor één op de locatie van de verschillende geluidsbronnen richten. HEARBO kan dus het verschil horen tussen een mens van vlees en bloed die commando’s geeft en een zang- of spreekstem op de radio.