Hoe komt het dat spraakherkenningssoftware nu zo goed werkt?

Vorig artikel Volgend artikel
Hoe komt het dat spraakherkenningssoftware nu zo goed werkt?

Software voor spraakherkenning was lange tijd van een bedenkelijk niveau, maar heeft de laatste tijd een duidelijke verbetering laten zien. Zo meldt The Economist. De meeste moderne smartphones beschikken volgens het magazine nu immers over een scala aan spraakgestuurde functies die echt goed werken.

Niet alleen beheersen programma's zoals Google Now of Siri beperkte opdrachten, zoals het vinden van een restaurant of het vormen van een telefoonnummer, maar zijn ze ook veel verfijnder geworden in vrije spraakherkenning, zoals het verwerken van gedicteerde tekstberichten of e-mails.

"De povere prestaties van spraakherkenning bleken de stelling te bevestigen dat computers bijzonder veel moeilijkheden ondervinden met handelingen die voor mensen gemakkelijk zijn uit te voeren en vice-versa," aldus The Economist. "Nagenoeg ieder woord kan aan het begin van een zin worden geplaatst. Daardoor kunnen zinnen met een variatie van tienduizenden woorden beginnen, zodat eindeloze variaties kunnen worden gevormd."

"Geconfronteerd met die variabelen, gekoppeld aan de beperkte geluidskwaliteit door goedkope microfoons, ruis en compressie, kan beseft worden dat een degelijke vertaling quasi onmogelijk was."

Maar de ontwikkelaars van spraaktechnologie hebben antwoorden gevonden op de eerdere problemen. "Woorden verschijnen in een zin immers niet in een willekeurige volgorde, zodat de computer niet voor elk gesproken woord door een oneindig woordenboek dient te bladeren. In plaats daarvan bekijkt de software de waarschijnlijkheid van de uitgesproken klanken binnen een kader van de omgevende woorden."

De software kan daarbij gebruik maken van een uitgebreid digitaal register, eventueel aangevuld met persoonlijke informatie van de individuele gebruiker, zoals namen in het adresboek of steden in de omgeving van zijn actuele locatie.

"De vroegere vormen van computer-gestuurde vertalingen probeerden vooral de grammatica en de betekenis van een zin te ontleden en opnieuw in de nieuwe taal op te bouwen. De moderne systemen daarentegen werken met de waarschijnlijkheid dat een uitspraak in de originele taal overeenkomt met een entiteit in de doeltaal, gebaseerd op praktisch taalgebruik waarmee de computer is getraind. Statistische modellen kunnen daarbij vergissingen corrigeren."

Computers kunnen hun nut voor de mensheid opdrijven naarmate ze meer over de mens leren, zowel collectief als individueel. Steeds crucialer wordt daarbij echter de vraag hoeveel persoonlijke informatie het individu wenst vrij te geven in ruil voor de verbeterde dienstverlening.

Dominique Dewitte

Dominique Dewitte is hoofdredacteur en mede-uitgever van het in Belgie populaire zakenportaal Express.be. Daarnaast is hij schrijver van boeken en publiceert...

Reageren is uitgeschakeld omdat er geen cookies opgeslagen worden.

Cookies toestaan Meer informatie over cookies