Artificial intelligence
Spraakherkenning

Gebruik spraakherkenning efficiënt in klantenservice

We zullen u laten zien hoe spraakherkenningssoftware vandaag zijn weg vindt in ons dagelijks leven en waar we het in de toekomst waarschijnlijk vaker zullen tegenkomen.

Alexa, Siri, Cortana, Bixby of de Google Assistent vinden steeds vaker hun weg naar onze privé- of zakelijke omgeving. Of het nu gaat om smartphones, voor het bedienen van elektronische apparaten thuis of voor online onderzoek of winkelen, deze worden vandaag al gebruikt. De intelligente stemassistenten openen steeds meer gebieden.

We zullen verduidelijken wat spraakherkenning eigenlijk betekent, hoe het werkt en op welke gebieden het zal worden gebruikt en het in de toekomst zal vinden. We richten ons op het commerciële gebruik van deze innovatie en benadrukken de belangrijkste voordelen van spraakherkenningssoftware.

Maar laten we eerst eens kijken naar de algemene werking van spraakherkenning en ons wijden aan de conceptuele classificatie en afbakening. Dit dient voor een beter begrip en een eerste benadering van een zeer complex onderwerp. Maar laten we snel beginnen, in de fascinerende wereld van spraakherkenning.

Inhoud 

Wat is spraakherkenning?
Hoe spraakherkenningssoftware werkt
Technische manier om spraakherkenning te verwerken
Gebruik van spraakherkenning in de praktijk
Gegevensbescherming voor intelligente stemassistenten
De toekomst van spraakherkenning
Conclusie - spraakherkenning is net begonnen

Wat is spraakherkenning? - een definitie

Spraakherkenning maakt deel uit van de toegepaste informatica, evenals engineering en computerlinguïstiek. De kern is de ontwikkeling van procedures voor systematische data-acquisitie en verwerking van gesproken taal. In tegenstelling tot spraakherkenning gaat het niet om het identificeren van een persoon, maar eerder om het herkennen van de betekenis van een uitspraak.

Geschiedenis van spraakherkenning

Verschillende onderzoeksgroepen probeerden spraakherkenningssystemen al in de jaren zestig, maar zonder noemenswaardig succes. De technische mogelijkheden en het begrip van het nieuwe veld waren toen te beperkt.

In de jaren tachtig kreeg het veld vervolgens een boost waarin werd erkend dat homofoons (d.w.z. woorden met hetzelfde geluid, met verschillende betekenissen) van elkaar konden verschillen door contextcontroles. In het begin van de jaren 1990 was het IBM die op CeBit in Hannover een systeem presenteerde dat tussen de 20.000 en 30.000 Duitse woorden kon herkennen.

Na veel verdere ontwikkelingsstappen introduceerde Apple in 2011 Siri, een stem assistent voor iedereen. Alle andere smartphonefabrikanten hebben dit voorbeeld gevolgd, zodat de ontwikkeling van spraakherkenningssystemen weer sneller gaat, vooral in de afgelopen 5 jaar.

Hoe spraakherkenningssoftware werkt

Om te begrijpen hoe spraakherkenning eigenlijk werkt, is het de moeite waard om een kijkje te nemen naar de basisuitdagingen die moeten worden overwonnen. We spreken dus een tijdje continu, d.w.z. zonder een herkenbare pauze tussen afzonderlijke woorden. Spraakherkenningssystemen hadden dus hun problemen, maar kunnen nu vloeiend spreken begrijpen.

De grootte van de woordenschat is ook een grote hindernis, terwijl Engels gemiddeld minder woorden gebruikt, worden bijna vier keer zoveel woorden in het Duits gesproken. Bovendien is de variatie van afzonderlijke woorden een hindernis: bij eindes of voorvoegsels enz. Verandert een woord snel van betekenis.

Dit alles moet correct worden herkend door de spraakassistent om echte toegevoegde waarde te produceren. Het probleem met homofoons was in de jaren zestig al een probleem voor onderzoekers, maar het is opgelost. Dialecten en sociolecten vormen echter een andere uitdaging, waarmee ook rekening moet worden gehouden.

Technische manier om spraakherkenning te verwerken

Op technisch niveau wordt spraakherkenning soms geïmplementeerd in twee verschillende hoofdstappen. Allereerst is er de voorbewerking, waarbij de analoge spraaksignalen worden onderverdeeld in afzonderlijke frequenties. De daadwerkelijke detectie volgt dan. Voor dit doel worden akoestische modellen, woordenboeken en taalmodellen gebruikt.

Voorbewerking voor spraakherkenning

De voorbewerking van de spraaksignalen vindt ook plaats in verschillende substappen. Deze kunnen in wezen als volgt worden benoemd:

  • Scannen
  • Filteren
  • Transformatie van het signaal
  • Creatie van de feature vector

Grof gezegd is de eerste stap het analoge signaal om te zetten in een digitale bitreeks en het vervolgens te filteren op ruis. Vervolgens wordt het signaal getransformeerd met behulp van FFT en wordt het zogenaamde frequentiespectrum verkregen. Een functievector wordt ook gemaakt op basis van afhankelijke en onafhankelijke functies.

Herkenning van het spraaksignaal

Verschillende modellen worden gebruikt voor de eigenlijke spraakherkenning. Op dit punt moet het Hidden Markov-model worden genoemd, dat zoekt naar fonemen die het beste overeenkomen met het ingangssignaal. Om dit te doen, wordt het signaal opgesplitst in ten minste drie verschillende delen. Het begin, afhankelijk van de lengte, het middelste gedeelte en het einde.

Het ingangssignaal wordt nu vergeleken met opgeslagen secties en er wordt gezocht naar mogelijke combinaties. Door de rekenkracht van moderne pc's te vergroten, kan de methode vandaag ook worden gebruikt om een continu signaal te detecteren. Andere benaderingen proberen de spraaksignalen toe te wijzen via neurale netwerken of spraakmodellen.

Gebruik van spraakherkenning in de praktijk

We hebben nu aangetoond, zij het grofweg, hoe spraakherkenningssystemen technisch functioneren. De vraag waar deze systemen worden gebruikt en hoe bedrijven er uiteindelijk van kunnen profiteren, is echter veel spannender. Om dit te doen, willen we eerst kijken naar kant-en-klare voorbeelden en vervolgens naar de opties in de toekomst kijken.

Praktische voorbeelden van spraakherkenning

Er zijn in de praktijk al talloze toepassingsvoorbeelden van spraakherkenningssystemen. Sommige zijn ons allemaal bekend, andere zijn exclusiever. Wij presenteren u de belangrijkste.

Siri van Apple

Bijna alle grote fabrikanten bieden nu hun eigen persoonlijke intelligente assistent. Apple begon met de stem assistent Siri. Eind 2016 ontving Siri al meer dan 2 miljard aanvragen per week. Dus de gebruikers hebben het systeem al lang geïntegreerd in hun dagelijks leven.

Alexa van Amazon

Maar niet alleen Apple heeft een spraak assistent geïmplementeerd. Met Alexa heeft Amazon het waarschijnlijk meest bekende systeem op de markt gebracht. Spraakopdrachten worden ontvangen en verwerkt via een luidspreker. Gebruikers kunnen bijvoorbeeld muziekverzoeken uitdrukken die Alexa vervolgens speelt. Maar Alexa heeft ook toegang tot verschillende services van derden, dus zelfs pizza bestellen via Alex is geen probleem meer.

Hallo Magenta van Deutsche Telekom

In 2019 waagde een Duitse aanbieder zich ook op de markt voor spraak assistent. Met Hello Magenta lanceerde Deutsche Telekom een intelligente op internet gebaseerde luidspreker die werd ontwikkeld in samenwerking met het Fraunhofer Institute for Digital Media Technology.
Het speciale ding, volgens Telekom, zijn de servers voor verwerking in Duitsland. Dit is met name relevant voor de wetgeving inzake gegevensbescherming, zoals we later zullen zien.

Google Assistent

Google gebruikt niet alleen zijn eigen diverse diensten voor zijn intelligente assistent, maar verleent ook externe leveranciers hun producten en diensten daarin te integreren. De assistent leert wat hem onderscheidt van veel andere systemen. Op basis van eerdere zoekopdrachten kan de assistent verdere vragen beantwoorden.

Het systeem kan zelfs vragen over het schermoppervlak op Google Pixel-smartphones beantwoorden. Google is ook van plan om de assistent uit te breiden zodat deze toegang heeft tot huishoudelijke apparaten. In de toekomst moeten bijvoorbeeld deuren, luiken, douches, waterkokers enz. worden bediend met een spraakopdracht.

Een groot probleem dat zich altijd voordoet in verband met dergelijke taalassistenten, is gegevensbescherming. Laten we dit onderwerp en de huidige kritiek dus concreet bekijken.

Gegevensbescherming voor intelligente stemassistenten

Er is altijd kritiek op de gegevensbescherming van intelligente stemassistenten. Google evalueert bijvoorbeeld ongeveer 0,2% van alle audio-opnamen, zelfs zonder dat het activeringswoord "Ok, Google" wordt genoemd. Amazon kreeg onlangs ook kritiek toen bekend werd dat werknemers voortdurend zoekopdrachten evalueren om spraakherkenning uit te breiden. Alexa ontving daarom herhaaldelijk de Big Brother Award, een negatieve prijs. 

Gegevens in de Amazon-cloud worden bijvoorbeeld permanent opgeslagen als u deze niet zelf in het gebruikersprofiel verwijdert. Gegevens die via Alexa bij externe providers terechtkomen, kunnen zelfs voor een onbeperkte periode worden opgeslagen. Dit is niet compatibel met de AVG van de EU, en daarom moet Telekom andere wegen inslaan.

De servers van Deutsche Telekom voor het verwerken van de zoekopdrachten bevinden zich in Duitsland en moeten de richtlijnen voor gegevensbescherming die hier van toepassing zijn naleven.

De gegevens van Hello Magenta worden maximaal 90 dagen bewaard en kunnen door de gebruiker op elk gewenst moment worden verwijderd met behulp van de Magenta-app. Bovendien is er geen commercieel gebruik van de gegevens gepland.

De toekomst van spraakherkenning

Dus waar gaat de reis met spraakherkenning naartoe en welke technologieën zal het mogelijk uitbreiden? Nogmaals, het is de moeite waard om een kijkje te nemen bij de grotere op de markt. Amazon, Google of Apple werken momenteel aan vele andere opties om spraakherkenning uit te breiden naar andere velden en ze nog intelligenter te maken.

Herken emoties naast spraak

Naast de taal wil Amazon ook de emotie van de gebruiker herkennen en zijn systemen dienovereenkomstig laten reageren. Het is de bedoeling om een armband met kleine microfoons op de markt te brengen, die vervolgens de respectieve emotie van de spreker eruit kan filteren en dienovereenkomstig kan reageren. Of zo'n armband echt op de markt komt, is vandaag nog onduidelijk. Het patent hiervoor is echter al in 2017 aangevraagd.

Knight Rider wordt realiteit

Na controle over het huis, zullen Google en Amazon in de toekomst ook spraakbesturing in de auto aanpakken. Vooral hier is er grote behoefte aan stembesturing, gezien het feit dat handen aan het stuur en ogen op de weg moeten zijn. Stuur spraakberichten via WhatsApp, wijzig radiostations of zoek naar het dichtstbijzijnde benzinestation. Dit alles zou in de toekomst mogelijk moeten zijn met stemassistenten.

Automatische telefonie

Ethische problemen hebben ook geleid tot een recente aankondiging van Google waarin een spraakassistent werd geïntroduceerd die automatisch kon bellen. Voor zover er geen reden tot bezorgdheid is, klaagt de assistent zo oprecht dat het live publiek niet kon zien aan welk einde van het gesprek iemand zat en op welke computer.

De stemassistent was zo bedrieglijk echt dat je als gesprekspartner niet merkt of je tegen een machine of een andere persoon praat. Dat roept vragen op. Hoe wilt u met dergelijke technologieën omgaan? Er zijn volledig nieuwe velden en ontwerpopties voor het bedrijfsleven en vooral voor klantenservice.

Maar moet kunstmatige intelligentie zich van tevoren als zodanig identificeren? Deze vragen moeten nog worden opgehelderd. Maar innovaties hebben dergelijke vragen altijd opgeroepen. Er was ook geen verkeersregels voor de auto.

Conclusie - spraakherkenning is net begonnen

De toepassingsvoorbeelden voor spraakherkenningssystemen zijn bijna eindeloos. Spraakherkenning heeft de kinderkamer allang verlaten, maar staat nog steeds aan het begin. In de toekomst zullen spraakherkenningssystemen steeds meer worden gebruikt, zowel privé als zakelijk.

Dit betekent dat verschillende zoekopdrachten, bestellingen of e-mail al met een spraakopdracht kunnen worden uitgevoerd of opgevraagd. Stel je bijvoorbeeld een CRM-systeem voor waarin klantgegevens kunnen worden ingevoerd met een spraakopdracht. Een goede gelegenheid voor veldmedewerkers om de stamgegevens onderweg te onderhouden.

Ook op de klantenservice kunnen initiële verzoeken worden geaccepteerd en verwerkt door de spraakassistent. Op deze manier kunnen de werknemers meer tijd nemen voor intensieve discussies en de klant op de best mogelijke manier verzorgen.

Lees meer over:
on-premises

Dit is hoeveel het kost om een on-premises CRM-systeem te kopen

De kosten van een CRM-project spelen voor veel bedrijven een belangrijke rol. Lees hier hoeveel een lokaal systeem kost.

Lees verder
on-premises

Zijn uw gegevens veilig in een on-premises CRM-systemen?

Bedrijven kiezen vaak om redenen van gegevensbescherming voor een lokaal CRM-systeem. Hier leest u of de data echt veiliger zijn.

Lees verder