Dragon TV: spraakbesturing op haar best
Mensen spraken vroeger alleen tegen hun computer als ze er hun woede op wilden koelen. Toch wordt spraakbesturing van gadgets steeds meer gemeengoed. Zeker nu Nuance onlangs de pratende tv heeft geïntroduceerd.
1. Spraakherkenning begon voor het eerst tot de verbeelding te spreken dankzij de film 2001: A Space Odyssey uit 1968, waarin de intelligente computer HAL niet alleen goed kon luisteren, maar ook in staat was om een natuurlijk, menselijk gesprek te voeren.
In de jaren zestig stond spraakherkenning echter nog in de kinderschoenen. Op de Wereldtentoonstelling van 1962 toonde IBM vol trots de Shoebox, een apparaat dat zestien Engelse gesproken woorden herkende.
2. De ontwikkeling van spraaktechnologie heeft altijd nauw samengehangen met de drang naar efficiëntere manieren om zoekopdrachten uit te voeren. In de jaren zeventig was het Amerikaanse ministerie van Defensie verantwoordelijk voor een eerste echte revolutie in spraakherkenning.
Na vijf jaar onderzoek kwamen ze met het spraaksysteem Harpy aanzetten, dat liefst 1.011 woorden herkende. Intussen veroverde George Lucas de wereld met het epische drieluik Star Wars, waarin de pruttelende robot C3PO een van de hoofdrollen vervulde.
3. Al in 1988 voorspelde Apple in het toekomstdocument ‘Knowledge Navigator’ dat spraaktechnologie gemeengoed zou worden in het jaar 2011. Wonder boven wonder hield het zich aan zijn eigen voorspelling met de introductie van Siri, de spraakassistent in de iPhone 4S. Overigens heeft spraakherkenning de afgelopen twintig jaar veel met voorspellen te maken gehad.
In plaats van elk opgenomen woord te vergelijken met een exacte overeenkomst in een database, werden onbekende geluiden gekoppeld aan het meest waarschijnlijke resultaat, beter bekend als het Hidden Markov-model. Hierdoor kon men zich veel meer richten op patroonherkenning en was het beter mogelijk om vreemde accenten en moeilijke stemmen te herkennen.
4. Het eerder genoemde Harpy zorgde voor een nieuw algoritme, het zogenoemde ‘beam search’, dat zich in plaats van op de meeste op de beste resultaten richtte. Het is ook niet verwonderlijk dat Google de spraakherkenningswereld een grote impuls gaf toen het zijn gesproken zoekapp Voice Search introduceerde voor de iPhone.
5. Hoewel het niet in de persberichten stond, is Siri gewoon een licht aangepaste applicatie van het bedrijf Nuance Communications. Al sinds de jaren zeventig heeft dit bedrijf ervaring met de ontwikkeling van spraak- en tekstherkenning, wat in 1997 leidde tot de allereerste spraakherkenningssoftware voor consumenten: Dragon NaturallySpeaking.
Sindsdien is zijn nauwkeurigheid dramatisch toegenomen, maar Nuance heeft meer voor ogen dan een dicteerprogramma. Op de CES-beurs 2012 in het Amerikaanse Las Vegas introduceerde het Dragon TV, ofwel spraakbediening voor een slimme televisie.
6. Spraakherkenning blijft trouwens niet beperkt tot pc’s, televisies en smartphones. Ford Sync, een onboard entertainmentsysteem dat dit jaar in Europa arriveert, is uitgerust met geavanceerde spraakbesturing.
Gevechtsvliegtuigen en helikopters zijn al langer uitgerust met spraaktechnologie, terwijl artsen het gebruiken om diagnoses te dicteren om hun handen vrij te hebben. En reken er maar op dat Google Android steeds meer in huishoudtoestellen zal integreren en die via domotica-apps de stem van hun eigenaars laten herkennen.
Mensen spraken vroeger alleen tegen hun computer als ze er hun woede op wilden koelen. Toch wordt spraakbesturing van gadgets steeds meer gemeengoed. Zeker nu Nuance onlangs de pratende tv heeft geïntroduceerd.
1. Spraakherkenning begon voor het eerst tot de verbeelding te spreken dankzij de film 2001: A Space Odyssey uit 1968, waarin de intelligente computer HAL niet alleen goed kon luisteren, maar ook in staat was om een natuurlijk, menselijk gesprek te voeren.
In de jaren zestig stond spraakherkenning echter nog in de kinderschoenen. Op de Wereldtentoonstelling van 1962 toonde IBM vol trots de Shoebox, een apparaat dat zestien Engelse gesproken woorden herkende.
2. De ontwikkeling van spraaktechnologie heeft altijd nauw samengehangen met de drang naar efficiëntere manieren om zoekopdrachten uit te voeren. In de jaren zeventig was het Amerikaanse ministerie van Defensie verantwoordelijk voor een eerste echte revolutie in spraakherkenning.
Na vijf jaar onderzoek kwamen ze met het spraaksysteem Harpy aanzetten, dat liefst 1.011 woorden herkende. Intussen veroverde George Lucas de wereld met het epische drieluik Star Wars, waarin de pruttelende robot C3PO een van de hoofdrollen vervulde.
3. Al in 1988 voorspelde Apple in het toekomstdocument ‘Knowledge Navigator’ dat spraaktechnologie gemeengoed zou worden in het jaar 2011. Wonder boven wonder hield het zich aan zijn eigen voorspelling met de introductie van Siri, de spraakassistent in de iPhone 4S. Overigens heeft spraakherkenning de afgelopen twintig jaar veel met voorspellen te maken gehad.
In plaats van elk opgenomen woord te vergelijken met een exacte overeenkomst in een database, werden onbekende geluiden gekoppeld aan het meest waarschijnlijke resultaat, beter bekend als het Hidden Markov-model. Hierdoor kon men zich veel meer richten op patroonherkenning en was het beter mogelijk om vreemde accenten en moeilijke stemmen te herkennen.
4. Het eerder genoemde Harpy zorgde voor een nieuw algoritme, het zogenoemde ‘beam search’, dat zich in plaats van op de meeste op de beste resultaten richtte. Het is ook niet verwonderlijk dat Google de spraakherkenningswereld een grote impuls gaf toen het zijn gesproken zoekapp Voice Search introduceerde voor de iPhone.
5. Hoewel het niet in de persberichten stond, is Siri gewoon een licht aangepaste applicatie van het bedrijf Nuance Communications. Al sinds de jaren zeventig heeft dit bedrijf ervaring met de ontwikkeling van spraak- en tekstherkenning, wat in 1997 leidde tot de allereerste spraakherkenningssoftware voor consumenten: Dragon NaturallySpeaking.
Sindsdien is zijn nauwkeurigheid dramatisch toegenomen, maar Nuance heeft meer voor ogen dan een dicteerprogramma. Op de CES-beurs 2012 in het Amerikaanse Las Vegas introduceerde het Dragon TV, ofwel spraakbediening voor een slimme televisie.
6. Spraakherkenning blijft trouwens niet beperkt tot pc’s, televisies en smartphones. Ford Sync, een onboard entertainmentsysteem dat dit jaar in Europa arriveert, is uitgerust met geavanceerde spraakbesturing.
Gevechtsvliegtuigen en helikopters zijn al langer uitgerust met spraaktechnologie, terwijl artsen het gebruiken om diagnoses te dicteren om hun handen vrij te hebben. En reken er maar op dat Google Android steeds meer in huishoudtoestellen zal integreren en die via domotica-apps de stem van hun eigenaars laten herkennen.