Schenk je sms’jes aan de wetenschap
Belgische taalonderzoekers zijn op zoek naar 200.000 sms"jes. "Afkortingen, dialect of pikante praat: het mag allemaal."
Onderzoekers van de Hogeschool Gent en de KULeuven verzamelen al jaren geschreven woorden. De teller staat op 500 miljoen. “We hebben teksten gehaald uit vonnissen, handleidingen, kranten en boeken,” zegt Veronique Hoste van de Hogeschool Gent, “maar ook sociaalnetwerksites, blogs en sms"jes hebben een grote invloed. Teksten van websites kunnen we zelf verzamelen, maar voor sms"en hebben we de hulp van de schrijvers nodig.”
De onderzoekers willen eind november minstens 200.000 berichten bij elkaar hebben. “Deelnemers hoeven zich geen zorgen te maken over hun privacy. We zijn niet geïnteresseerd in de inhoud. De berichten worden anoniem gemaakt en op een hoop gegooid.”
Voor spraakcomputer
Via de verzameling stellen ze modellen op voor technologische toepassingen. “Daarmee kun je bijvoorbeeld een sms omzetten naar standaardtaal die een spraakcomputer kan voorlezen. Momenteel krijg je door alle afkortingen en dialectwoorden nog onbegrijpelijk gebrabbel.”
“Heel wat mensen zeggen op Facebook of Twitter wat ze vinden van een bepaald product. Dat is nu niet te verwerken, maar met onze taaltechnologie zou je automatisch alle commentaren over bijvoorbeeld de nieuwe iPhone kunnen verzamelen.”
Belgische taalonderzoekers zijn op zoek naar 200.000 sms"jes. "Afkortingen, dialect of pikante praat: het mag allemaal."
Onderzoekers van de Hogeschool Gent en de KULeuven verzamelen al jaren geschreven woorden. De teller staat op 500 miljoen. “We hebben teksten gehaald uit vonnissen, handleidingen, kranten en boeken,” zegt Veronique Hoste van de Hogeschool Gent, “maar ook sociaalnetwerksites, blogs en sms"jes hebben een grote invloed. Teksten van websites kunnen we zelf verzamelen, maar voor sms"en hebben we de hulp van de schrijvers nodig.”
De onderzoekers willen eind november minstens 200.000 berichten bij elkaar hebben. “Deelnemers hoeven zich geen zorgen te maken over hun privacy. We zijn niet geïnteresseerd in de inhoud. De berichten worden anoniem gemaakt en op een hoop gegooid.”
Voor spraakcomputer
Via de verzameling stellen ze modellen op voor technologische toepassingen. “Daarmee kun je bijvoorbeeld een sms omzetten naar standaardtaal die een spraakcomputer kan voorlezen. Momenteel krijg je door alle afkortingen en dialectwoorden nog onbegrijpelijk gebrabbel.”
“Heel wat mensen zeggen op Facebook of Twitter wat ze vinden van een bepaald product. Dat is nu niet te verwerken, maar met onze taaltechnologie zou je automatisch alle commentaren over bijvoorbeeld de nieuwe iPhone kunnen verzamelen.”