Nieuws

Microsoft deelt dataset om computers te leren lezen

Machines moeten in de toekomst ook complexe, genuanceerde vragen kunnen begrijpen. Microsoft helpt een handje door een dataset van 100.000 vragen en antwoorden beschikbaar te maken.

 
Computers kunnen al verrassend goed beelden herkennen en spraak begrijpen. Op het gebied van leesvaardigheden hebben ze echter een achterstand opgelopen, en dat wilt Microsoft verhelpen. Het bedrijf maakt gratis oefenmateriaal beschikbaar onder de naam MS MARCO, waarmee ontwikkelaars computers kunnen trainen om beter te lezen en vragen te beantwoorden.

Te genuanceerd

Volgens onderzoeker Rangan Majumder kunnen intelligente systemen, zoals virtuele assistent Cortana, op dit moment enkel concrete antwoorden bieden. Ze kunnen rekensommen oplossen, opzoeken op welke dag Kerstmis valt of je vertellen hoe oud de koning is. Bij meer genuanceerde vragen, verwijzen ze de gebruiker naar een lijst met zoekresultaten. Zelf kunnen machines vaak niet begrijpen hoe ze naar het antwoord moeten zoeken, bijvoorbeeld omdat de intentie van de vraag niet helemaal duidelijk is of omdat meerdere antwoorden worden verwacht.

MS MARCO

Met het gratis oefenmateriaal wilt Microsoft machines leren om complexe vragen te herkennen en even complexe antwoorden te formuleren. De trainingset heet MS MARCO (‘Microsoft Machine Reading Comprehension’) en bestaat uit 100.000 vragen en antwoorden, gebaseerd op geanonimiseerde gebruikersverzoeken aan Bing en Cortana. Zulke data kan gebruikt worden in machine learning-modellen om machines meer nuance aanleren. Om bijvoorbeeld een antwoord te geven op de vraag “Wat aten de oude Grieken?” moet de machine weten dat de gebruiker een meerledig antwoord wilt, en het dus een antwoord op verschillende pagina’s moet zoeken. Zo kan het een antwoord geven als “Graan, melk, vis, olijven” in plaats van simpelweg “Graan”.
 
“Aangezien veel kennis op de wereld in schriftelijke vorm bestaat, biedt het veel mogelijkheden wanneer we machines even goed documenten kunnen leren lezen en begrijpen als mensen,” zegt Majumder. Door MS MARCO publiek beschikbaar te maken, hoopt Microsoft bovendien dat een doorbraak kan worden gemaakt. De gebrekkige leesvaardigheid van machines is geen probleem dat één bedrijf kan oplossen, besluit hij.
 
//www.smartbiz.be/qa/169060/qa-wat-machine-learning/

Gerelateerde artikelen

Volg ons

Ga jij apps uit alternatieve appstores installeren?

  • Nee, App Store of Play Store is goed genoeg (57%, 109 Votes)
  • Alleen als ik een app écht nodig heb (29%, 56 Votes)
  • Ja, ik wil apps van andere bronnen installeren (14%, 27 Votes)

Aantal stemmen: 194

Laden ... Laden ...
69% korting + 3 maanden gratis

69% korting + 3 maanden gratis

Bezoek NordVPN

Business