Tuesday, August 11, 2015

Storbritannia leder an innen datautvinning, potensiell gullgruve for landet og forskerne selv...

John Hattie fra New Zealand holder foredrag for fem millioner kroner i inngangspenger for et seminar, og selger bøker som varmt hvetebrød fordi han kan systematiske søk. Datautvinning kan brukes til mye og det kjente Cochrane Library er nå med i utviklingen av systematiske søk innen litteraturgjennomganger innen evidensbasert medisin som er fritt tilgjengelig i flere land. Campbell Collaboration driver også med systematiske søk slik som Cochrane Library, og brukes i stadig flere fagfelt som utdanningspolitikk, kriminalpolitikk, sosialpolitikk og internasjonal utvikling. Systematiske søk får stadig mer innflytelse på utdanningspolitikken i Norge for eksempel. Systematiske søk har vært svært arbeidskrevende fordi man måtte ha brukt eksperter til å gå gjennom store mengder med artikler for å identifisere relevant litteratur og sjekke resultatene manuelt. En av fordelene med datautvinning er å automatisere disse prosessene slik at de som trenger det kan utføre systematiske søk omtrent som et Googlesøk, og det er det ContentMine prøver å utvikle. Fram til 2014 var dette praktisk talt juridisk umulig å drive datautvinning, men nå har alle i Storbritannia som har lovlig tilgang til å lese, også lovlig tilgang til datautvinning. Universitetene i Storbritannia har tilgang til "det meste", så det skal bli spennende utvikling framover. Anna H Noel-Storr ved University of Oxford, Nuffield Department of Clinical Medicine har foreslått å kombinere datautvinning med crowdsourcing i Data and text mining: the role of crowdsourcing. Det er lett å forestille seg at man kan få mange deltakere til slike crowdsourcing prosjekter dersom temaet fenger store befolkningsgrupper som rovdyrpolitikk, innvandringspolitikk, narkotikapolitikk, kjønn, effekten av vaksiner etc. Slik sett så kan forskere, interessegrupper, politikere eller folk flest, virkelig dra nytte av "massenes visdom" i kombinasjon med effektiv programvare. ContentMine er nå klar til å brukes, men foreløpig bare i Storbritannia på opphavrettslig beskyttet materiale. EU planlegger å gjennomføre opphavsrettsreformer for å følge Storbritannia på dette området. Det sier seg selv at dersom ContentMine og crowdsourcing virker så kan man spare samfunnet for store summer og det er kanskje derfor forlagene kjemper så innbitt imot datautvinning som kan bli deres nye gullgruve.

No comments:

Post a Comment