Friday, May 13, 2016

Dataparasitter: det ingen snakker om før nå og er problemene reelle?

Dataparasitter er betegnelsen på dem som scooper andres møysommelig innsamlede data og gjør forskning på dem. David Shaywitz, bidragsyter i Forbes har en interessant analyse i artikkelen "Data Scientists = Research Parasites?" av den ideelle verden vs. slik forskere flest reagerer på insentiver. Det er stor forskjell på "stated preferences" og "revealed preferences":


Michael Hoffman, computational genomicist at the Princess Margaret Cancer Centre, Toronto: “Fear that others may use data ‘to try to disprove what the original investigators had posited’ is a dangerous misunderstanding of science.”
In contrast, I was delighted to see this editorial.
Not because I agreed with it–my heart is truly with the data scientists–but because I was grateful that someone had the courage to articulate a perspective I’ve come to believe is shared by the vast majority of academic researchers, but publicly voiced by no one–until now.
The result: a classic case of stated preference vs. revealed preference, where every academic researcher dutifully claims to be interested in sharing their data widely and freely, but somehow, tend not to actually do this.
Men akkurat som bekymringene med å finansiere open access tidsskrifter nå kan vise seg å være et ikke-problem (Elsevier krever forfatterbetaling for bare 37 prosent av rene open access tidsskrifter, og De Gruyter bare 2 prosent), eller at krav om CC-BY lisen ikke er noe stort problem, så kan det hende at problemet med å dele data i praksis ikke er så problematisk som mange vil ha det til. I en grundig diskusjon i ASH Clinical News har man ikke funnet noe tilfeller av scooping:
However, none of the sources ASH Clinical News spoke with had heard of any incidents of data theft, and Dr. Prasad said a PubMed literature search he conducted for the term “data parasite” yielded no results. That’s not to say that they don’t exist. By the definition provided by Drs. Longo and Drazen, anyone who has ever used and built upon pre-existing research could be considered a “data parasite.” 
Det ser ut til at de fleste motforestillinger mot åpen vitenskap er spørsmål som lar seg løse. Ryan Merkley, CEO i Creative Commons, er etter min oppfatning muligens inne på det avgjørende spørsmålet med å sitere Obamas nylige tale om byen Flint som var rammet av bly i drikkevannet, der Obama sier:


“So it doesn’t matter how hard you work, how responsible you are, or how well you raise your kids — you can’t set up a whole water system for a city. That’s not something you do by yourself. You do it with other people. You can’t hire your own fire department, or your own police force, or your own army. There are things we have to do together — basic things that we all benefit from.”


Problemet er å finne bedre måter å jobbe på enn "parachute research". Som jeg tolker Obama så spiller det ingen rolle hvor effektive insentivene er så lenge det ikke løser problemet.

No comments:

Post a Comment