Jag skulle vilja definiera data så här:
1. Data är något som man skulle kunna tolka som att det betyder något.
och information så här:
2. Information är något som man har tolkat som att det betyder något.
Jag tror att det finns många fallgropar i de här definitionerna, men också en styrka, som främst ligger i att de tydliggör relationen mellan verkligheten och fantasin/tolkningen.
Med 1. blir mängden data väldigt stor, och det är en fördel. Allting som finns i världen blir data, och alla kombinationer av allting blir data. (Antagligen är det också så att all information i dess konkreta manifestation också blir data.)
Data betyder på latin "de givna" och det är den tolkningen jag tycker att man ska lägga på data. De givna är det man inte ifrågasätter. Det blir som en tautologi, men sådant finns inom alla vetenskaper.
Med 2. blir information bara en liten, liten plutt i jämförelse med alla data. Jag vet egentligen inte hur jag ska uttrycka det, men kanske ska man säga att information har två aspekter, en konkret aspekt och en tolkningsaspekt.
Låt mig illustrera med Michael Leytons bild av vad ett minne är, fritt citerat:
Ett minne är något som existerar i nutid men som vi tolkar som att det tillhör det förflutna.
Jag tänker på hur Piaget beskriver hur ett spädbarn lär sig vad sinnesintrycken betyder. En tremånaders bebis kan enligt Piaget inte förstå synintryck som något värdefullt, utan måste lära sig korrespondensen mellan synen och "det värdefulla" (huvudsakligen det som går att äta), via andra sinnen. I början behöver man röra vid saker och stoppa dem i munnen för att etablera vad som är värdefullt, och sen kombinerar man detta gradvis med att också titta på saker, så att man till slut kan genom att bara titta på något avgöra om det är värdefullt (går att äta).
Mer om detta i kapitel 4 av min avhandling (pdf).
Hela tolkningen av data är lite understuderad, och vi har ingen riktigt bra begreppsapparat för att tala om den.
Sen används ju inte orden data och information på det sätt som jag definierar dem. Ofta används ordet data så att jag skulle vilja att det var information som användes. Uttrycket "öppna data" betyder oftast att man redan har tolkat det man har samlat in, och gett det värde. Och samtidigt indikerar man att tolkningen och användningspotentialen inte alls är fastslagen. Jämför med om man säger "öppen information", när tolkningen och perspektivet känns som att det är mycket mer fastslaget.
/Simon
Comments