Mikä on datan vinouma?
Tietojärjestelmien yhteydessä puhutaan paljon datan vinoumista. Usein käytetään myös englanninkielistä termiä bias.
Vinoumalla on erilaisia määritelmiä. Vastuulliseen kehittämiseen liittyvät ainakin nämä:
- otantaan tai testaukseen sisältyvä systemaattinen virhe, joka johtuu siitä, että valitaan tai voimistetaan yhtä tulosta tai vastausta muiden sijaan
- ennakkoasenne, joka joko suosii tai vastustaa tiettyä asiaa, henkilöä tai ryhmää toiseen verrattuna, yleensä epäoikeudenmukaisena pidetyllä tavalla.
Ensimmäinen on tilasto- ja tietojenkäsittelytieteellinen tapahtuma, joka aiheutetaan tahattomasti tai tahallaan testitarkoituksessa järjestelmän tutkimus- ja tuotekehitysprosessissa. Se voidaan aiheuttaa tahallaan myös pahantahtoisesti.
Jälkimmäinen määritelmä taas viittaa ihmisen tai ryhmän ominaisuuteen, joka heijastuu järjestelmän tuottamaan tai käyttämään tietoaineistoon joko tahattomasti tai tahallisesti.