Datankeruu on monipolvinen prosessi
Tekoälyn toiminta perustuu dataan. Siksi datan ominaisuudet tarvitsevat nykyistä enemmän eettistä huomiota. Data ei ole vain staattinen aineisto vaan kokonaisprosessi, johon kuuluvat
- järjestelmän tavoitteenasettelu
- tavoitteen kannalta relevantin data-aineiston tunnistaminen
- opetusdata-aineiston kerääminen, sen menetelmät ja hallinta
- aineiston laadun analysointi
- datan ”siivoaminen” ja kuratointi koneellista prosessointia varten
- mallin muodostaminen ja testaus
- tuotantodatan käsittely
- jatkuva seuranta ja mallin päivittäminen tarvittaessa.
Tekoälyn eettiset kysymykset ovat painottuneet tuotoksiin eikä siihen, mitä järjestelmissä käytetään. Meidän olisi keskityttävä enemmän siihen, miten dataa tuotetaan ja käsitellään.
– Tutkija William Isaac, Google DeepMind