Datajoukko on tietokoneohjelmassa tai tutkimuksessa käytettävä tietomäärä, joka koostuu erilaisista tiedoista ja informaatiosta.