Kumpulan data adalah sebuah koleksi data. Dalam kasus data tabular, kumpulan data sesuai dengan satu atau lebih tabel basis data, di mana setiap kolom dari sebuah tabel mewakili suatu variabel, dan setiap baris sesuai dengan rekaman tertentu dari kumpulan data yang dimaksud. Kumpulan data mencantumkan nilai untuk setiap variabel, misalnya tinggi dan berat suatu objek, untuk setiap anggota dalam kumpulan data tersebut. Kumpulan data juga dapat berupa koleksi dokumen atau berkas.[2]
Dalam disiplin open data, sebuah kumpulan data merupakan satuan yang digunakan untuk mengukur jumlah informasi yang dirilis dalam repositori data terbuka publik. Portal data.europa.eu Eropa menghimpun lebih dari satu juta kumpulan data.[3]
Sifat
Beberapa karakteristik mendefinisikan struktur dan sifat suatu kumpulan data. Hal ini mencakup jumlah dan jenis atribut atau variabel, serta berbagai ukuran statistik yang berlaku untuknya, seperti simpangan baku dan kurtosis.[4]