Kubus data adalah representasi multidimensi dari data, bersama dengan seluruh jumlah kemungkinan Dengan seluruh jumlah kemungkinan, yaitu sekumpulan kemungkinan yang dihasilkan dari proses pemilihan subset dari dimensi-dimensi dan menjumlahkan seluruh dimensi yang tersisa.
Sebagai contoh, jjika kita memilih dimensi tipe spesies dari data Iris dan menjumlahkan seluruh dimensi yang lain, hasilnya adalah masukan/entry satu dimensi dengan tiga masukan/entry, dimana masing-masing akan terdapat jumlah bunga dari masing-masing jenis .
Data tersebut dapat dinyatakan dalam array 3 dimensi seperti pada gambar di samping Terdapat 3 aggregat twodimensional (3 choose 2) 3 aggregat one-dimensional dan 1 aggregat zero-dimensional (total seluruhnya)
Suatu kubus data seperti Sales
memungkinkan data untuk dimodelkan dan dilihat dari banyak dimensi
– Dimensi tabel, seperti item (item_name, brand, type), atau time(day,
week, month, quarter, year)
– Tabel fakta memuat ukuran (seperti dollars_sold) dan kunci untuk setiap
dimensi tabel terkait
Membangun data
Perlu pandangan luas untuk antisipasi penggunaan warehouse
Design harus mendukung ad-hoc querying, yaitu mengakses data dengan kombinasi nilai apa saja untuk atribut dalam tabel dimensi atau tabel fakta.
Akuisisi data
Data diekstrak dari sumber yang banyak dan heterogen
Data harus diformat untuk konsistensi dalam
Data harus bersih untuk memastikan validitas
Data harus bisa masuk dalam model data
Data harus dimuat dalam warehouse
Akuisisi data 2
Seberapa up-to-date datanya?
Bisakah warehouse ini off-line, dan berapa lama?
Apa saja independensi datanya?
Berapa kapasitas storage?
Apa saja persyaratan distribusi (seperti replikasi dan partitioning)?
Berapa waktu loadingnya (termasuk pembersihan, formatting, copying, transmitting dan overhead seperti pembangunan index)
Fungsi Umum Data
Data warehouse ada untuk memfasilitasi queri ad hoc yang terjadi sering dan kompleks. Untuk itu, data warehouse harus menyediakan dukungan query yang lebih efisien
Roll-up: data dirangkum dengan generalisasi
Dril-down: meningkatkan tingkat detail
Pivot: lintas tabulasi (juga disebut rotasi)
Potong dan iris: melakukan operasi proyeksi terhadap dimensi
Sorting: data diurut berdasarkan nilai ordinal
Selection: data tersedia dalam nilai atau range
Derived attributes: atribut dihitung oleh operasi dalam nilai yang disimpan atau turunan
Data spasial yang umum kita gunakan selama ini adalah point, line, dan polygon dimana bentuk feature tersebut merupakan bentuk feature data yang bisa ditampung oleh data spasial dengan format shapefile (*.shp) yang sering kita gunakan. Dengan format data spasial baru yang diusung oleh ArcGIS yaitu geodatabase (*.mdb dan *.gdb), data spasial yang dapat ditampung tidak lagi hanya berupa data spasial 2D, tetapi data spasial di dalamnya dapat berupa data spasial 3D. Bentuk feature data spasial 3D ini adalah multipatch features. Data spasial 3D di sini merupakan obyek-obyek 3D seperti bangunan, gedung, pohon, kendaraan, dan lain sebagainya. Sehingga nantinya hasil dari pemetaan detil bisa berupa peta detil 3D.
Header Citra
Header bitmap : bagaimanadata bitmap dikodekandandisimpan, mis. ukurancitra, resolusi, jumlahwarnayang digunakan, dll.
Informasipalet dinyatakandalamtabelyang terdiridari3 field: Red, Green, Blue.
Data bitmap disusunterbalikdaribawahkeatasdalambentukmatriksberukuranHeight x Width.
Contoh :
R G B
1 22 44 24
2 10 12 17
3 44 78 18
2 2 1 1 1 1 3 5
No comments:
Post a Comment