Profilowanie, oczyszczanie i zapobieganie powstawaniu dirty data

Migdał-Najman, Kamila; Najman, Krzysztof

Article details

Journal

Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu

2018 | 508 | 146-156

Article title

Profilowanie, oczyszczanie i zapobieganie powstawaniu dirty data

Authors

Migdał-Najman Kamila , Najman Krzysztof

Content

Full texts:

Download

Title variants

Languages of publication

PL EN

Abstracts

PL

Zbiory Big Data oferują dostęp do niemal nieograniczonej liczby danych, dając nadzieję na szybszy, tańszy, bardziej precyzyjny i wszechstronny opis świata. Jednocześnie w takich zbiorach poza danymi o odpowiedniej jakości (clear data) znaczny udział mają dane nieprawdziwe, nieaktualne, zaszumione, często zwielokrotnione, niepełne lub błędne (dirty data), a także dane o nieznanej jakości czy użyteczności (dark data). Znaczący udział dirty i dark data ma szereg negatywnych konsekwencji w analizie zbioru Big Data. Celem prezentowanych badań jest przegląd i systemowe ujęcie procedur minimalizowania negatywnych efektów dirty data w analizie Big Data. W konstrukcji systemu oczyszczania zbioru danych uwzględniono najważniejsze procedury profilowania (profiling data), oczyszczania (cleansing data) i zapobiegania (defect prevention) powstawaniu dirty data w procesie budowy i analizy zbioru Big Data

Keywords

PL

big data dirty data profilowanie danych oczyszczanie danych zapobieganie powstawaniu zanieczyszczeń w danych

Publisher

Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu

Journal

Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu

Year

2018

Issue

508

Pages

146-156

Physical description

Contributors

author

Migdał-Najman Kamila

author

Najman Krzysztof

References

Document Type

Publication order reference

Identifiers

YADDA identifier

bwmeta1.element.desklight-c81c636b-9aae-4654-9f72-888528d16f1e

Article details

Journal

Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu

Article title

Profilowanie, oczyszczanie i zapobieganie powstawaniu dirty data

Authors

Content

Title variants

Languages of publication

Abstracts

Keywords

Publisher

Journal

Year

Issue

Pages

Physical description

Contributors

References

Document Type

Publication order reference

Identifiers

YADDA identifier