Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


2021 | 1 | 352 | 25-37

Article title

Zastosowanie danych scrapowanych w pomiarze dynamiki cen

Authors

Content

Title variants

Languages of publication

Abstracts

EN
Web‑scraping is a technique used to automatically extract data from websites. After the rise‑up of on‑lines shopping (which results in more shops posting their full price offer on their websites) it allows to acquire information about prices of goods sold by the retailers such as supermarkets or internet shops. Usage of web‑scraped data allows to lower the costs, improve the measurement quality and monitor the price change in real time. Due to before mentioned reasons this method became the object of research studies from both statistical offices (Eurostat, British Office of National Statistics, Belgium Statbel) and universities (for ex. Billion Prices Project conducted on MIT). However, usage of scrapped data for the CPI calculation entails with multiple challenges with their collection, processing and aggregation. The purpose of this article is to examine the possibility of using scrapped data in toy price dynamic analysis. Especially the purpose is to compare the results from different inde Xformulas. In this article the empirical study based on data from 4 different shops is presented (53 chosen products sold in Amazon, Wallmart, Smarterkids and KBKids).
PL
Web‑scraping to technika, którą można wykorzystać do automatycznego pozyskiwania danych zamieszczonych na stronach internetowych. Wraz ze wzrostem popularności zakupów on‑line coraz więcej sklepów i usługodawców zainwestowało w strony WWW z ofertą cenową. Przekłada się to na możliwość automatycznego ściągania przez badaczy cen detalistów z wielu branż, m.in. odzieżowej czy spożywczej. Wykorzystanie danych scrapowanych skutkuje nie tylko znaczącym obniżeniem kosztów badania cen, ale także poprawia precyzję szacunków inflacji i daje możliwość śledzenia jej w czasie rzeczywistym. Z tego względu web‑scraping jest dziś popularnym obiektem badań zarówno ośrodków statystycznych (Eurostat, brytyjski Office of National Statistics, belgijski Statbel), jak i uniwersytetów (m.in. Billion Prices Project prowadzony w Massachusetts Institute of Technology). Zastosowanie danych scrapowanych do liczenia inflacji wiąże się jednak z wieloma wyzwaniami na poziomie ich zbierania, przetwarzania oraz agregacji. Celem artykułu jest zbadanie możliwości wykorzystania danych scrapowanych do analizy dynamiki cen zabawek, a w szczególności porównanie wyników uzyskanych za pomocą różnych formuł indeksowych. W opracowaniu przedstawiono wynik badania empirycznego na podstawie danych pochodzących z czterech sklepów (z 53 wybranych produktów sprzedawanych w Amazonie, Wallmarcie, Smarterkids oraz KBkids).

Year

Volume

1

Issue

352

Pages

25-37

Physical description

Dates

published
2021

Contributors

author
  • Uniwersytet Łódzki, Wydział Ekonomiczno‑Socjologiczny, Katedra Metod Statystycznych

References

  • Balk B. M. (1995), Axiomatic Price Index Theory: A Survey, „International Statistical Reviews”, vol. 63, s. 69–93.
  • Białek J. (2019), Remarks on Geo‑Logarithmic Price Indices, „Journal of Official Statistics”, vol. 35, no. 2, s. 287–317.
  • Białek J., Bobel A. (2019), Comparison of Price Index Methods for the CPI Measurement Using Scanner Data, 16th Meeting of the Ottawa Group on Price Indices, Rio de Janeiro.
  • Cavallo A. (2013), Online vs Official Price Indexes: Measuring Argentina’s Inflation, „Journal of Monetary Economics”, vol. 60, no, 2, s. 152–165.
  • Cavallo A. (2017), Are Online and Offline Prices Similar? Evidence from Large Multi‑channel Retailers, „American Economic Review”, vol. 107, s. 283–303.
  • Cavallo A. (2018), Scraped Data and Sticky Prices, „The Review of Economics and Statistics”, vol. 100, s. 105–119.
  • Cavallo A., Rigobon R. (2016), The Billion Prices Project: Using Online Prices for Measurement and Research, „Journal of Economic Perspectives”, vol. 30, no. 2, s. 151–178.
  • Chessa A. G., Griffioen R. (2019), Comparing Price Indices of Clothing and Footwear for Scanner Data and Web Scraped Data, „Economics and Statistics: Big Data and Statistics”, no. 509, s. 49–69.
  • Consumer Price Index Manual. Theory and practice (2004), International Labour Office, Geneva.
  • Dutot C. F. (1738), Reflexions Politiques sur les Finances et le Commerce, vol. 1, Les Freres Vaillant et Nicolas Prevost, The Hague.
  • Eltetö Ö., Köves P. (1964), Egy nemzetközi összehasonlításoknál fellépő indexszámítási problémáról. On a Problem of Index Number Computation Relating to International Comparisons (in Hungarian), „Statisztikai Szemle”, no. 42, s. 507–518.
  • Eurostat, https://ec.europa.eu/eurostat/web/digital-economy-and-society/data/database (dostęp: 10.02.2020).
  • Gini C. (1931), On the Circular Test of Index Numbers, „Metron”, no. 9, s. 3–24.
  • Ivancic L., Fox K. J., Diewert W. E. (2011), Scanner Data, Time Aggregation and the Construction of Price Indexes, „Journal of Econometrics”, vol. 151, s. 24–35.
  • Jevons W. (1865), The Coal Question, Macmillan & Co., London.
  • Lewel P. (2015), Is the Carli index flawed? Assessing the case for the new retail price index RPIJ, „Journal of the Royal Statistical Society Series A (Statistics in Society)”, vol. 178, no. 2, s. 303–336.
  • Lunnemann P., Wintr L. (2006), Are Internet Prices Sticky?, ECB Working Paper, no. 645.
  • Macias P., Stelmasiak D. (2018), Food inflation nowcasting with web scraped data, NBP Working Paper, no. 302.
  • Office for National Statistics (b.r.), ONS methodology working paper series number 12 – a comparison of index number methodology used on UK web scraped price data, https://www.ons.gov.uk/methodology/methodologicalpublications/generalmethodology/onsworkingpaperseries/onsmethodologyworkingpaperseriesnumber12acomparisonofindexnumbermethodologyusedonukwebscrapedpricedata (dostęp: 1.02.2020).
  • Office for National Statistics (2017), Research indices using web scraped price data: clothing data, https://www.ons.gov.uk/economy/inflationandpriceindices/articles/researchindicesusingwebscrapedpricedata/clothingdata (dostęp: 1.02.2020).
  • Radzikowski B., Śmietanka A. (2016), Online CASE CPI, First International Conference on Advanced Research Methods and Analytics, València.
  • Szulc B. (1964), Indices for Multiregional Comparisons, „Przegląd Statystyczny”, nr 3, s. 239–254.
  • Yang Z., Gan L., Tang F. (2010), A Study of Price Evolution in the Online Toy Market. Economics, „Open‑Assessment E‑Journal”, vol. 4, no. 28, s. 1–29.
  • Zhang L. (2020), Proxy expenditure weights for Consumer Price Index: audit sampling inference for big‑data statistics, „Journal of the Royal Statistical Society: Series A (Statistics in Society)”, https://rss.onlinelibrary.wiley.com/doi/epdf/10.1111/rssa.12632 (dostęp: 10.02.2020).

Document Type

Publication order reference

Identifiers

Biblioteka Nauki
1033541

YADDA identifier

bwmeta1.element.ojs-doi-10_18778_0208-6018_352_02
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.