Ujednoznacznienie pojęć dla języka polskiego dla potrzeb budowania tożsamości użytkowników Internetu

Word srnse disambiguation of the Polish language for the needs of generating digital identities
Wraz z przenoszeniem się aktywności ludzi do Internetu, coraz istotniejsze staje się zagadnienie wirtualnych tożsamości użytkownika, rozumianych jako przetwarzalne reprezentacje cech danego użytkownika sieci. Tożsamości takie mają umożliwić powiadamianie systemów, z którymi użytkownik wchodzi w interakcje, o istotnych jego cechach, na przykład dla potrzeb personalizacji treści dostarczanej przez system. Opracowanie reprezentacji różnych cech, która miałaby być zrozumiała dla wielu niepowiązanych ze sobą systemów, jest trudne. Dodatkowym wyzwaniem jest opracowanie sposobów pozyskiwania informacji o charakterystykach użytkownika służących do utworzenia jego tożsamości. Artykuł ma na celu przeanalizowanie dwóch zagadnień, które mogą znaleźć zastosowanie w rozwiązaniu omawianych problemów. Są nimi: semantyczne modelowanie użytkowników, które może pozwolić na konstruowanie modeli możliwych do wykorzystania w wielu różnych systemach, oraz ujednoznacznianie pojęć wyekstrahowanych z czytanych przez użytkownika artykułów, będące jednym ze sposobów pozyskiwania informacji o jego potrzebach. Na podstawie przeprowadzonej analizy podjęta została próba określenia kierunków badań w omawianych zakresach.
Nowadays, as more and more real world activities are transferred to the Web, the topic of digital identities, understood as representations of users’ characteristics, become increasingly important. One of the purposes of research into digital identities is to use them as a means of informing the systems the user interacts with about his/her characteristics, needs and expectations, in order to, for example, enable a constant personalization process. However, a requirement that such identities are to represent a wide range of the user’s characteristics in the form understandable to many different systems, raises many difficulties. An issue of how to collect such a broad set of information about users is also of particular significance. The aim of the article is to analyze two topics that can potentially be used while solving the above mentioned problems. These are ontology-based user modeling, which can be used for building reusable user models, and word sense disambiguation for words extracted from articles read by the users on different sites they visit. Based on the analysis of these topics, a proposal of further research directions is presented.
  • Uniwersytet Ekonomiczny w Poznaniu
