Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


Journal

2017 | 97 | 1 | 64-74

Article title

Automatyczne wydobywanie terminologii dziedzinowej z korpusów tekstowych

Title variants

EN
Automatic extraction of domain terminology from text corpora

Languages of publication

PL

Abstracts

PL
Każda dziedzina wiedzy czy forma komunikacji posiada własne, charakterystyczne dla niej, słownictwo. Słowniki zawierające słowa i wielowyrazowe terminy dziedzinowe służące identyfikacji istotnych pojęć i ich leksykalnych odpowiedników w tradycyjnym podejściu tworzone były przez zajmujących się tą dziedziną specjalistów. Metoda ta jest jednak bardzo czasochłonna, a zatem, zwłaszcza dla szybko zmieniających się dziedzin, niewystarczająca. W artykule zaprezentowany został program pozwalający na automatyczną identyfikację fraz rzeczownikowych będących potencjalnymi terminami dziedzinowymi oraz ich uporządkowanie według miary przybliżającej stopień ich istotności.
EN
Every knowledge domain or form of communication has its own characteristic vocabulary. In the traditional approach, dictionaries containing words and multi-word terms identifying important concepts and their lexical equivalents were created by specialists in a subject area. This method, however, is very time-consuming and therefore inadequate, especially for rapidly changing domains. In this paper we present a computer program allowing for automatic identification of noun phrases being potential domain terms and their ranking according to some measure of significance.

Journal

Year

Volume

97

Issue

1

Pages

64-74

Physical description

Contributors

  • Instytut Podstaw Informatyki Polskiej Akademii Nauk, Warszawa
  • Instytut Podstaw Informatyki Polskiej Akademii Nauk, Warszawa
author
  • Instytut Podstaw Informatyki Polskiej Akademii Nauk, Warszawa

References

Document Type

Publication order reference

Identifiers

YADDA identifier

bwmeta1.element.desklight-8d23edd3-2ac5-4a5a-8d32-14530d19caaf
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.