Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

Refine search results

Results found: 2

first rewind previous Page / 1 next fast forward last

Search results

Search:
in the keywords:  linguistica computazionale
help Sort By:

help Limit search:
first rewind previous Page / 1 next fast forward last
EN
Rather than reporting on original research, this paper seeks to define the complex and rather diffuse domain of digital humanities by examining the historical and technological origins of the discipline. The distinction between the practice of the computer-mediated storage and retrieval of data relevant to human artefacts and the creative building of ‘digital culture’ draws a rough dividing line across the objectives of digital humanists. A historical outline of the distant origins of digital humanities suggests that the discipline is foundationally and intrinsically linked to computational linguistics and the development of linguistic resources. The boundaries of the discipline have been shifting concomitantly with the broadening of the scientific horizon and the evolution of dedicated technologies. Text mark-up (stemming from text annotation) and the multimodal facilities offered by ordinary browsers are the two basic techniques which have promoted the progressive development and expansion of digital humanities. These two techniques are closely interconnected as the language operated by the http protocol (HyperText Transfer Protocol) derives from the same source as that used for text mark-up. Hypertext and multimodality allow extending the uses of the computer to store and access humanities data of various kinds, including images, videos and sound recordings. Finally, the declaration of entities, as a further development of mark-up, makes it possible to apply semantic web techniques to carry out advanced research studies. The field of creative digital culture is very large, and there are abundant software applications that support such creative pursuits. Consequently, several forms of art have largely profited from technological advancement. Given this, the paper also addresses technological obsolescence as a serious problem in digital humanities.
IT
Questo articolo non presenta una ricerca originale, ma è piuttosto un tentativo di definire questo settore scientifico così complesso e piuttosto sfumato, facendo anche ricorso alle sue radici storiche e tecnologiche. Una prima linea di distinzione degli obiettivi di questa disciplina consiste nell’opposizione tra tecniche per memorizzare e recuperare mediante calcolatore dati rilevanti agli artefatti umani e la costruzione creativa di una “cultura digitale”. Un breve ricostruzione storica delle prime origini delle "digital humanities", fa supporre una connessione con la linguistica computazionale e con lo sviluppo delle risorse linguistiche come fondamenti della disciplina. I confini della disciplina sono evoluti con l’ampliarsi degli orizzonti scientifici e l’evoluzione delle tecnologie dedicate. Le tecnologie di base che rendono possibile lo sviluppo di aree più vaste di Digital Humanities sono due, l’annotazione testuale, con il conseguente "markup", e le capacità multimediali offerte dai browser ordinari. Queste due tecniche sono strettamente legate, dal momento che il linguaggio che è utilizzato dal protocollo http (HyperText Transfer Protocol) ha origine comune con quello che viene utilizzato nel markup testuale. Ipertestualità e multimodalità permettono l’estensione dell’uso del computer nella memorizzazione e recupero di materiali umanistici di tipo diverso, includendo immagini, video e suoni. Alla fine, un ulteriore sviluppo del "markup", cioè la dichiarazione delle entities, ha reso possibile l’uso di tecniche di semantic web per condurre ricerche avanzate. Il campo della cultura digitale creativa è vastissimo e la quantità di software disponibili per rendere possibile questa creatività è enorme; alcune forme di arte ne hanno largamente tratto vantaggio. Nella conclusione si discute il serio problema dell’obsolescenza tecnologica.
EN
For several years now, computational linguistics has been addressing the problems of and developing technological tools for automatic translation, with its important economic implications. At the same time, projects dedicated to facilitating translations of ancient works, which are often fraught with considerable hermeneutical difficulties, are far rarer. The PTTB system, which was designed and constructed at the Institute for Computational Linguistics (National Research Council) in Pisa, enables a group of about fifty scholars to translate the entire Babylonian Talmud, written in Aramaic and Biblical Hebrew, more quickly and uniformly. While the language and structure of the textual corpus made the development of machine translation algorithms impossible, translation memory and edit distance techniques have produced excellent results. Based on them, the system offers scholars a high percentage of correct translations, accessible through a very intuitive graphic user interface. The results are easily exportable to xml files suitable for the final editing and printing operations. So far, these innovations have made it possible to publish four treatises in six printed volumes with translations, annotations and thematic indexes within a relatively short time. Several other volumes have already been processed and are currently being edited. Various perspectives open up for the use of the digital Talmud in Italian. One of the most interesting options involves using machine learning and named entity recognition techniques to associate semantic or conceptual values (Talmud Ontological Framework) with and make cross-references among portions of the text that report or discuss similar themes. This will help various groups of (general and specialised) users to browse this vast and heterogeneous textual archive on the semantic basis. The strategy adopted here is also aligned with the Dictionnaire des Termes Médico-botaniques de l’Ancien Occitan (DiTMAO), another ongoing lexicographical project. It will enable users to semantically navigate within an extensive medical-pharmaceutical and botanical textual corpus in medieval Occitan. For these reasons, PTTB and DiTMAO can be regarded as two instances of one innovative technological infrastructure for linguistic and philological research in the field of digital humanities.
IT
La linguistica computazionale affronta da molti anni e da parte di molti enti pubblici e privati i problemi posti dalla traduzione automatica che ha importanti ricadute applicative ed economiche. Molto più rari sono invece i casi in cui comunità scientifiche e/o soggetti industriali a livello internazionale investano risorse per rendere più semplice e veloce il lavoro di chi affronta opere antiche, spesso caratterizzate da grandi difficoltà interpretative. Il sistema TRADUCO, progettato e realizzato presso l’Istituto di Linguistica Computazionale del CNR di Pisa, consente a un gruppo di talmudisti di rendere in italiano corrente i trattati del "Talmud" babilonese, redatti in aramaico ed ebraico biblico. La lingua e la struttura del testo hanno reso improponibile la progettazione di algoritmi di "Machine Translation", mentre ottimi risultati si sono ottenuti grazie a tecniche di "Translation Memory" e di "Edit Distance". Queste, ben armonizzate fra loro, consentono al sistema di proporre agli specialisti una sempre più alta percentuale di traduzioni corrette, inserite in un ambiente di lavoro intuitivo. Il risultato è esportabile in file xml predisposti per le operazioni finali di stampa. Ciò ha consentito di pubblicare già 5 trattati in volumi cartacei che offrono testo tradotto, annotazioni, indici tematici, e altre informazioni. Molti volumi sono già stati tradotti e attualmente in fase di controllo editoriale. Varie prospettive si aprono, infine, per la fruizione del "Talmud" digitale in italiano. Fra esse, una fra le più interessanti riguarda la possibilità di associare, anche mediante tecniche di "Machine Learning" e "Named Entity Recognition", valori semantici o concettuali ("Talmud Ontological Framework") a porzioni di testo che riferiscono o discutono tematiche simili. Ciò consentirà di navigare su base semantica un archivio testuale tanto vasto ed eterogeneo. La strategia adottata risulta modulabile anche per altri progetti di carattere lessicografico come, per esempio, il DiTMAO ("Dictionnaire des Termes Médico-botaniques de l’Ancien Occitan"). Esso offrirà percorsi di navigazione semanticamente orientati nell’àmbito di un vasto corpus di testi digitalizzati di argomento medico-farmaceutico e botanico in occitanico medievale. Per tali ragioni TRADUCO e DiTMAO si configurano come istanze di un’infrastruttura tecnologica di linguistica e filologia computazionali fra le più innovative nel settore delle "Digital Humanities".
first rewind previous Page / 1 next fast forward last
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.