Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


2020 | 11.1 | 101-121

Article title

PTTB e DiTMAO: modularità di alcune applicazioni per le Digital Humanities

Authors

Content

Title variants

EN
PTTB and DiTMAO: The Modularity of Some Tools for Digital Humanities

Languages of publication

IT

Abstracts

IT
La linguistica computazionale affronta da molti anni e da parte di molti enti pubblici e privati i problemi posti dalla traduzione automatica che ha importanti ricadute applicative ed economiche. Molto più rari sono invece i casi in cui comunità scientifiche e/o soggetti industriali a livello internazionale investano risorse per rendere più semplice e veloce il lavoro di chi affronta opere antiche, spesso caratterizzate da grandi difficoltà interpretative. Il sistema TRADUCO, progettato e realizzato presso l’Istituto di Linguistica Computazionale del CNR di Pisa, consente a un gruppo di talmudisti di rendere in italiano corrente i trattati del "Talmud" babilonese, redatti in aramaico ed ebraico biblico. La lingua e la struttura del testo hanno reso improponibile la progettazione di algoritmi di "Machine Translation", mentre ottimi risultati si sono ottenuti grazie a tecniche di "Translation Memory" e di "Edit Distance". Queste, ben armonizzate fra loro, consentono al sistema di proporre agli specialisti una sempre più alta percentuale di traduzioni corrette, inserite in un ambiente di lavoro intuitivo. Il risultato è esportabile in file xml predisposti per le operazioni finali di stampa. Ciò ha consentito di pubblicare già 5 trattati in volumi cartacei che offrono testo tradotto, annotazioni, indici tematici, e altre informazioni. Molti volumi sono già stati tradotti e attualmente in fase di controllo editoriale. Varie prospettive si aprono, infine, per la fruizione del "Talmud" digitale in italiano. Fra esse, una fra le più interessanti riguarda la possibilità di associare, anche mediante tecniche di "Machine Learning" e "Named Entity Recognition", valori semantici o concettuali ("Talmud Ontological Framework") a porzioni di testo che riferiscono o discutono tematiche simili. Ciò consentirà di navigare su base semantica un archivio testuale tanto vasto ed eterogeneo. La strategia adottata risulta modulabile anche per altri progetti di carattere lessicografico come, per esempio, il DiTMAO ("Dictionnaire des Termes Médico-botaniques de l’Ancien Occitan"). Esso offrirà percorsi di navigazione semanticamente orientati nell’àmbito di un vasto corpus di testi digitalizzati di argomento medico-farmaceutico e botanico in occitanico medievale. Per tali ragioni TRADUCO e DiTMAO si configurano come istanze di un’infrastruttura tecnologica di linguistica e filologia computazionali fra le più innovative nel settore delle "Digital Humanities".
EN
For several years now, computational linguistics has been addressing the problems of and developing technological tools for automatic translation, with its important economic implications. At the same time, projects dedicated to facilitating translations of ancient works, which are often fraught with considerable hermeneutical difficulties, are far rarer. The PTTB system, which was designed and constructed at the Institute for Computational Linguistics (National Research Council) in Pisa, enables a group of about fifty scholars to translate the entire Babylonian Talmud, written in Aramaic and Biblical Hebrew, more quickly and uniformly. While the language and structure of the textual corpus made the development of machine translation algorithms impossible, translation memory and edit distance techniques have produced excellent results. Based on them, the system offers scholars a high percentage of correct translations, accessible through a very intuitive graphic user interface. The results are easily exportable to xml files suitable for the final editing and printing operations. So far, these innovations have made it possible to publish four treatises in six printed volumes with translations, annotations and thematic indexes within a relatively short time. Several other volumes have already been processed and are currently being edited. Various perspectives open up for the use of the digital Talmud in Italian. One of the most interesting options involves using machine learning and named entity recognition techniques to associate semantic or conceptual values (Talmud Ontological Framework) with and make cross-references among portions of the text that report or discuss similar themes. This will help various groups of (general and specialised) users to browse this vast and heterogeneous textual archive on the semantic basis. The strategy adopted here is also aligned with the Dictionnaire des Termes Médico-botaniques de l’Ancien Occitan (DiTMAO), another ongoing lexicographical project. It will enable users to semantically navigate within an extensive medical-pharmaceutical and botanical textual corpus in medieval Occitan. For these reasons, PTTB and DiTMAO can be regarded as two instances of one innovative technological infrastructure for linguistic and philological research in the field of digital humanities.

Year

Issue

Pages

101-121

Physical description

Dates

published
2020-07-31
received
2020-02-01
accepted
2020-06-15

Contributors

author
  • già Direttore ILC-CNR-Pisa, Italia

References

  • Albanesi, A., Bellandi A., Benotto, G., & Giovannetti, E. (2015). Translation, Annotation and Knowledge Modelling of the Babylonian Talmud: the Traduco System. Paper presented at the conference Digital Humanities 2015, (Sydney, 29/06-03/07/2015).
  • Baldinger, K. (1975–1996). Dictionnaire onomasiologique de l’ancien occitan (DAO), fasc. 1–7. Tübingen: Niemeyer.
  • Baldinger, K. (1980–2000). Dictionnaire onomasiologique de l’ancien occitan (DAO), fasc. 1–7, suppl. Tübingen: Niemeyer.
  • Baldinger, K. (1975–1998). Dictionnaire onomasiologique de l’ancien gascon (DAG), fasc. 1–9. Tübingen: Niemeyer.
  • Bellandi, A. (2015). Towards a translation platform as a bridge between ancient and modern languages. Part II: A research infrastructure for translation and interpretation of ancient texts. In A. Bozzi (Ed.). Digital texts, translations, lexicons in a multi-modular Web application: methods and samples (pp. 69–84). Firenze: Leo S. Olschki.
  • Bolasco, S., & Pavone, P. (2008). Multi-class categorization based on cluster analysis and TFIDF. In S. Heiden, & B. Pincemin (Eds.), JADT 2008 : 9es Journées internationales d’Analyse statistique des Données Textuelles. Lyon: Presses universitaires de Lyon. Retrieved from http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.659.3472&rep=rep1&type=pdf.
  • Bos, G., Mensching, G., Hussein, M., & Savelsberg, F. (2011). Shem Tov Ben Isaac of Tortosa, Sefer ha-Shimmush, Book 29. Medical synonym lists from Medieval Provence: Part 1: Edition and Commentary of List 1 (Hebrew—Arabic— Romance/Latin). Leiden: Brill.
  • Bos, G., Mensching, G., & Zwink, J. (2017). Medical Glossaries in the Hebrew Tradition: Shem Tov Ben Isaac, Sefer Almansur. Leiden: Brill.
  • Bozzi, A., & Luzzi, D. (2016). Un’ontologia per il DiTMAO (Dictionnaire des Termes Médico-botaniques de l’Ancien Occitan). In D. Trotter, A. Bozzi, & C. Fairon (Eds.). Actes du XXVII Congrès international de linguistique et de philologie romanes (Nancy, 15–20 juillet 2013). Section 16: Projets en cours; ressources et outils nouveaux (pp. 55–63). Nancy: Atilf., ATILF. Retrieved from www.atilf.fr/cilpr2013/actes/section-16/CILPR-2013-16-Bozzi-Luzzi.pdf.
  • Bozzi, A. (2017). TRADUCO. Linguistica e filologia computazionali nella traduzione del Talmud. In R.S. Di Segni (Ed.). Talmud Babilonese – Trattato Berakhòt (pp. xxvii–xxx). Firenze: Giuntina.
  • Choueka, Y. (1980). Computerized full-text retrieval systems and research in the humanities: the Responsa project. Computers and the Humanities, 14, 153–169.
  • Corradini, M.S. (2014). Lessico e tassonomia nell’organizzazione del “Dictionnaire des Termes Médico-botaniques de l’Ancien Occitan (DiTMAO). Revue de Linguistique Romane, 78, 87–132.
  • Corradini, M.S. (1997). Ricettari medico-farmaceutici medievali nella Francia meridionale. Firenze: Olschki.
  • Corradini, M.S. (2016). La realizzazione del Dictionnaire des Termes Médicobotaniques de l’Ancien Occitan (DiTMAO): problemi di organizzazione della conoscenza medico-farmaceutica attestata nei manoscritti in occitano antico. In D. Trotter, A. Bozzi, & C. Fairon (Eds.). Actes du XXVII Congrès international de linguistique et de philologie romanes (Nancy, 15–20 juillet 2013). Section 16: Projets en cours; ressources et outils nouveaux. Nancy: Atilf. Retrieved from http://www.atilf.fr/cilpr2013/actes/section-16.html.
  • Freedman, H. (2014). The Talmud. A Biography. Banned, Censored and Burned. The Book They Couldn’t Suppress. London: Bloomsbury (it.: Torino: Bollati Boringhieri, 2016).
  • Gaio, S., Borgo, S., Masolo, C., Oltramari, A., & Guarino, A. (2010). Un’introduzione all’ontologia DOLCE. AIDA Informazioni, 1–2, 107–125. Retrieved from https://www.academia.edu/11752175.
  • Giovannetti, E., Albanesi, A., Bellandi, A., & Benotto, G. (2017). Traduco: a collaborative web-based CAT environment for the interpretation and translation of texts. Digital Scholarship in the Humanities, 32, Issue suppl. 1, April 2017, 47–62. Retrieved from https://doi.org/10.1093/llc/fqw054.
  • Giovannetti, E., Bellandi, A., Del Grosso, A., Marchi, S., Pecchioli, A., & Piccini, S. (to appear). La terminologia del Talmud Babilonese: estrazione, rappresentazione e uso nel contesto della Linguistica Computazionale. Materia Giudaica (Atti del XXXIII Congresso Internazionale dell’AISG-Associazione Italiana per lo Studio del Giudaismo, 2–4 settembre 2019, Ravenna).
  • Jori, M., & Sartor, G. (2016). Informatica giuridica. Torino: G. Giappichelli.
  • Melʹčuk, I.A., Clas, A., & Polguère, A. (1995). Introduction à la lexicologie explicative et combinatoire. Bruxelles: Duculot.
  • Dell’Orletta, F., Venturi, G., Cimino, A., & Montemagni, S. (2014). T2K: A System to Automatically Extracting and Organizing Knowledge from Texts. In N. Calzolari, K. Choukri, T. Declerck, H. Loftsson, B. Maegaard, J. Mariani, A. Moreno, J. Odijk, & S. Piperidis (Eds.), Proceedings of 9 th Edition of International Conference on Language Resources and Evaluation (LREC 2014). (pp. 2062–2070). Reykjavik: European Language Resources Association.
  • Talmud Babilonese (2016). Talmud Babilonese. Trattato Rosh haShanà (Capodanno), ed. by R. Di Segni. Firenze: Giuntina.
  • Zitouni, I. (Ed.). (2014). Natural Language Processing of Semitic Languages. Heidelberg: Springer.

Document Type

Publication order reference

YADDA identifier

bwmeta1.element.desklight-3fefa76b-157f-4a55-bf15-fb46596c12ad
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.