Extracción terminológica automatizada: aplicación de la herramienta dexter en el ámbito del derecho penal

28 Apr 2022, 15:20
20m
Presenters (Oral Presentation) – Live ZOOM Presentation Todos los temas La innovación, multimodalidad y tecnologías digitales en LFE

Speakers

Angela Alameda Hernández (Universidad de Granada)Mr Pedro Ureña Gómez-Moreno (Universidad de Granada)

Description

En el ámbito de los lenguajes especializados cobra especial relevancia el proceso de extracción terminológica, que permite identificar las unidades léxicas que posteriormente formarán parte de repositorios especializados (e.g. diccionarios, glosarios, etc.) de un dominio de conocimiento. Por este motivo, en los últimos años se han desarrollado diversas herramientas que facilitan y automatizan gran parte de este proceso con mayor o menor grado de cobertura y precisión. El presente trabajo muestra una propuesta para la detección de unidades especializadas basado en un sistema híbrido lingüístico y estadístico. Para ello, se tomará como ejemplo el ámbito terminológico del Derecho Penal y se presentarán las dos fases fundamentales de extracción de nuestro modelo que se mencionan a continuación. En primer lugar, la compilación de un repositorio textual especializado del dominio meta para su posterior pre- y post-procesamiento. En segundo lugar, la configuración y posterior aplicación de la herramienta de extracción DEXTER sobre el repositorio. En tercer lugar, y una vez concluida la fase de extracción, se muestra el trabajo terminológico propiamente dicho, dirigido a depurar el listado de candidatos y a la elección de unidades.

Affiliation of the author(s)

Universidad de Granada (Spain)

Biographical note(s) of the author(s)

Alameda: Research interests: discourse analysis, media discourse, terminology and NLP. She has extensively published academic articles in journals (National Identities, Onomázein, Revista de Lenguas Para Fines Específicos), and book chapters in Palgrave Macmillan and ThomsonAranzadi. Member of various research projects for the development of a knowledge base with specialized domains.
Ureña: Research areas: Morphosyntax and Lexicology within the frameworks of Corpus Linguistics and NLP, with a special interest in Terminology. Authored and co-authored a number of refereed book chapters in Mouton de Gruyter and John Benjamins, and articles in The International Journal of Corpus Linguistics, Onomázein or The LSP Journal.

Contact e-mail address pedrou@ugr.es

Primary authors

Angela Alameda Hernández (Universidad de Granada) Mr Pedro Ureña Gómez-Moreno (Universidad de Granada)

Presentation materials

There are no materials yet.