Show simple item record

dc.contributor.advisorGutiérrez de Piñérez Reyes, Raúl Ernesto
dc.contributor.authorCujar Rosero, Alvaro Ricardo
dc.date.accessioned2020-05-14T13:54:17Z
dc.date.available2020-05-14T13:54:17Z
dc.date.issued2016
dc.identifier.urihttp://hdl.handle.net/10893/15276
dc.description.abstractEl POS Tagging es una tarea enmarcada dentro del procesamiento del lenguaje Natulal (PLN), cuyo objetivo esencial es la categorización lingüística de las palabras dentro de un texto. El problema al cual se enfrenta el POS tagging es la ambigüedad, en cuanto a que existen algunas palabras que presentan más de una posible categoría lingüística. Existen diferentes enfoques para resolver esta tarea, entre los que se tienen, modelos estocásticos, modelos basados en reglas, entre otros. Dentro de los modelos estocásticos se encuentran los campos randómicos condicionales (Conditional Random Fields CRF) y las cadenas ocultas de markov (Hidden Markov Chain HMM). Los primeros, utilizados para el etiquetado de secuencias, representan un modelo grá¿co no dirigido, lo que permite que sean discriminativos, y que se puedan incluir características sobre las observaciones. Los segundos, igualmente utilizados para el etiquetado de secuencias, corresponden a un modelo gráfico dirigido, lo cual permite que sean generativos. La desventaja que presentan las HMMs, es que elas para determinar la clasificación del siguiente estado, no tienen en cuenta el pasado, sino el estado actual, además de no permitir incluir características sobre las observaciones. Estas dos debilidades no las presenta los CRFs. El objetivo de este trabajo es realizar un análisis comparativo del rendimiento de estos dos modelos estocásticos, para la tarea del POS Tagging, en el idioma español, bajo el corpus AnCora, teniendo en cuenta las características morfológicas de cada palabra para el modelo CRF.spa
dc.format.extent1 recurso en línea (88 páginas)spa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.publisherUniversidad del Vallespa
dc.subject.ddcCiencias de la computación
dc.subject.ddcLingüística
dc.subject.ddcLenguaje natural
dc.subject.ddcSistemas estocásticos
dc.subject.ddcAnálisis estocástico
dc.titlePos Taggin utilizando CRFS para el españolspa
dc.typeTrabajo de grado - Maestríaspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.publisher.placeColombiaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttps://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/publishedVersionspa
oaire.versionhttp://purl.org/coar/version/c_970fb48d4fbd8a85spa
dc.publisher.facultyFACULTAD DE INGENIERÍAspa
dc.description.degreelevelMaestríaspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa
dc.description.degreenameMAGISTER EN INGENIERÍA ÉNFASIS EN INGENIERÍA DE SISTEMAS Y COMPUTACIÓNspa
dc.publisher.programMAESTRÍA EN INGENIERÍA-ÉNFASIS EN INGENIERÍA DE SISTEMAS Y COMPUTACIÓNspa


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record