Procesamento da linguaxe natural
Na Galipedia, a wikipedia en galego.
O Procesamento da Linguaxe Natural, (PLN, ou NLP; Natural Language Processing), é unha subdisciplina da intelixencia artificial é unha das aplicacións máis útiles da lingüística computacional. O PLN ocupase da formulación e investigación de mecanismos eficaces computacionalmente para la comunicación entre persoas ou entre personas e máquinas por medio de linguaxe natural. O PLN non trata dea comunicación por medio de lenguaxes naturais dunha forma abstracta, senon de deseñar mecanismos para comunicarse que sexan eficaces computacionalmente -que podense realizar por medio de programas que executen ou simulen a comunicación. Os modelos aplicados se enfocan non so á comprensión da linguaxe de por sí, senon a aspectos xerais cognitivos humanos e á organización da memoria. A linguaxe natural sirve so de medio para estudiar estos fenómenos.
Índice |
[editar] Historia
O Procesamiento da Linguaxe Natural (PLN) é unha das pedras angulares tempranas da intelixencia artificial (IA). A Traducción Automática, por exemplo, naceu a finais da década dos corenta, antes de que se acuñara a propia expresión «Intelixencia Artificial». Non obstante, o PLN desempeñou múltiples papeis no contexto da IA, e a sua importancia dentro de este campo ten crecido e decrecido a consecuencia de cambios tecnolóxicos e científicos. Los primeros intentos de traducir textos por ordenador a finais dos anos corenta e durante los cincuenta fracasaron debido a la escasa potencia de los ordenadores y a la escasa sofistificación lingüística. Sen embargo, os esfuerzos realizados nas décadas dos sesenta e os setenta para producir interfaces en lenguaje natural para bases de datos y otras aplicaciones informáticas obtuvieron un cierto grado significativo de éxito. A década dos oitenta e a principios dos noventa viu rexurdir a investigación no terreo da Traducción Automática.
[editar] Dificultades no procesamiento de linguaxes naturais
[editar] Ambigüedade
A linguaxe natural es inherentemente ambiguo a diferentes niveis:
- A nivel léxico, unha misma palabra pode tener varios significados, e a selección do apropiado debese deducir a partir do contexto oracional ou coñecemento básico. Moitas investigacións no campo do procesamento de linguaxes naturais teñen estudiado métodos de resolver as ambigüedades léxicas mediante diccionarios, gramáticas, bases do coñecemento e correlacións estadísticas.
- A nivel referencial, a resolución de [[anáfora]s] e catáforass implica determinar a entidade lingüística previa ou posterior a que fan referencia.
- A nivel estructural, requirese da semántica para desambiguar a dependencia dos sintagmas preposicionais que conducen á construcción de distintos árboles sintácticos.
- A nivel pragmático, unha oración, a miudo, non significa o que realmente estase a dicir. Elementos tales como a ironía teñen un papel importanteena interpretación da mensaxe.
Para resolver estos tipos de ambigüedades e outros, o problema central no PLN é traducción de entradas en linguaxe natural a unha representación interna sin ambigüedade, como árboles de análisis.
[editar] Detección de separación entre as palabras
Na lingua falada, non se acostuman facer pausas entre palabra e palabra. O lugar no que se debe separar as palabras a miudo depende de cal é a posibilidade que manteña un sentido lóxico tanto gramatical como contextual. Na lingua escrita, idiomas como o chino mandarín tampouco teñen separacións entre as palabras.
[editar] Recepción imperfecta de datos
Acentos extranxeros, rexionalismos ou dificultades na producción da fala, errores de mecanografiado ou expresións non gramaticais, errores na lectura de textos mediante OCR
[editar] Compoñentes
- Análise morfolóxica
A análise das palabras para extraer raíces, rasgos flexivos, unidades léxicas compuestas e outros fenómenos.
- Análise sintáctica
A análise da estrutura sintáctica da frase mediante unha gramática da lingua en cuestión.
A extracción do significado da frase, e a resolución de ambigüedades léxicas e estructurais.
A análise do texto máis alá dos límites da frase, por exemplo, para determinar os antecedentes referenciais dos pronomes.
- Planificación da frase
Estrucurar cada frase do texto co fin de expresar o significado adecuado.
- Xeración da frase
A xeración da cadena lineal de palabras a partir da estrutura xeral da frase, cos seus correspondentes flexións, concordancias e restantes fenómenos sintácticos e morfolóxicos.
[editar] Aplicacións
As principais tarefas de traballo na area do PLN son:
- Síntesis do discurso
- Análisis da lenguaxe
- Comprensión da linguaxe
- Recoñecemento da fala
- Traducción automática
- Extracción de información
[editar] Véxase tamén
- Linguaxes naturais
- Xeración de linguaxe natural
- GATE General Architecture for Text Engineering
[editar] Ligazóns externas
- Seminario de Lingüística Informática (SLI) na Universidade de Vigo
- PLN na Universidade Politécnica de Madrid
[editar] Referencias
- Lingüística computacional. Xavier Gómez Guinovart. Manual de Ciencias da Linguaxe, pp. 221-268. Edicións Xerais de Galicia, Vigo, 2000
- Tecnoloxías da lingua galega e normalización lingüística. Xavier Gómez Guinovart. Lingua e investigación: II Xornadas sobre lingua e usos. Universidade da Coruña, A Coruña, 2006
- El procesamiento del lenguaje natural, tecnología en transición. Jaime Carbonell. Congreso de la Lengua Española, Sevilla, 1992
- Lenguas y tecnologías de la información. Ángel G. Jordán. Congreso de la Lengua Española, Sevilla, 1992