Buscar este blog

viernes, 19 de octubre de 2012

Generación de expresiones regulares para la creación de reglas en aplicaciones

En tareas de Procesamiento de Lenguaje Natural (PLN) es muy frecuente la utilización de expresiones regulares para la detección de patrones en texto para su posterior análisis y tratamiento. La mayoría de los proyectos que involucra PLN utilizan los patrones a tratar mediante un archivo de reglas externo a la aplicación. Dichas reglas generalmente están conformadas mediante expresiones regulares. Su sintaxis es algo difícil de recordar, debido a que los símbolos utilizados para su construcción, generalmente no tienen un significado semejante al que pudieran tener en lenguaje natural o en lenguajes de programación.

Para facilitar la tarea de generar las reglas y explotar a fondo el potencial de las expresiones regulares es
recomendable utilizar herramientas que permitan probar y corregir errores hasta ponerlas a punto.
Se consultaron varias herramientas informáticas que manipulan expresiones regulares: Visual RegExp v3.1
(Riesterer, 2006), Expresso v3.0 (inc., 2007), RegexBuddy3 (Goyvaerts, 2007), Regextester (Regextester, 2007), Tester de Expresiones Regulares (metriplica.com, 2008) y RegexPal (Levithan, 2008). Ninguna de las herramientas consultadas obtiene la expresión regular a partir de su representación gráfica, el autómata finito, un modelo matemático de un sistema que recibe una cadena constituida por símbolos de un alfabeto y determina si esa cadena pertenece al lenguaje (Hopcroft, 2001), elemento que sería de gran utilidad en la tarea de reducir los esfuerzo mejorando la interpretación y creación de expresiones regulares.

Ver Articulo Generación de expresiones regulares para la creación de reglas en aplicaciones de PLN

No hay comentarios:

Publicar un comentario