Home / Ultimas Noticias
Archivo Noticias de la Ciencia y la
Tecnología.
Archivo Noticias del Espacio
Contacto
Suscripciones (público/email)
Boletín Noticias de la Ciencia y la
Tecnología
Boletín Noticias del Espacio
Boletín Noticias de la Ciencia y la
Tecnología Plus
Suscripciones (servicios a
medios)
Reproducción de contenidos en medios
comerciales
|
Recuerda:
suscríbete a nuestros boletines gratuitos y recibe cómoda y
semanalmente las noticias en tu dirección electrónica.
Informática
Reglas Simples Que Explican las Leyes Universales
del Texto Escrito
15 de
Junio de 2009.
Un
equipo de investigadores ha desarrollado un modelo que podría conducir a
mejores técnicas para identificar términos clave que capturen los temas
tratados en una página web.
Menéame
Alessandro Flammini y Filippo Menczer, de la Universidad de Indiana,
junto a M. Ángeles Serrano de la Universidad de Barcelona, han creado un
modelo generativo que explica a partir de reglas simples la aparición
simultánea de patrones de texto escrito observada en muchos idiomas.
Su estudio se centra en la bien conocida Ley de Zipf sobre las
frecuencias de las palabras, así como en patrones adicionales como la
Ley de Heaps sobre la diversidad de las palabras, y la similitud entre
documentos.
Esta investigación podría tener aplicaciones prácticas en la
informática, las ciencias cognitivas y la lingüística. Por ejemplo,
todos los motores de búsqueda se basan en análisis de textos. El modelo
desarrollado por los investigadores y los descubrimientos que han
realizado en su estudio podrían conducir a mejores técnicas para
identificar términos clave que capturen los temas de una página web, lo
cual es crucial para hacer coincidir consultas de búsqueda con
resultados relevantes.
El equipo de investigación confía, por tanto, en que su trabajo
estimulará investigaciones adicionales en esta área.
El modelo podría acabar poniendo los cimientos de un enfoque capaz de
ayudar a los expertos a mejorar una amplia gama de aplicaciones basadas
en el análisis de texto escrito, como los motores de búsqueda, la
publicidad contextual online y la detección automática de la temática de
una página.
Información adicional en:
|