Data Mining

Google Mining. Análisis de las páginas indexadas (I)

El proyecto de minería de textos con Excel ha generado el Google Mining. Veamos como puede ayudar la minería de páginas de búsqueda con Google a gestionar una web. Si en el buscador de Google escribimos site: obtenemos todas las páginas indexadas de nuestro sitio. En el caso de AyD ponemos site:analisisydecision.es y tenemos 49 resultados correspondientes a las 49 páginas indexadas. La herramienta que hemos construido con macros de Excel nos tabula la información y el resultado se puede ver en Analisis titulos y metas.

Proyecto. Text Mining con Excel pasa a ser Google Mining

El término Google Mining ya está acuñado, no soy ningún pionero ni he tenido una idea brillante. Pero al preparar la herramienta de Text Mining con Excel me he dado cuenta que estoy contruyendo (sin querer) una potente herramienta para la creación de BBDD de páginas web, una herramienta que puede entrar en Google y tabularme la información que me interese. El proyecto se inició para atraer visitas a www.analisisydecision.es con el uso de macros de Visual Basic. Atraer entradas que buscaran programas en Visual Basic. Sin embargo, cuanto más investigo, más creo en que esto puede ser algo serío e incluso un proyecto que se puede implantar en cualquier organización para medir la calidad de la atención al cliente, para la búsqueda de profesionales,…

Proyecto. Text Mining con Excel (IV)

En la anterior entrega del seguimiento de mi proyecto de minería de textos con Excel creé un proceso que leía búsquedas de Google y las almacenaba en un fichero excel que denominaba base. El problema que me encontré es que generaba un excel con una gran cantidad de hojas y posteriormente tenía que leerlas y extraer la información de cada una. Esta metodología no me parece eficiente, es mejor leer una búsqueda, extraer la información relevante de ella e introducirla en mi tablón de datos.

Proyecto. Text Mining con Excel (III)

Para hacer mi proceso de Text Mining necesito un «tablón» de entrada. Sin información bien tabulada es imposible encontrar patrones sintácticos ni palabras que me ayuden a encontrar mi oportunidad de negocio dentro de la formación en Business Intelligence. Para la realización de este tablón de entrada emplearé macros de Excel que abran resultados de búsquedas en Google y generen tantas hojas en mi archivo como páginas de búsqueda obtenga. Posteriormente estas hojas las uniré en una sóla y está será mi tablón de partida para mi trabajo.

Proyecto. Text mining con Excel (II)

Sin una tabla no hay Text mining. Hay que idear la forma de tabular las búsquedas que realice en Google. Desde Excel puedo abrir cualquier web. En este caso abriré la búsqueda «formación business intelligence» con Excel y veré exactamente lo mismo que puedo ver con un explorador web pero en una hoja de cálculo y con una estructura determinada. Hay que aprender a leer esta estructura para tabular la información.

Proyecto. Text mining con Excel (I)

¿Minería de textos con Excel? ¿Se puede hacer text mining con una hoja de cálculo? La respuesta a estas dos preguntas será SI. Desde hoy paro mis mensajes de formación en R y en SAS y me pongo con un proyecto que lleva días rondando por mi cabeza. Voy a crear una herramienta capaz de identificar oportunidades en internet. Y lo voy a hacer con muy pocos medios, nada de SAS, nada de R, nada de WEKA, sólo con la herramienta de ofimática más habitual: Excel.

Minería de datos, una herramienta clave en consultoría

Las empresas de consultoría se dedican en pocas palabras a hacer crecer a sus clientes en el mercado, es decir, a hacerlos más competitivos y más eficaces. Para conseguir este objetivo utilizan principalmente 2 herramientas: el marketing y el datamining, además del sentido común.

El marketing siempre ha estado unido a este tipo de negocio, por naturaleza el marketing y crecimiento empresarial van unidos. La minería de datos (datamining) es sin embargo un concepto más amplio, no sólo aplicable al ámbito empresarial, si no también con gran importancia en la investigación médica, en algoritmos de aprendizaje, en robótica … etc. Quizás es por ello que la relevancia del datamining ha llegado más tarde al mundo de la Consultoría, aunque hoy en día es una herramienta básica e incuestionable de cualquier consultora, e incluso de cualquier empresa que quiera mejorar su eficiencia o conocer sus puntos débiles con el paso del tiempo.