El debate político o como analizar textos con WPS

¿Qué hacen los políticos españoles en el Congreso de los Diputados? Las tertulias radiofónicas están llenas de analistas políticos que podrán opinar sobre la labor del Congreso mejor que yo. Sin embargo, yo tengo WPS, sé programar en SAS y en la web del Congreso están todas las sesiones y todas las intervenciones de la democracia. Pues con estos elementos vamos a iniciar un proceso de text mining, aunque no llegaremos a realizar ningún análisis complejo. Para comenzar, como siempre, necesito datos. Me he guardado la sesión del Congreso de los Diputados del día 26/01/2011 como web y posteriormente con Word la he salvado como fichero de texto (ojo con las codificaciones). De todos modos, podéis descargaros aquí el fichero. ...

4 de febrero de 2011 · rvaquerizo

Trucos SAS. Borrando blancos innecesarios con COMPBL

Me ha llegado hoy una duda interesante. El problema era eliminar espacios en blanco innecesarios mediante alguna función de SAS. Más concretamente, teníamos algo parecido a: data prueba; nombre = "DE PEDRO MARTINEZ ESTEBAN JOSE"; /* QUEREMOS LLEGAR A: DE PEDRO MARTINEZ ESTEBAN JOSE */ run; Pues bien, esto se puede hacer con la función COMPBL, que removes multiple blank spaces with SAS: data prueba; nombre = "DE PEDRO MARTINEZ ESTEBAN JOSE"; nombre2 = compbl(nombre); put nombre2; run; Una función fácil y práctica que seguro conocéis, pero que no está mal recordar. Saludos.

1 de febrero de 2011 · rvaquerizo

Trucos SAS. Variables dicotómicas desde factores

El verbo “dumificar” es una invención propia y consiste en la acción de transformar una variable en una o $n$ variables dicotómicas; eso es lo que os planteo en esta entrada: dumificar variables cualitativas con SAS. Partimos de una variable discreta o factor y hemos de transformarla en $n$ variables (tantas como valores tome el factor) que toman valores 1 o 0 en función del grupo al valor que toma. Gráficamente: ...

31 de enero de 2011 · rvaquerizo

Muchas variables no implican una mejor predicción

Me sigo durmiendo con el genio Juan Antonio Cebrián y sus pasajes de la historia, monográficos zona cero o tertulias 4 C. Sus programas de radio me acompañan desde hace muchos años. Estudiando, vigilando instalaciones del ejército o en el turno de noche de una fábrica, Cebrián y su gente han estado conmigo. En alguna ocasión hablaron del código secreto de la Biblia, un código existente en la Torá (Pentateuco) que se resume en “todo está escrito”. Y es que una gran cantidad de información puede provocar relaciones al azar (o al azahar, como le gusta decir a un buen amigo). Y esto puede pasarnos en nuestros modelos matemáticos. Ejecutemos el siguiente código en R: ...

30 de enero de 2011 · rvaquerizo

Truco R. Paletas de colores en R

En cuántas ocasiones habéis querido dar color a un gráfico y, por aligerar código, creáis gráficos de este tipo: x <- rpois(100, as.integer(runif(10) * 1000)) barplot(sort(x)) Pues en R esta labor puede costarnos muy poco si empleamos las paletas de colores. Hoy quiero presentaros las siguientes: rainbow heat.colors terrain.colors topo.colors Ejemplos de uso: require(graphics) barplot(sort(x), col = rainbow(length(x)), main = "Paleta rainbow") barplot(sort(x), col = heat.colors(length(x)), main = "Paleta heat") barplot(sort(x), col = topo.colors(length(x)), main = "Paleta topo") Comparad; metemos los cuatro gráficos en una sola ventana y tendremos la figura con la que iniciamos esta entrada: ...

30 de enero de 2011 · rvaquerizo

Curso de lenguaje SAS con WPS. Subconjuntos de variables con DROP y KEEP

En esta entrega del curso vamos a trabajar con dos palabras fundamentales en WPS: DROP y KEEP. DROP elimina variables de un conjunto de datos y KEEP las mantiene. Ahora bien, estos elementos del lenguaje SAS se pueden emplear de diversas formas: pueden ser una sentencia o pueden ser una opción de lectura y escritura del paso DATA. Para ilustrar este capítulo, vamos a generar un dataset con datos aleatorios: ...

27 de enero de 2011 · rvaquerizo

Curso de lenguaje SAS con WPS. Funciones fecha

Las fechas con SAS no están muy bien resueltas; con WPS pasa lo mismo. Era necesario un capítulo especial para hablar sobre fechas en WPS. En este blog ya se habló del tema. Y ahora, con WPS, la entrada será análoga: SAS = WPS. Las funciones las vamos a dividir en cuatro grupos: Funciones de extracción de fecha. Funciones de creación de fecha. Funciones de duración. Funciones de intervalo. Funciones de extracción de fecha Nos permiten «extraer» información de variables de fecha/hora. Veamos un ejemplo para extraer la fecha y la hora de una variable fecha-hora: ...

23 de enero de 2011 · rvaquerizo

Mutua Madrileña compra el 50% de Adeslas Seguros Generales

Interesante movimiento de Mutua para crecer de forma inorgánica y expandirse fuera de Madrid. Es beneficioso para todos, un gran movimiento: para Criteria, que pilla dinerito fresco y se quita de problemas con Solvencia II; para Mutua, que será líder en seguro de Salud con la unión Adeslas-Aresa y que debe meterse entre las tres primeras entidades de no vida (tengo que darme una vuelta por ICEA). Lo que más llama la atención es la capacidad de Mutua, que asegura hacer la operación con fondos propios (con un par). Ahora sólo queda que Mutua se meta a fondo con el canal directo. ¿Línea Directa, por ejemplo? ...

17 de enero de 2011 · rvaquerizo

¿El Power Point nos vuelve tontos?

Ojo, no quiero decir que el Power Point sea para tontos. Solo me hago eco de esta noticia, un poco anticuada pero que me ha hecho mucha gracia. A ver si podemos debatir. Yo de momento no opino (por no ofender).

16 de enero de 2011 · rvaquerizo

Curso de lenguaje SAS con WPS. Funciones en WPS

A la hora de trabajar con variables en WPS, uno de los elementos fundamentales son las funciones. En WPS son completamente análogas a SAS. Además, este capítulo quiero que nos sirva para familiarizarnos un poco más con el interfaz de WPS y con sus elementos. Vamos a crear un script, un programa SAS, dentro de nuestro proyecto. Nos ubicamos en el Project Explorer, pulsamos el botón derecho y seleccionamos New — Other; en la ventana que nos sale, nos vamos a WPS y generamos un nuevo programa (script) al que damos el nombre de “funciones”: ...

15 de enero de 2011 · rvaquerizo