Leer y representar datos de Google Trends con R

In el blog del profesor Serrano tomé contacto con el paquete RGoogleTrends para leer datos de Google Trends. Tras diversos intentos y analizando bien el paquete RGoogleTrends, no he sido capaz de hacerlo funcionar. Sin embargo, solo hay que leer un CSV; por esto podemos emplear read.csv() para descargarnos los datos de Google Trends y analizarlos con R. Además, el objeto resultante nos será mucho más familiar que el generado por RGoogleTrends. Para realizar esta lectura necesitamos lo siguiente: ...

11 de marzo de 2011 · rvaquerizo

Curso de lenguaje SAS con WPS. Librerías en WPS

Sobre el trabajo con librerías en SAS se pueden escribir libros. Todas las personas que han aprendido SAS conmigo a lo largo de los años han oído el mismo discurso: «Hay que tener mucho cuidado con las librerías en SAS. Tenemos que tener muy claro qué tablas son temporales y cuáles han de ser permanentes. El problema del trabajo con SAS reside en el espacio en disco». Ya son decenas las personas que ahora hacen lo que pueden con SAS que han escuchado estas palabras y que siguen llenando discos y más discos, incluso de los servidores con SAS más potentes de España. ...

4 de marzo de 2011 · rvaquerizo

Curso de lenguaje SAS con WPS. Sentencias condicionales IF THEN

Las sentencias IF THEN son básicas en la programación SAS y en todos los lenguajes. Su estructura es muy sencilla: IF <condición> THEN <acción>; ELSE <acción>;. Todas estas sentencias empezarán con IF y, como condición, podemos poner una o varias. Para crearlas tenemos los operadores de comparación: Para concatenar condiciones emplearemos los operadores lógicos: Y aplicando la lógica realizaremos las condiciones en nuestra programación con WPS. Entre las acciones que se ejecutarán cuando se cumpla la condición podemos destacar: ...

16 de febrero de 2011 · rvaquerizo

Nuestras funciones de R en menús con rpanel y svWidgets

Hoy quería acercarme a los paquetes rpanel y svWidgets para crear ventanas y menús respectivamente. La idea es sencilla: tenemos funciones en R que empleamos habitualmente y con ellas vamos a realizar un menú. Partimos de una función muy sencilla en R para eliminar datos con valores missing. [Por cierto, qué cansado estoy de escribir palabras en inglés para facilitar las búsquedas: un valor missing es un valor perdido. Tras el lapso, continúo]. Mi función: ...

10 de febrero de 2011 · rvaquerizo

El debate político o como analizar textos con WPS

¿Qué hacen los políticos españoles en el Congreso de los Diputados? Las tertulias radiofónicas están llenas de analistas políticos que podrán opinar sobre la labor del Congreso mejor que yo. Sin embargo, yo tengo WPS, sé programar en SAS y en la web del Congreso están todas las sesiones y todas las intervenciones de la democracia. Pues con estos elementos vamos a iniciar un proceso de text mining, aunque no llegaremos a realizar ningún análisis complejo. Para comenzar, como siempre, necesito datos. Me he guardado la sesión del Congreso de los Diputados del día 26/01/2011 como web y posteriormente con Word la he salvado como fichero de texto (ojo con las codificaciones). De todos modos, podéis descargaros aquí el fichero. ...

4 de febrero de 2011 · rvaquerizo

Curso de lenguaje SAS con WPS. Subconjuntos de variables con DROP y KEEP

En esta entrega del curso vamos a trabajar con dos palabras fundamentales en WPS: DROP y KEEP. DROP elimina variables de un conjunto de datos y KEEP las mantiene. Ahora bien, estos elementos del lenguaje SAS se pueden emplear de diversas formas: pueden ser una sentencia o pueden ser una opción de lectura y escritura del paso DATA. Para ilustrar este capítulo, vamos a generar un dataset con datos aleatorios: ...

27 de enero de 2011 · rvaquerizo

Curso de lenguaje SAS con WPS. Funciones fecha

Las fechas con SAS no están muy bien resueltas; con WPS pasa lo mismo. Era necesario un capítulo especial para hablar sobre fechas en WPS. En este blog ya se habló del tema. Y ahora, con WPS, la entrada será análoga: SAS = WPS. Las funciones las vamos a dividir en cuatro grupos: Funciones de extracción de fecha. Funciones de creación de fecha. Funciones de duración. Funciones de intervalo. Funciones de extracción de fecha Nos permiten «extraer» información de variables de fecha/hora. Veamos un ejemplo para extraer la fecha y la hora de una variable fecha-hora: ...

23 de enero de 2011 · rvaquerizo

Curso de lenguaje SAS con WPS. Introducción a los formatos de variables

Volvemos con el curso de lenguaje SAS con WPS. Estaba parado debido a un problema con las licencias de WPS desde junio de 2010, pero lo retomamos con uno de los capítulos más interesantes: formatos de variables en SAS. Si tuviéramos que definirlos, son imprescindibles tanto para leer como para escribir variables. Y ésa es la característica que los divide: existen formatos de entrada (INFORMAT) y formatos de salida (FORMAT). Se dividen por categorías, entre las que destacan los formatos numéricos, formatos carácter y formatos de fecha. La sintaxis es sencilla: [IN]FORMAT <variable> <formato>;. ...

14 de enero de 2011 · rvaquerizo

Trucos Excel. Área bajo la curva ROC

¿Curva ROC y Excel? ¡Si no tiene nada que ver! No del todo. En ocasiones tenemos que pintar las curvas ROC y empleamos las herramientas específicas para ello; sin embargo, es habitual que nuestros resultados sean presentados en Excel (demasiado habitual). En ese caso, creamos nuestros datos para llevarlos a Excel y realizamos nuestro gráfico. Ya tenemos nuestra tabla y hacemos algo muy parecido a lo que tenemos más arriba. ...

13 de enero de 2011 · rvaquerizo

El modelo multivariante en el sector asegurador. Los modelos por coberturas (V)

Debido a la pobre aceptación, había dado de lado esta serie de monográficos sobre la tarifa multivariante en el sector asegurador. Pero tengo una lectora que sí los seguía y, como yo me debo a mis lectores, continúo con la serie. Recapitulemos: como variables dependientes tenemos la frecuencia siniestral y el coste medio de los siniestros; las variables independientes serán aquellas que compongan la estructura de nuestra tarifa. Como prototipo para determinar qué variables forman parte de nuestro modelo, empleamos el multitarificador de ARPEM. Con este planteamiento, partimos de dos modelos: el modelo de frecuencias y el modelo de costes medios. Sin embargo, a la hora de ajustar, es muy importante plantear un modelo para cada una de las garantías. Parece lógico que el modelo multivariante para el contenido en una tarifa de hogar no ha de ser el mismo que el modelo para el continente. O centrándonos en el modelo de autos (sobre el que está girando nuestra serie), es necesario modelizar los siniestros de responsabilidad civil por un lado, los siniestros de daños propios por otro, defensa, robo… ...

27 de diciembre de 2010 · rvaquerizo