Gráficos de barras y líneas en dos ejes con R

Aunque no es recomendable crear gráficos con 2 ejes, hoy quería mostraros un gráfico muy común realizado con R. Se trata del gráfico de barras y líneas para un factor. Las barras serán un valor de exposición del factor y las líneas pueden ser una frecuencia siniestral y estarán en un eje secundario. Con esto crearemos nuestro gráfico de barras y líneas en dos ejes. Simulamos los datos para crear el gráfico con R: ...

26 de septiembre de 2011 · rvaquerizo

Trucos Excel. Unir varios Excel en uno

Tenía pendiente revisar una de las entradas más visitadas del blog. Trata la problemática de unir varios Excel en uno solo. En el caso concreto, servía para unir varios Excel generados por SAS a través de una macro en SAS. En la entrada de hoy, quiero trabajar con un ejemplo que os podéis descargar aquí en formato RAR. De los archivos que comparto, el más interesante es el que llamamos unir_varios_excel.xlsm: se trata de un archivo Excel para macros que contiene un par de macros más que interesantes. Un pantallazo de este libro de Excel: ...

21 de septiembre de 2011 · rvaquerizo

Univariantes de campos de nuestra BBDD con Kettle

El Kettle no sólo puede servirnos para subir y bajar tablas a nuestra BBDD. También puede ayudarnos a describir las tablas de nuestras BBDD de una forma muy sencilla. El paso Univariate Statistics será nuestro aliado para esta sencilla tarea. Lo primero que tenemos que hacer es crear una conexión a nuestra BBDD. Hace tiempo ya hablamos de esta labor con PostgreSQL. Una vez creada la conexión, comprobamos su correcto funcionamiento; el primer paso será una Entrada Tabla donde seleccionaremos la tabla que deseamos describir: ...

12 de septiembre de 2011 · rvaquerizo

Análisis de textos con R

Vamos a replicar un ejemplo ya presentado con WPS en esta misma bitácora. Tratamos de hacer algo tan sencillo como contar palabras y, para ello, empleamos de nuevo un debate del Congreso de los Diputados de España. Estas intervenciones las transformamos en un fichero de texto que vosotros podéis descargaros de este enlace. Bien, partimos de un archivo de texto de Windows y con él vamos a crear un data.frame de R que contendrá las palabras empleadas en esa sesión del Congreso español. Pasamos a analizar el código empleado: ...

5 de septiembre de 2011 · rvaquerizo

Números aleatorios con SAS

En un solo paso data quiero mostraros las funciones más habituales para generar números aleatorios con SAS. Una entrada para que os copiéis el código y lo analicéis con SAS. Quiero que sirva de guía para que recordéis las funciones más empleadas; además, será muy útil para los que se estén iniciando en el uso de SAS: data aleatorios; drop a b raiz n p; raiz = 20; do i = 1 to 2000; * DISTRIBUCIÓN UNIFORME; uniforme = ranuni(raiz); * ALEATORIO ENTRE 2 NUMEROS; a = 2; b = 10; aleatorio_entre = a + (b - a) * ranuni(raiz); * NORMAL(0,1); normal = rannor(raiz); * NORMAL(a,b); normal_a_b = b * rannor(raiz) + a; * POISSON MEDIA a; poisson = ranpoi(raiz, a); * BINOMIAL TAMAÑO n Y PROBABILIDAD p; n = 10; p = 0.5; binomial_n_p = ranbin(raiz, n, p); * EXPONENCIAL 1; exponencial_1 = ranexp(raiz); * GAMMA(a); gamma_l = rangam(raiz, a); * VALORES ALEATORIOS ENTRE 1 Y 5 CON PROBABILIDADES p1 p2 ...; valores = rantbl(raiz, 0.3, 0.1, 0.2, 0.2, 0.6); output; end; run;

27 de agosto de 2011 · rvaquerizo

Trucos R. De string a data.frame de palabras

Manejo de textos con R en este truco. Partimos de un vector de string y deseamos dividir ese string en palabras y, posteriormente, crear un data.frame de una sola columna con tantos elementos como palabras tenga nuestro vector de cadenas de texto. Es decir, vamos a transformar un texto en una tabla de palabras. Veamos una posible situación: # Este es nuestro elemento inicial texto <- c("Este es el elemento ", "que me gustaría", " poner en una tabla") # Tenemos que generar un data frame con las palabras # que componen este vector texto_split <- strsplit(texto, split = " ") texto_columnas <- data.frame(palabra = unlist(texto_split)) Un código sencillo donde destaca el uso de la función strsplit para crear una lista de palabras con los elementos del vector inicial. Es importante el uso de unlist para realizar el proceso correctamente. Con estas tres líneas podemos hacer cosas muy interesantes; los lectores habituales ya sabrán por dónde voy y cómo obtener los debates del Congreso de los Diputados. Saludos.

9 de agosto de 2011 · rvaquerizo

Lecciones de economía de un ignorante. La prima de riesgo (y la madre que la parió)

El término prima de riesgo está todo el día y a todas horas en los informativos españoles. La bolsa baja porque la prima de riesgo sube, ahora baja, ahora estamos por encima de Italia, luego por debajo, los franceses asustados… En fin, “los mercados” nos tienen asustados porque están locos; algunos llaman a esto volatilidad, que suena más técnico. Y los menos puestos os preguntaréis: ¿qué es la prima de riesgo? Pues aquí estoy yo para transmitir mi ignorancia. Me centro en la zona euro. ...

7 de agosto de 2011 · rvaquerizo

Paquete sas7bdat de R. Me pongo con ello

En su día en esta bitácora se habló de la función sas7bdat de R. Ahora han realizado un paquete de R a partir de esa base. Lo tenéis en el blog SAS and R. De momento es experimental en el CRAN. No solo me gustaría divulgar la noticia; en breve espero tener preparado un repaso al tema a ver si podemos «consolidar» este paquete tan interesante para los usuarios de SAS. También haré nuevas versiones de entradas anteriores para ilustrar el funcionamiento. ...

26 de julio de 2011 · rvaquerizo

I concurso de análisis de datos con R

A pesar de tener la primicia (estoy de vacaciones y no leo habitualmente el correo de mi trabajo), soy el último en hacerse eco de la gran noticia de las III Jornadas de R: el primer concurso de análisis de datos con R. Hay en total 1.500 € en premios que reparte el patrocinador del evento, Nestoria. Nestoria es un motor de búsqueda de inmuebles que está presente en múltiples países. Mi punto de vista sobre el concurso: ...

19 de julio de 2011 · rvaquerizo

What about newer competition from free, open-source alternatives like R?

El tito Goodnight está más pendiente de IBM y Oracle que de R. Está mayor el hombre, pero sigue siendo un genio y un figura. Nunca ha sido mi jefe (no porque yo no quisiera) y no comparto ni una sola de las opiniones que tiene en la entrevista que le hacen, pero hay que reconocer que no se ha equivocado mucho en 40 años porque es una de las fortunas más importantes del mundo. Así que le tendré en cuenta; al fin y al cabo, llevo 10 años diciendo que el futuro pasa por R y empiezo a cansarme: me estoy haciendo más dinosaurio día a día.

16 de julio de 2011 · rvaquerizo