Desarrollo de IDE para R

Sigo añadiendo pocos mensajes al blog por falta de tiempo. Corren malos tiempos para el ahora escribiente. A este paso, el blog no llegará nunca a las 4.000 visitas mensuales, objetivo muy ambicioso para este 2010. Pero en este mensaje quería enlazar el blog de un ex compañero: http://miguelinlas3.blogspot.com/ Interesante proyecto que crea un entorno de desarrollo integrado (IDE) para R. De momento lo está desarrollando, pero cuando note el incremento de visitas desde este sitio (porque lo notará), y si lo nota y le seguimos, le servirá de presión para que continúe su desarrollo. Saludos.

18 de marzo de 2010 · rvaquerizo

Lectura para el fin de semana

Cada vez me caen mejor estos de MineQuest y llevo un tiempo siguiendo el blog de Adventures in Consulting. Me voy a dar de comer a mi león.

12 de marzo de 2010 · rvaquerizo

¿Google enemigo del open source?

Carlos Gil ya habló de Hadoop hace algún tiempo y, en su blog, hizo referencia de nuevo a la gestión de información desestructurada, por lo que despertó mi curiosidad sobre MapReduce y el procesado de datos en paralelo (http://sentidoweb.com/2007/11/21/hadoop-plataforma-para-trabajar-con-gran-cantidad-de-datos.php). Pero lo primero que me llamó la atención fue que Google no pusiera pegas sobre el «uso o aprovechamiento» de su algoritmo de MapReduce. Al fin y al cabo, tras la salida a bolsa de Google en 2004, quedaba claro que era una empresa con un objetivo comercial. No seré yo quien critique este objetivo: son los mejores y punto. Pero en todo este proceso de aproximación a Hadoop y MapReduce, me encuentro con esta noticia. ...

7 de marzo de 2010 · rvaquerizo

Comparativa de Precio: WPS vs. SAS

Tenía pendiente comparar el precio entre SAS y WPS. La consultora MineQuest ya lo ha hecho por mí. Y ha dejado el resultado plasmado en este documento. En fin, cada cual que saque sus propias conclusiones. Con lo que se puede ahorrar en licencias se puede llamar a Datanalytics (por ejemplo): implantaría la herramienta y podría hacer una auditoría y optimización de los procesos empleados, eso sí, si Carlos no está en Sebastopol o más lejos. ...

26 de febrero de 2010 · rvaquerizo

Trucos Excel. Modificar la configuración regional con Visual Basic

Con Visual Basic podemos modificar la configuración regional. Podemos crear macros en Excel que nos realicen esta tarea. De este modo, si trabajamos con aplicaciones que tienen configuración americana, podemos cambiarla con una macro, pegar los valores y volver a cambiar la configuración. Para poner separador decimal “.” y separador de miles “,”, tendremos que emplear el siguiente código: Sub formato_americano() ' Macro para poner formato americano With Application .DecimalSeparator = "." .ThousandsSeparator = "," .UseSystemSeparators = False End With End Sub Es un excelente ejemplo de uso de Application. De forma análoga, si deseamos volver a la configuración europea, sólo debemos emplear los separadores del sistema: ...

21 de febrero de 2010 · rvaquerizo

¿Qué compañía está entre las 12 ‘Companies to Watch’ in 2010?

Interesante dato de Intelligent Enterprise. http://intelligent-enterprise.informationweek.com/channels/business_intelligence/showArticle.jhtml;jsessionid=CPH2HNI3ADRRVQE1GHPSKHWATMY32JVN?articleID=222900034&pgno=3 La lástima es que el BI está moribundo. En 2012 será un concepto obsoleto. Por cierto, R-Project tiene que plantearse esa web de una vez por todas.

18 de febrero de 2010 · rvaquerizo

Monográfico. Análisis de Factores con R (una introducción)

El análisis de factores es una técnica de reducción de datos: menor dimensión, mayor porcentaje de varianza. Distinguimos el análisis factorial exploratorio del análisis factorial confirmatorio en función del conocimiento del número de factores a obtener. Este análisis está muy relacionado con el análisis de componentes principales, pero no buscamos explicar el mayor porcentaje de varianza a partir de combinaciones lineales de variables; buscamos conjuntos de variables comunes entre sí. Este análisis supone que hay un factor intrínseco a las variables a combinar. El proceso a seguir para este tipo de análisis sería: ...

11 de febrero de 2010 · rvaquerizo

Un problema a WPS. Infile url no funciona

ERROR: url is not a valid access method. The access method names are : DDE, EMAIL He encontrado una pega que no me gusta al WPS: filename pepin url "http://news.google.es/news?q=banco santander&oe=utf-8&rls=org.mozilla:es-ES:official&client=firefox-a&um=1&ie=UTF-8&sa=N&hl=es&tab=wn"; data uno; infile pepin; run; No se puede hacer en WPS. Desconozco si es necesario otro módulo, pero es un problema. Aun así, me sigue gustando mucho. Saludos.

7 de febrero de 2010 · rvaquerizo

Lecciones de economía de un ignorante. «la Caixa» a colocar preferentes

No tengo palabras; creía que eran rumores y estoy a punto de llorar. Hoy empiezan a colocar deuda subordinada otra vez en «la Caixa», y nada menos que 2.000 millones ampliables a 3.000: la Caixa lanza una emisión de 2.000 millones de deuda subordinada ¿Qué probabilidades hay de quiebra de «la Caixa»? Ninguna, pero ahí no está el riesgo. La deuda subordinada, como las participaciones preferentes, no son una inversión exenta de riesgo. Si os lo digo yo, a lo mejor no os lo creéis, pero si os lo dicen desde rankia.com, empezaréis a tomarlo más en serio. ...

1 de febrero de 2010 · rvaquerizo

Truco R. Valores perdidos a 0, ejemplo de uso de sapply

Muy habitual partirnos la cabeza con valores perdidos en R. Los NA pueden darnos algún quebradero de cabeza. Este truco es muy sencillo: transforma valores missing a 0 y nos sirve para aplicar funciones a data.frame con la función sapply. Veamos el sencillo ejemplo: x <- c(1, 23, 5, 9, 0, NA) y <- c(5, 45, NA, 78, NA, 34) dataf <- data.frame(x, y) mean(dataf$x, na.rm = TRUE) mean(dataf$y, na.rm = TRUE) # Podría interesarnos tener en cuenta los NAs sum(dataf$x, na.rm = TRUE) / nrow(dataf) sum(dataf$y, na.rm = TRUE) / nrow(dataf) Tenemos un data.frame con dos variables que contienen valores perdidos; deseamos crear una función que pase estos valores a 0 y aplicarlo al data.frame de partida: ...

31 de enero de 2010 · rvaquerizo