Las cuentas claras.

Si hay alguna tarea o procedimiento indispensable y más repetitivo hasta la saciedad por excelencia a la hora de trabajar con bases de datos y tener que reportar alguna información por mínima que sea, esta es contar o contabilizar el número de casos (registros) que tenemos en total o en subtotales (por grupos) dentro de una tabla (los llamados datasets en SAS). Para dar mayor utilidad a este ‘tutorial’ sobre conteo, partiré de una tabla con 2 columnas (campos) tipo cadena, es decir tipo texto, de manera que podamos ver diferentes métodos para contar-contabilizar NO solo campos tipo texto sino también trucos que nos den una solución más ‘elegante’ de la combinación de ambos campos tipo cadena. Estos 2 campos se llamarán grupo y tipo, muy empleados por muchos programadores, pero se podrían llamar también familia y familia_segmento o bien comunidad_1 y comunidad_2 o bien zona_tipo1 y zona_tipo2 o bien entorno_primario y entorno_secundario, o si el ejercicio tratase de contar el número de alumnos por sexo y color_ojos bastaría con sexo y color_ojos, etc. etc. ...

22 de mayo de 2010 · danifernandez

Curso de lenguaje SAS con WPS

Paro algunas series de las que venía escribiendo para iniciar una que es de mucha importancia para el blog. Voy a acercar el lenguaje SAS a los lectores con un menor nivel. Se trata de crear un curso introductorio al lenguaje SAS pero con la herramienta WPS. La metodología que seguirá el curso será muy similar a la de un manual que colgué in la red hace unos años. Pero in esta ocasión emplearé un lenguaje más apropiado para el blog y mejoraré algunos puntos del manual e incidiré in otros que no quedan muy claros. ...

21 de mayo de 2010 · rvaquerizo

«Random walk» se escribe con R

Random walk hace referencia a la teoría financiera de que los mercados financieros siguen un camino aleatorio. Pero NO vamos a discutir si se da o NO tal hipótesis; lo que SÍ vamos a hacer es utilizar R para seguir las acciones, fondos de inversión, o sencillamente para ver nuestro decepcionante euro respecto a otras divisas (por si algún día los españolitos debiéramos empezar a emigrar de nuevo… ¡tal como está el patio!). ...

20 de mayo de 2010 · danifernandez

Lecciones de economía de un ignorante. El Club Bilderberg en España

Resulta que el grupo de seres humanos que dirige el mundo se reúne este año en la ciudad de los ingleses borrachos. El Club Bilderberg pasa este año por nuestro país y se me ha ocurrido el siguiente modelo econométrico: 2008 – EEUU – Subprime 2009 – Grecia – Rescate 2010 – España – Glub Por lo visto, entre los asistentes españoles tenemos a la reina Sofía; no va el rey porque, si aparece, ni trabajan ni se reúnen ni nada: se dedican a la fiesta, el jolgorio, y se les olvida crear burbujas, crisis, virus de la gripe, etc. Ya sabéis, las cosas estas a las que se dedican “los que manejan el mundo”. En fin, espero equivocarme, pero el año que viene nos toca a nosotros la crisis gorda. ...

11 de mayo de 2010 · rvaquerizo

Revolution Computing ahora es Revolution Analytics

Sigue adelante este interesante proyecto: http://revolutionanalytics.com/news-events/news-room/2010/revolution-analytics-defines-the-future-of-predictive-analytics-with-r.php Norman Nie sigue trabajando. Saludos.

8 de mayo de 2010 · rvaquerizo

¿Truco? Leer sas7bdat sin SAS

Me han pasado una tabla SAS y no sé cómo llevármela a SPSS. Este problema es habitual y ha traído de cabeza a más de uno. Es lo que tienen estas herramientas tan propietarias; si en tu organización tienen WPS (bueno, bonito y barato), esto no pasa. En fin, me ha llegado esta cuestión y voy a plantearos una posible forma de resolverla. Podríamos usar los formatos XPORT; la persona que me pasa la tabla emplea el libname xport y me envía un fichero .xpt; sin embargo, esto no pasa. Casi siempre nos mandan el .sas7bdat y tenemos un problema. ...

5 de mayo de 2010 · rvaquerizo

Lecciones de economía de un ignorante. ¿Por qué no hablo de la batalla de los depósitos?

Los 4 o 5 que os leéis mis lecciones de economía de todo a 100 echaréis de menos una mención a los depósitos al $4%$. Yo que empecé a hablar de depósitos a pérdidas hace algún tiempo, ahora permanezco callado. Además de la falta de tiempo y el proyecto de seguros, tengo que dar a conocer una visión “conspiranoica” de todo lo que está pasando. Esta visión se resume en: vamos a privatizar de una vez por todas las Cajas de Ahorro. Como si con eso fueran a arreglar algo… ...

4 de mayo de 2010 · rvaquerizo

Trial version del Bridge to R

Si pincháis este link, podéis probar el bridge to R durante 60 días. De todos modos, es probable que algún día aparezca por aquí una macro que comunique de forma más o menos sencilla WPS con R.

1 de mayo de 2010 · rvaquerizo

Macros SAS. Limpiar una cadena de caracteres

Macro de SAS que he utilizado hoy para limpiar caracteres en una cadena de texto. Está muy limitada y es muy sencilla pero puede serviros: %macro valida(in,out); length escribe $55.; escribe=""; do i=1 to length(&in.); j=substr(&in.,i,1); if j in ('A','B','C','D','E','F','G','H','I','J','K', 'L','M','N','O','P','Q','R','S','T','U','V','W','X','Y','Z','Ñ') then escribe=trim(escribe)||j; else if substr(&in.,i,1)=" " then escribe=trim(escribe)||"-"; else escribe=trim(escribe); drop i j escribe; end; &out.=tranwrd(compress(escribe),"-"," "); %mend; Es bastante mala y limitada, insisto. Si alguien aporta algo se agradecerá. El tema es que recorre una variable alfanumérica carácter a carácter y si no es una letra mayúscula se lo chimpunea sin ningún miramiento, aporta un poco más de talento cuando aparece un espacio en blanco. Ahí va el ejemplo de uso: ...

29 de abril de 2010 · rvaquerizo

El modelo multivariante en el sector asegurador. La variable dependiente (III)

Hasta ahora estamos hablando de un concepto muy difuso que denomino «comportamiento siniestral». A la hora de ajustar un modelo estadístico, necesito una variable dependiente que será función de otras variables independientes. Las variables independientes serán los riesgos, a los que también les dedicaremos unas líneas, y la variable dependiente será el comportamiento siniestral; pero este concepto un poco difuso no lo vamos a medir en una sola variable, sino en dos: ...

20 de abril de 2010 · rvaquerizo