Trucos SAS. Operar con fechas YYYYMM típicas de particiones Oracle

Este truco va orientado a programadores SAS que estén habituados a trabajar con Oracle. El SAS Tip de hoy nos permite parametrizar a la perfección la lectura de tablas históricas particionadas. En estos casos, podemos crear parámetros con macrovariables de SAS para leer las tablas Oracle sin necesidad de modificar manualmente las fechas de partición. Un ejemplo Sin parametrizar: proc sql; create table maximo as select idcliente, max(importe) as importe_semestral from ora.tabla where f_particion in (200801, 200806, 200812); quit; Parametrizado: proc sql; create table maximo as select idcliente, max(importe) as importe_semestral from ora.tabla where f_particion in (&mes_menos_6., &mes., &mes_mas_6.); quit; Con este ejemplo queda claro nuestro objetivo. En el siguiente paso DATA veremos las funciones que vamos a emplear para trabajar con fechas de partición AAAAMM (las más habituales): ...

1 de octubre de 2008 · rvaquerizo

Gestores de información de la banca comercial. Profesionales imprescindibles

DEP la banca de inversión o, mejor dicho, RIP, porque la Reserva Federal de los EEUU va a cambiar definitivamente el modelo de banca. Pasamos de una banca no controlada por el estado y basada en riesgos a una banca tradicional mucho más comercial donde los clientes son los principales protagonistas. Desde el punto de vista del analista, pasamos del gurú en activos y bolsa, del gran ingeniero financiero, al analista de cliente. Este nuevo analista tiene que tener una sólida base matemática y conocer a la perfección la información almacenada y los productos de su organización. ...

29 de septiembre de 2008 · rvaquerizo

Truco SAS. Transformaciones de variables con arrays

Hacer ceros los missing en un dataset. Crear una etiqueta "NO DISPONIBLE" en campos carácter sin valores. Cuando trabajamos con SAS, es una situación más que habitual. A continuación voy a plantear un par de ejemplos de cómo podemos usar array de variables en SAS para realizar una transformación “masiva” de variables de nuestro conjunto de datos. Poner missing numéricos a 0 Lo primero es destacar que no siempre un valor perdido equivale a 0. Cuando realizamos modelos, es necesario tener en cuenta qué hacemos con los missing; el siguiente ejemplo transforma todos los . de un dataset a 0: ...

18 de septiembre de 2008 · rvaquerizo

Truco SAS. Proc contents que genera un dataset

Vamos a introducir los nombres de las variables SAS de un dataset en otro dataset. Esto puede sernos muy útil para realizar documentación, validaciones de los conjuntos de datos generados, automatización de instrucciones… Es un truco muy sencillo y tan sólo es necesario comprender el funcionamiento del ODS de SAS, explicado en otro de los mensajes de este blog. Simplemente empleamos el PROC CONTENTS de SAS y almacenamos con ODS en un dataset el resultado del listado de las variables: ...

26 de agosto de 2008 · rvaquerizo

Importar a SAS desde otras aplicaciones

Una de las labores más comunes con SAS consiste en leer e importar ficheros provenientes de otras aplicaciones. Es muy habitual trabajar con tablas de Excel, Access, Lotus, Business Objects, Microstrategy, SQL Server, SAP… Para ello, SAS dispone de algunos módulos que no se encuentran en todas las instalaciones debido a su coste. Por este motivo, voy a introduciros en una metodología muy habitual en el trabajo diario: la importación de textos delimitados con SAS. ...

28 de julio de 2008 · rvaquerizo

Márgenes nulos en los nuevos depósitos bancarios

«Muchas entidades han tirado la casa por la ventana y han ofrecido tipos de interés tan elevados que difícilmente podrán recuperar esa inversión». Cita sacada de aquí. La batalla por el pasivo ha comenzado en el mercado bancario nacional. La exposición del entorno bancario al cemento y al ladrillo hace temer una falta de liquidez; las entidades financieras necesitan pasivo para evitar un posible «corralito». ¿Alguien piensa que la gran banca no ha provisionado los problemas de esta exposición? ¿Alguien piensa que la banca va a tener problemas de liquidez? Por muy vertiginosa que sea la caída, el sistema financiero español está preparado. ...

24 de julio de 2008 · rvaquerizo

Conectar R a una base de datos

Cada día el software libre va ganando más y más terreno al software comercial, no solo por su precio, sino porque incluyen procedimientos más vanguardistas que los comerciales. El mayor problema que tienen es el volumen de datos. Cuando he preguntado a algún desarrollador de los principales software libres (R, Weka, Knime…) acerca de esta cuestión, siempre me han respondido que depende de la capacidad de la máquina o servidor en la que se ejecuten los procesos. Es una respuesta ambigua, es cierto, pero es totalmente cierta. Si dispusiésemos de una máquina con recursos de memoria y almacenamiento ilimitados, el software libre sería prácticamente perfecto. Podríamos decir, entonces, que la principal desventaja de los software libres frente a los comerciales es la gestión de los procesos (mucho más estudiada en los comerciales), además de una consola o interfaz más amigable. ...

22 de julio de 2008 · apadrones

Manual. Curso introducción de R. Capítulo 9: Introducción a la regresión lineal con R

En este capítulo del curso de R vamos a comenzar a estudiar el análisis de regresión lineal. Los modelos de regresión lineal son modelos probabilísticos basados en una función lineal, nuestro objetivo es expresar una variable dependiente en función de otro conjunto de variables. Los pasos básicos a seguir en el estudio de un modelo lineal son: Escribir el modelo matemático con todas sus hipótesis. Estimación de los parámetros del modelo. ...

3 de julio de 2008 · rvaquerizo

Manual. Curso introducción de R. Capítulo 8: Inferencia estadística

En esta nueva entrega del curso de R vamos a trabajar con algunos conceptos básicos de inferencia estadística. En primer lugar, hacemos inferencia a partir de unas observaciones obtenidas a partir de la población, a las que vamos a extraer unas propiedades que se denominan estadísticos muestrales. Además, vamos a conocer la distribución de dichos estadísticos (generalmente distribución normal), por lo que hacemos inferencia paramétrica. La inferencia paramétrica puede recogerse en una vertiente o en otra según el parámetro a estimar; tenemos por un lado la estadística clásica (que es en la que nos vamos a centrar) y por otro lado la estadística bayesiana. ...

23 de junio de 2008 · rvaquerizo

El ODS de SAS (III). Documentos HTML y PDF desde SAS

Desde SAS podemos generar PDF y HTML. Esto es muy práctico a la hora de reportar información, ya que no necesitaremos pasar por Excel o cualquier otra herramienta de ofimática para generar informes. Además, si generamos HTML podemos crear webs en las que podemos navegar por los resultados obtenidos con SAS. En este mensaje veremos algunos ejemplos prácticos de uso del ODS para conocer mejor su funcionamiento. El primero de ellos crea un informe web a partir de un PROC UNIVARIATE: ...

19 de junio de 2008 · rvaquerizo