Un detalle puede hacer que no te tomen en serio

Preocupado por la caída en bolsa de ING y, sobre todo, de Société Générale, esta mañana he dado un paseo por la prensa nacional. De momento, parece que ninguna entidad española va a tener los mismos problemas que otros gigantes europeos, muy a pesar de lo que diga Merrill Lynch. Navegando por otras noticias, me he encontrado esta fotografía en El País: Una fosa común con restos de personas de un bando. Hasta aquí todo normal, pero miremos más la fotografía… Hay un detalle que hace que esta imagen pueda resultar motivo de burla. Miradla bien… ...

20 de octubre de 2008 · rvaquerizo

Manual. Curso introducción de R. Capítulo 12: Análisis de la varianza. Diseños bifactoriales

En esta nueva entrega del manual de R vamos a ver un modelo ANOVA que analiza dos fuentes de variación. Si recordamos, en el capítulo 11 estudiamos la diferencia entre los tratamientos que seguían determinados pacientes: teníamos una variable respuesta en función de una variable factor, el diseño factorial aleatorizado. En este caso, vamos a tener la variable respuesta en función de dos factores y podrá existir una interacción entre ambos, con lo que la tabla ANOVA será del siguiente modo: ...

4 de octubre de 2008 · rvaquerizo

Manual. Curso introducción de R. Capítulo 10: Funciones gráficas en regresión lineal

En esta nueva entrega del manual de R vamos a trabajar con más ejemplos de regresión lineal haciendo especial mención a las posibilidades gráficas de R. El ejemplo de partida será el mismo empleado en el capítulo 9. Ejemplo 10.1: Si recordamos en el capítulo 9 en el ejemplo 9.2 hicimos un modelo para predecir las notas finales a partir de las notas de los exámenes previos, el test y la puntuación del laboratorio. Teníamos una variable dependiente que era la nota final y cuatro variables regresoras. Vimos que el modelo presentaba múltiples lagunas (multicolinealidad, un modelo con un r cuadrado bajo,…). Pues ahora hemos de mejorar el modelo. Es difícil mejorarlo en precisión porque no tenemos más variables regresoras en el conjunto de datos por eso podemos mejorarlo haciéndolo más sencillo y recogiendo una cantidad de información lo más grande posible con un modelo lo más reducido posible, es decir, vamos a seleccionar un modelo de regresión. Para hacer esto contamos con la función step que selecciona el modelo a partir del criterio de información de Akaike (AIC, siglas en inglés). Creamos un estadístico que permite decidir el orden de un modelo. AIC toma en consideración tanto la medida en que el modelo se ajusta a las series observadas como el número de parámetros utilizados en el ajuste. Buscamos el modelo que describa adecuadamente las series y tenga el mínimo AIC. Comencemos a trabajar con R, el primer paso será obtener y preparar el conjunto de datos: ...

3 de octubre de 2008 · rvaquerizo

Manual. Curso introducción de R. Capítulo 11: Introducción al análisis de la varianza (ANOVA)

Para realizar la introducción al análisis de la varianza (ANOVA) con R comenzaremos estableciendo unos conceptos básicos. Lo primero que hacemos es plantear una hipótesis que va a motivar un experimento, elegimos el diseño para nuestro experimento y recogemos los datos y los analizamos mediante el análisis de la varianza que consiste en descomponer la variabilidad total de los datos en sumandos cada uno de ellos asignable a una fuente de variación; posteriormente ya sacamos conclusiones. Lo que se expone a continuación viene recogido en los libros: ...

3 de octubre de 2008 · rvaquerizo

Como influyen los números máquina en nuestros programas

Es imposible no cometer un error a la hora de ajustar un número de máquina, ya que todos los números tienen un espacio asignado y números con infinitos decimales no se pueden almacenar en memoria correctamente. Este «pequeño» error puede influir en nuestra programación. Vamos a crear una función en R que nos permita ejemplificar cómo pueden influir los errores de aproximación de los números de máquina en la programación. La siguiente función realiza la operación aritmética 1.1/11, 3.3/33… y, mediante la función ifelse, creamos una condición: ...

1 de octubre de 2008 · rvaquerizo

Trucos SAS. Operar con fechas YYYYMM típicas de particiones Oracle

Este truco va orientado a programadores SAS que estén habituados a trabajar con Oracle. El SAS Tip de hoy nos permite parametrizar a la perfección la lectura de tablas históricas particionadas. En estos casos, podemos crear parámetros con macrovariables de SAS para leer las tablas Oracle sin necesidad de modificar manualmente las fechas de partición. Un ejemplo Sin parametrizar: proc sql; create table maximo as select idcliente, max(importe) as importe_semestral from ora.tabla where f_particion in (200801, 200806, 200812); quit; Parametrizado: proc sql; create table maximo as select idcliente, max(importe) as importe_semestral from ora.tabla where f_particion in (&mes_menos_6., &mes., &mes_mas_6.); quit; Con este ejemplo queda claro nuestro objetivo. En el siguiente paso DATA veremos las funciones que vamos a emplear para trabajar con fechas de partición AAAAMM (las más habituales): ...

1 de octubre de 2008 · rvaquerizo

Gestores de información de la banca comercial. Profesionales imprescindibles

DEP la banca de inversión o, mejor dicho, RIP, porque es La Reserva Federal de los EEUU la que va a cambiar definitivamente el modelo de banca. Pasamos de una banca no controlada por el estado y basada en riesgos a una banca tradicional mucho más comercial donde los clientes son los principales protagonistas. Desde el punto de vista del analista, pasamos del gurú en activos y bolsa, del gran ingeniero financiero, al analista de cliente. Este nuevo analista tiene que tener una sólida base matemática y conocer a la perfección la información almacenada y los productos de su organización. ...

29 de septiembre de 2008 · rvaquerizo

Contenidos de octubre en función del conocimiento de los usuarios

Google Analytics me está permitiendo conocer a los usuarios que navegan por AyD. Y in función de este conocimiento quiero orientar los contenidos para el mes de octubre. AyD está funcionando por debajo de mis previsiones de visitas nuevas, pero muy por encima de mis previsiones de visitas que repiten. Es decir, la captación no va todo lo bien que esperaba, pero la fidelización me está sorprendiendo gratamente. Voy a describir las visitas desde el 1 de agosto de 2008 al 15 de septiembre de 2008. ...

21 de septiembre de 2008 · rvaquerizo

Crecimiento del comercio electrónico, pero del comercio electrónico de siempre

Planteándome un artículo sobre el escaso futuro a medio plazo de la prensa escrita, he llegado al siguiente dato que nos ofrece la Comisión del Mercado de las Telecomunicaciones (CMT): «El comercio electrónico crece un 52% en España en 2007». El volumen de compra está muy cerca de los 4.000 millones de euros y son las empresas españolas las que han generado más volumen. Parece que está cerca un cambio en el comportamiento de los consumidores: cada vez usamos más el comercio electrónico. Pero sólo lo parece, porque al final las compras a través de la red se centran en búsquedas de viajes, juegos de azar y compra de entradas; las compras de siempre. ...

18 de septiembre de 2008 · rvaquerizo

Truco SAS. Transformaciones de variables con arrays

Hacer ceros los missing en un dataset. Crear una etiqueta "NO DISPONIBLE" en campos carácter sin valores. Cuando trabajamos con SAS, es una situación más que habitual. A continuación voy a plantear un par de ejemplos de cómo podemos usar array de variables en SAS para realizar una transformación “masiva” de variables de nuestro conjunto de datos. Poner missing numéricos a 0 Lo primero es destacar que no siempre un valor perdido equivale a 0. Cuando realizamos modelos, es necesario tener en cuenta qué hacemos con los missing; el siguiente ejemplo transforma todos los . de un dataset a 0: ...

18 de septiembre de 2008 · rvaquerizo