partykit: un paquete de R para generar y manipular árboles de decisión
Los usuarios de R disponen de una serie de algoritmos estándar para generar y manipular árboles de decisión. Los más habituales están contenidos en alguno de los siguientes paquetes:
- rpart, tal vez mi favorito
- RWeka, un paquete más genérico que permite realizar llamadas a funciones de Weka desde R
- mvpart
- party
Cada uno de ellos tiene un interfaz distinto y operaciones como las de realizar predicciones, dibujar los árboles, etc. exigen conocer funciones específicas. (Éste es, de hecho, un problema genérico de R derivado de su naturaleza cooperativa).
Pero la situación va a cambiar con el paquete partykit, todavía en fase de desarrollo, que, según sus autores, va a ofrecer «una representación unificada de los árboles, así como métodos predict()
, print()
y plot()
«. Esto además de otras novedades, como una reimplementación del algoritmo CHAID y mejoras en la visualización de algunos de los tipos de árboles más habituales.
La presentación en sociedad del nuevo paquete va a realizarse en la conferencia de usuarios de R y es de esperar que, una vez dispongamos de una versión estable del paquete, cambie de manera sustancial la manera en que utilicemos esta familia de modelos tan importante en la práctica.