Los usuarios de R disponen de una serie de algoritmos estándar para generar y manipular árboles de decisión. Los más habituales están contenidos en alguno de los siguientes paquetes:
- rpart, tal vez mi favorito.
- RWeka, un paquete más genérico que permite realizar llamadas a funciones de Weka desde R.
- mvpart.
- party.
Cada uno de ellos tiene un interfaz distinto y operaciones como las de realizar predicciones, dibujar los árboles, etc., exigen conocer funciones específicas. (Éste es, de hecho, un problema genérico de R derivado de su naturaleza cooperativa).
Pero la situación va a cambiar con el paquete partykit, todavía en fase de desarrollo, que, según sus autores, va a ofrecer «una representación unificada de los árboles, así como métodos predict(), print() y plot()». Esto además de otras novedades, como una reimplementación del algoritmo CHAID y mejoras en la visualización de algunos de los tipos de árboles más habituales.
La presentación en sociedad del nuevo paquete va a realizarse en la conferencia de usuarios de R y es de esperar que, una vez disponamos de una versión estable del paquete, cambie de manera sustancial la manera en que utilicemos esta familia de modelos tan importante en la práctica.