Random Forest – Modeling The Titanic Voyage with R

David Carrasco Data Science Leave a Comment

What’s a Random Forest? Random Forest is a machine learning algorithm used normally for classification and regression tasks in supervised learning which consists on an ensemble or group of simple decision tree models to predict the value of a target variable based on a bunch of input variables. The main advantage regarding a simple decision trees is that reduces the …

Random Forest – The magic behind the algorithm

David Carrasco Data Science Leave a Comment

Random Forest is an ensemble model based on decision trees which is built through the Bagging technique used for classification and regression tasks in supervised learning (Although, it can be used in unsupervised learning too). Yes, it’s a bit more technical than the definition in the previous post, isn’t it? Well, let’s explain the main concept behind the Random Forest …

H2O.ai y Data Science Madrid: como agua de mayo

Datatons Data Science Leave a Comment

Parece que la primavera quiere aparecer: días más largos, temperaturas más suaves durante el día… todo empieza a florecer y nosotros no podíamos ser menos. Nos quitamos la bufanda y los guantes y nos lanzamos de lleno a la primavera. Así que, para celebrar el resurgir de la vida, ¿qué mejor manera que traeros el agua de mayo de los …

Data Science Madrid Meetup Enero 2017

Datatons BigData Architecture, Business, Data Science, Technology Leave a Comment

El pasado 21 de de Enero tuvo lugar el meetup mensual de Data Science Madrid, en esta ocasión además pudimos colaborar con nuestros colegas de Madrid 4 OpenStack para celebrar en el evento en el Auditorio de Medialab Prado. La agenda de las charlas fué la siguiente: • “Open Stack y Big Data” por Daniel Mellado y Carlos Camacho Introducción …

Roles en ORE 1.5 – RQROLE y RQADMIN

David Carrasco ORE Leave a Comment

Con la llegada de ORE 1.5, se incluyen diversas mejoras en el gobierno de scripts y datastores a nivel de permisos y trazabilidad, de forma que según el rol asignado a cada usuario (RQROLE o RQADMIN), éste podrá registrar o no scripts en el sistema. En el caso de que gestionemos la plataforma y tengamos que editar el role de algún usuario y …

Vistas en ORE y el parámetro query en ore.sync()

David Carrasco ORE Leave a Comment

Una vista, a grandes rasgos, es una tabla virtual que se guarda en la memoria de la base de datos que nos puede ser muy útil ya que nos permite consultar una o varias tablas en base a una sentencia SQL que nosotros definimos. Vamos a ver cómo crear una vista en Oracle y posteriormente, cómo podríamos conseguir el mismo …

Schemas y permisos de tablas en ORE

David Carrasco ORE Leave a Comment

En ocasiones, tras conectarnos con ORE a nuestra base de datos con determinados schemas para operar diversas tablas, olvidamos sobre que schema estamos conectados y/o no sabemos si tenemos permisos para poder interactuar con la tabla que deseamos. A continuación, se han detallado 2 snippets para solucionar estos dos pequeños problemas. 1) Cómo consultar el schema en el que estoy …

Indexación y orden de filas en ore.frames

David Carrasco ORE Leave a Comment

Un error muy común cuando usamos ORE y estamos tratando con ore.frames es indexar por el número de fila sin establecer el orden de las filas, como podemos ver en el siguiente ejemplo:

Dado que ORE no preserva el orden de las filas cuando se crea y sincroniza con la base de datos, para resolver este problema tenemos que …

Valores nulos ‘\0’ en data.frames con ORE

Ines Huertas ORE Leave a Comment

En ocasiones, puede ocurrir que al descargar una tabla con “ore.get()” de la base de datos, obtenemos un error indicándonos que no podemos leer dichos datos porque hay valores nulos ‘\0’ en el frame de datos: Es un problema que puede darse tras un volcado directo a la base de datos en el que el encoding no es el apropiado …