Big Data
Descripción
Ceit dispone del conocimiento en la tecnología necesaria para obtener información útil de los datos de los que se disponen con el acompañamiento del experto del sector. Para ello, es necesario tener las competencias necesarias tanto para todo el tratamiento de datos per sé, (gestión de bases de datos, selección de variables, procesos ETL/ELT, filtrado de datos) como para la aplicación de distintos algoritmos según el objetivo que se persiga. Se incluyen los algoritmos supervisados, no supervisados o semi-supervisados, incluyendo también las redes neuronales adicionalmente a los algoritmos más tradicionales de aprendizaje automático (svm, clustering, k-means, regresiones logísticas, random forest, ….). Se incluyen también algoritmos de optimización.
Aparte de entender y decidir en cada momento qué algoritmo aplicar, también es necesario tomar decisiones en cuanto a la implementación concreta del algoritmo a utilizar: existen diversas alternativas, y no hay una única mejor que se adecúe a los distintos casos. E.g.: librerías en Python, librerías en R, librerías en java (WEKA), Mahout, SparkML, FlinkML…