Blog: Josep Curto Díaz Subscribe to this blog's RSS feed!

Josep Curto Díaz

Bienvenidos a mi blog en BeyeNETWORK, en el que focalizaré sobre las novedades del mercado Business Intelligence Open Source respecto software, tendencias de mercado, conferencias, mejores prácticas y cualquier novedad que permita a nuestros lectores estar informados con mayor frecuencia.

About the author >

Josep Curto es Area Manager en ICNET Consulting. Está focalizado en la implantación de Sistemas Business Intelligence, incidiendo en ofrecer la solución adecuada a las necesidades de sus clientes, con especial atención a las del emergente mercado Business Intelligence Open Source. Es Master en Business Intelligence y Master en Dirección y Gestión en Sistemas y Tecnologías de la Información por la UOC y licenciado en Matemáticas. Ha conjugado su carrera profesional con una clara vocación por educación superior siendo profesor en la Universidad Autónoma de Barcelona (UAB) y en la Universitat Oberta de Catalunya (UOC). Autor del blog Information Management. Es colaborador esporádico en la revista Gestión del Rendimiento. Josep puede ser contactado mediante Josep.curto@icnetconsulting.com.

La siguiente versión de weka (3.7.2) trae una revisión de la plataforma hacia un core mucho más simple y liviano (con los algoritmos tradicionales) y la disponibilidad del resto de algoritmos como descargas (soportados por el equipo de Weka y por los que los han creado).

El objetivo es simplificar los primeros pasos en Weka al tener una interficie con menos algoritmos de entrada. De paso también se consigue mejorar el mantenimiento de la solución al hacerla modular.

Son buenas noticias que Pentaho continue realizando acciones relacionadas con Weka que faciliten tanto su desarrollo como su usabilidad (como por ejemplo, la posibilidad de lanzar procesos de Weka vía Pentaho Data Integration). Esperemos que poco a poco vayan incorporando más funcionalidades de Weka hacia la suite de Pentaho y sus componentes.

Fuente: Pentaho Wiki

Posted March 16, 2010 5:26 AM
Permalink | No Comments |
Cuando hablamos de OSBI muchas veces es fácil quedarse con los principales nombres como Pentaho, Jaspersoft, BIRT de Actuate o R-Project. Existen otras interesantes iniciativas a tener en cuenta y vigilar cómo evolucionan. Por ejemplo, la de SQLPower Software.

Esta empresa ha creado una colección de herramientas open source basadas en java y por lo tanto multiplataforma que responden a las necesidades usuales de un proyecto de inteligencia de negocio. A saber:

  • SQL Power Architect (Data Modeling & Profiling Tool): herramienta de modelización de datos que nos permite diseñar el data mart o data warehouse e incluso hacer profiling de los datos cargados.
  • SQL Power Loader (ETL Tool): una herramienta de ETL que permite alimentar de datos al data warehouse o data mart.
  • SQL Power DQguru (Data Cleansing & MDM Tool): para realizar procesos de limpieza de datos y gestión de datos maestros.
  • SQL Power Wabit (The Intuitive BI Reporting Tool): para realizar self-service BI / ad-hoc querys.
  • SQL Power Dashboard (Executive Dashboard): para el diseño de scorecard e informes para la alta dirección.
  • SQL Power XBRL forms: para enviar y gestionar datos XBRL.

Como podemos ver ofrece aire fresco respecto otras soluciones incluyendo tanto MDM (que por ahora sólo incluye Talend) como XBRL (por primera vez tenido en cuenta en una solución open source). Es decir, buenas ideas desde Canada.

Cabe comentar que algunas de ellas cuentan con una versión de subscripción con características premium.

Fuente: http://www.sqlpower.ca

Posted March 8, 2010 7:34 AM
Permalink | 2 Comments |
Uno de los puntos que frecuentemente preocupa en los desarrollos de BI es el tiempo de desarrollo. Ya sabemos que uno de los puntos dónde se gasta más tiempo es en el desarrollo del Data Warehouse.

Existen soluciones que abordan ese problema desde diferentes enfoques:

  • Creación de data marts in-memory (pero está claro que no es un data warehouse).
  • Desplegar soluciones SaaS enfocadas al self-service BI que frecuentemente tampoco incluyen la construcción del data warehouse sino de pequeños data marts.
  • Reducir el tiempo de desarrollo mediante propuestas de desarrollo ágil.
Es este última tendencia a la que apunta el equipo de Pentaho al presentar su propuesta de diseño ágil.

¿En qué consiste su propuesta? En aunar en la herramienta de ETL, las capacidades de crear la capa de metadatos OLAP y la creación de elementos / vistas de análisis. Se persigue, por lo tanto, reducir el tiempo de desarrollo de soluciones analíticas sin menospreciar el desarrollo incremental del data warehouse.

Actualmente se halla en fase de Milestone (y contiene desarrollos no open source), pero debemos tenerlo en cuenta en el futuro dado que es una buena innovación por parte de Pentaho para facilitar el despliegue de soluciones de inteligencia de negocio con sus herramientas.

Fuente: Wiki Pentaho

Posted March 6, 2010 10:31 AM
Permalink | No Comments |
Intelligence Enterprise ha publicado un interesante donde lista una série de empresas que es necesario seguir. Se centran en los siguientes sectores:

  • Business Intelligence
  • Enterprise Applications
  • Information Management

Y han sido asesorados por los colaboradores habituales:

  • Rajan Chandras, integration expert and author
  • Seth Grimes, Alta Plana
  • Cindi Howson, BI Scorecard
  • David Linthicum, data integration and cloud computing expert
  • Curt Monash, Monash Research
  • Alan Pelz-Sharpe, CMS Watch
  • David Stodder, Perceptive Information Strategies

Vamos a centrarnos en las empresas Open Source:

  • Actuate: Actuate es conocida en el ámbito OSBI (Open Source Business Intelligence) por BIRT una de las soluciones de reporting open source más versátiles y potentes del mercado OSBI que anualmente se actualiza siguiendo el roadmap del IDE Eclipse. Esta solución realmente ha revolucionado el nicho de herramientas de Reporting haciendo que las soluciones de otros fabricantes se deban poner las pilas. Vale la pena echar un vistazo al resto de sus productos. Y destacar la comunidad de intercambio de BIRT.
  • Jaspersoft: Este empresa conocida por su solución de reporting llamada iReport (una de las primeras soluciones de reporting open source) ofrece una suite completa de BI que integra Reporting, Cuadros de Mando y OLAP. Cabe comentar que Jaspersoft anunció el pasado 23 de febrero que superó los diez millones de descargas, que contribuye a 350 proyectos open source y que tiene una comunidad de 120.000 miembros registrados. Son cifras muy interesantes que refuerzan el mensaje que el Open Source Business Intelligence está viviendo un momento importante. Lo que es cierto es Jaspersoft proclama que es ecosistema BI más grande del mundo y si bien eso se debe coger con pinzas, es importante tener en cuenta que estamos hablando de uno de los actores importantes del sector OSBI.
  • R-Project: es una potente solución de análisis estadístico que presenta múltiple módulos especializados. A parte de su uso intensivo en proyectos universitarios, es necesario destacar que es una herramienta de gran solvencia en minería de datos. De ello, se ha percatado incluso otras compañías Business Intelligence como Information Builders que la han integrado en su suite.
  • Talend: Talend ofrece soluciones de integración de datos, de MDM (Master Data Management) y Data Quality. Recientemente, ha sido incluida en el Cuadrante Mágico de Gartner de integración de datos como empresa visionaria y eso es un punto a tener en cuenta de esta empresa que está alcanzando cuotas muy importantes en poco tiempo gracias a un trabajo bien hecho.

Posted February 24, 2010 4:58 AM
Permalink | No Comments |
De nuevo me pongo a hablar de la comunidad de Pentaho que está trabajando muy intensamente estos últimos meses para mejorar esta herramienta open source. A los proyectos CDF, CDF-DE y PAT se une CDA.

Este proyecto consiste en crear una capa de acceso basada en llamadas URL de diferentes fuentes de datos: SQL, MDX, Metadatos, Kettle,... e incluso composiciones proporcionando diferentes formatos de salida: JSON, XML, CSV, XLS, HTML.

El beneficio de CDA es crear una capa independiente a ser usada por CDF y CDF-DE u otros proyectos en el futuro.

Si bien aún no está disponible para descarga está previsto que sea integrado directamente en Pentaho.

Esperemos que la comunidad siga participando en esta solución y esto incida también en que la propia empresa también se motive para ofrecer nuevas mejoras y características innovadores como Pentaho Agile BI. Sólo cabe agradecerles su esfuerzo a todos.

Proyecto: http://code.google.com/p/pentaho-cda/

Posted February 19, 2010 2:44 AM
Permalink | No Comments |
Otro interesante proyecto de la comunidad de Pentaho: CDF-DE. La comunidad de Pentaho es un pilar importante para potenciar la funcionalidad de esta solución OSBI. Últimamente esta comunidad está muy activa creando mejoras para la solución.

De los creadores de CDF (en particular, Pedro Alves), tenemos un nuevo proyecto CDF-DE. Un editor online de cuadros de mando para Pentaho. Si bien se encuentra en una versión muy inicial, este editor se encuentra completamente funcional y eso es un paso significativo en el camino de facilitar la creación tanto para desarrolladores como para usuarios avanzados.

Una vez instalado, desde el servidor de Pentaho es posible la creación si bien es necesario conocer un poco la estructura de un dashboard basado en CDF. Soporta la creación de todos los objetos que actualmente soporta CDF.

Es una buena aportación que conjuntamente con PAT augura un gran futuro de las aportaciones de la comunidad de Pentaho.


Posted February 7, 2010 9:21 AM
Permalink | No Comments |
Ya hace unos meses Talend anunció la compra de una solución MDM. Hace unos días está disponible la versión community de esta solución para su descarga. Así mismo la enterprise que incluye múltiples características más que su anónimo como podemos consultar aquí.

MDM es uno de los puntos calientes del mercado BI y también en el open source se está teniendo en cuenta. Para conocer más sobre la solución de Talend consultad su página.

Le echaremos un vistazo para poder opinar en profundidad.

Posted February 1, 2010 3:32 PM
Permalink | 2 Comments |
Nuevo año, nuevas versiones de productos Open Source. Iremos hablando de todas ellas dado que tenemos novedades interesantes.

Empezamos por Weka. Este producto, como ya sabemos, fue adquirido por Pentaho si bien aún se mantiene como producto independiente. En la última versión (disponible aquí), podemos encontrar interesantes mejoras con la inclusión de nuevos algoritmos entre los que destacamos:

  • SPegasus: Es un algoritmo que a través de la descendiente del gradiente estocástico, permite aprendizaje de support vector machine. Para más información consultad el artículo: S. Shalev-Shwartz, Y. Singer, N. Srebro: Pegasos: Primal Estimated sub-GrAdient SOlver for SVM. In: 24th International Conference on MachineLearning, 807-814, 2007. 
  • RealAdaBoost: algoritmo de clasificación de Friedman que usa el método Real Adaboost. Para más información: J. Friedman, T. Hastie, R. Tibshirani (2000). Additive Logistic Regression: a Statistical View of Boosting. Annals of Statistics. 95(2):337-407. 
  • Furia (Fuzzy Unordered Rule Induction Algorithm): aprendizaje de reglas fuzzy basado en el algoritmo RIPPER. Para más información: Jens Christian Huehn, Eyke Huellermeier (2009). FURIA: An Algorithm for Unordered Fuzzy Rule Induction. Data Mining and Knowledge Discovery. 
Para más información consulta en la wiki de pentaho.

Son buenas noticias que este tipo de productos continúe mejorando año tras año.

Posted January 16, 2010 3:13 AM
Permalink | 1 Comment |
Durante el año 2009, la comunidad de Pentaho bajo el auspicio de la compañía ha estado muy activa realizando eventos online (vía WebEx) explicando aspectos de las componentes de la suite o de las herramientas de desarrollo. Cabe destacar que los contenidos son frecuentemente muy interesantes y los ponentes son profesionales del mundo del Business Intelligence con una gran experiencia.

Para este 2010, continúan con este tipo de eventos y ya tenemos las fechas y contenidos de las dos primeras:


Posted January 4, 2010 11:58 PM
Permalink | No Comments |
 Desde la semana pasada en la UOC estoy realizando un coloquio sobre el uso de herramientas open source de inteligencia de negocio. El título del coloquio es “Herramientas Open Source de Business Intelligence”.
El coloquio se divide en tres partes:
  • La primera parte introducirá el concepto y la finalidad de la inteligencia de negocio.
  • Posteriormente se presentará el estado actual del mercado open source en este ámbito.
  • Finalmente, se usará un caso práctico para mostrar el uso y funcionalidades de una de las soluciones open source más maduras del mercado: Pentaho.

Dado que creo que es un material interesante de adjunto el enlace a la presentación en slideshare así como al canal youtube de la UOC.

Links: Slideshare - Introducción a Business Intelligence - Pentaho


Posted December 18, 2009 5:05 PM
Permalink | No Comments |