Pasar al contenido principal [logo-itba.png] [lupa.png] IOL ENG Formulario de búsqueda Buscar _______________ [cruz-cerrar.png] Buscar . Documento * ____________________________________________________________ Ingresa tu número de documento Password * ____________________________________________________________ Ingresa tu clave de acceso Enviar Publicado el Martes 16 de Junio de 2015 Tendencias: Big Data como Herramienta de Toma de Decisiones Por Dr. Alejandro A. Vaisman Departamento de Ingeniería Informática Director del Centro de Extracción de Información (XData) Instituto Tecnológico de Buenos Aires A lo largo del tiempo, la toma de decisión, una acción por supuesto clave en toda organización, ha pasado de ser un proceso basado en la experiencia y la intuición, a un proceso cada vez más frecuentemente basado en el análisis de datos. Desde comienzos de los años noventa, los sistemas de data warehousing brindaron a las empresas la posibilidad capturar, depurar, y explorar sistemáticamente sus datos, a efectos de dar soporte a la toma de decisiones. Esto generó el auge de los denominados “Sistemas de Soporte a la Decisión” (DSS, en sus siglas en inglés). A partir de allí, se desarrollaron técnicas y algoritmos eficientes e inteligentes de descubrimiento de información oculta en grandes bases de datos, dando origen al término “Data mining”, posteriormente generalizándose en el concepto de “Business Intelligence” (BI). La característica fundamental de estos sistemas era que operaban sobre grandes volúmenes de datos (en ese tiempo, un data warehouse podía contener solo unos pocos Terabytes de información) internos a las compañías. La gran ventaja sobre los métodos tradicionales consistía en que los datos eran confiables, e integrados, es decir, provenientes de diferentes sectores de las empresas, no solamente de las bases de datos centrales de las mismas. Con el advenimiento de lo que se ha dado en llamar el fenómeno de Big Data, muchas de estas cosas han cambiado. El término “Big Data”, en su definición más aceptada, refiere a grandes volúmenes de datos, estructurados o no, que crecen a un ritmo tan grande que excede la capacidad de captura, almacenamiento, administración, y análisis, que poseen las herramientas tradicionales de software de bases de datos. La procedencia y características de estos datos son tremendamente variadas: redes sociales, sensores, imágenes satelitales, equipamiento médico, etc. Los datos proporcionados por estas fuentes son casi siempre no estructurados, y a menudo contienen no solamente texto, sino también imágenes y audio. Por otra parte, contrariamente a lo que ocurre en un contexto tradicional de Business Intelligence, estos datos, externos a las organizaciones (lo que implica que las empresas no tienen control sobre los mismos), tienen una credibilidad muy volátil, y generalmente baja, lo que representa un desafío adicional para los analistas. Finalmente, y para hacer más complicado aún el problema, a efectos de generar ventajas competitivas, estos datos normalmente deben ser analizados en tiempo real. Big Data representa un cambio fundamental en la forma de tomar decisiones de negocios, y numerosas empresas así lo han entendido. En forma creciente, muchas empresas, principalmente aquellas basadas en alta tecnología, en Internet, y en el área de salud, consideran relevantes, a efectos de la toma de decisión, los datos provenientes de redes sociales. La razón fundamental es que la reputación es el activo más valioso de estas empresas. Los datos provenientes de redes sociales, analizados en tiempo real, permiten a estas compañías detectar alertas tempranas y evitar o mitigar el daño producido por una decisión equivocada. Hay casos famosos de decisiones que, debido a su repercusión negativa en las redes sociales, se volvieron atrás en menos de 24 horas.[1] Pese a lo anterior, es de remarcar que las empresas siguen considerando los datos de su actividad de negocios (ventas, compras, costos de producción, etc.) como los más valiosos. La excepción a esta regla es el negocio de venta minorista, donde la presión por ser competitivo es enorme, y muchas herramientas proveen actualmente a los clientes conocer el precio de un producto en diferentes puntos de venta. El análisis de sentimiento es posiblemente la herramienta más utilizada para la toma de decisiones basadas en datos provenientes de las redes sociales. Este análisis es definido como “el proceso de determinar y medir el tono, actitud, opinión y estado emocional de respuestas, decidiendo si una conversación u opinión es positiva, negativa o neutra”. Su utilización se da en muy variados entornos. Desde compañías aéreas (para averiguar sobre experiencia de vuelo, distancia entre asientos), de seguros (costo, cobertura, servicio ante siniestros), venta de indumentaria (variedad, talles, disponibilidad de productos), instituciones financieras (detección de inside trading), hasta decisiones en el ámbito de la política (opiniones, análisis en tiempo real sobre una participación en un show televisivo o debate). Según el caso, el tiempo disponible para el análisis puede ir desde días hasta segundos. De todos modos, y especialmente en el caso del idioma español, hay mucho por hacer en este campo, ya que las herramientas de procesamiento de lenguaje natural están aún en los primeros estadios de desarrollo. El análisis anterior nos muestra una tendencia marcada de cambio en el proceso de toma de decisión, que encuestas realizadas a ejecutivos de empresas confirman: Las decisiones de gestión basadas exclusivamente en la intuición o la experiencia son cada vez más aisladas. Por el contrario, las decisiones se basan cada vez más en información analítica dura. Las organizaciones creen, en forma creciente en el uso intensivo de datos para la toma de decisiones. Hoy, para estas organizaciones, los datos se han convertido en el cuarto factor de producción, tan esencial como la tierra, el trabajo y el capital. Expertos en comercialización coinciden en que el entorno de lo que hoy llamamos “Big Data” va a generar a las empresas, enormes oportunidades de diferenciación en los próximos cinco a diez años. Es creciente la visión que sostiene que las organizaciones ganadoras en un futuro cercano serán las que tengan éxito en la explotación de grandes volúmenes de datos, por ejemplo, mediante la aplicación de técnicas avanzadas de análisis predictivo en tiempo real. Como consecuencia de lo anterior, es incesante el desarrollo de nuevas tecnologías y técnicas de captura, procesamiento y análisis de Big Data. Pero por otro lado, las organizaciones deben generar planes y estrategias que permitan hacer uso apropiado de estas nuevas técnicas y tecnologías. Para ello, hay todavía muchas barreras por vencer, internas y externas a las organizaciones. En cuanto al primer caso, es conocido que las grandes organizaciones, son sumamente reacias a los cambios. En este sentido, es común detectar en las empresas los llamados “silos” de datos, que se encuentran en sistemas ERP o CRM, no disponibles a toda la organización. Adicionalmente, hay empresas cuyas direcciones aún no perciben a Big Data como un área estratégica. En cuanto a los factores externos, el principal problema con el que se encuentran las empresas es la falta de personal calificado. El perfil requerido para las tareas que estuvimos discutiendo, se ha dado en llamar “data scientist” o “experto en ciencias de datos”. Este experto debe tener habilidades que le permitan: * Ubicar e interpretar fuentes de datos interesantes * Manejar grandes cantidades de datos * Integrar fuentes de datos * Asegurar la consistencia de datos * Construir modelos matemáticos * Crear visualizaciones que ayuden a entender los resultados * Comunicar resultados y hallazgos (incluso para una audiencia inexperta) Es evidente que es muy difícil, si no imposible, reunir en una sola persona todas estas capacidades, por lo que la ciencia de datos es una tarea fundamentalmente de un equipo. Las empresas que quieran trabajar seriamente en la toma de decisiones basadas en Big Data deben constituir equipos de trabajo donde, además de las habilidades indicadas, exista un experto de dominio, un perfil que normalmente lleva años formar. Ha habido en los últimos años (no solamente en nuestro país) una tendencia a volcarse hacia las ciencias denominadas “blandas”, y su consecuencia podemos apreciarla ahora, cuando se requiere personal con formación en ciencias “duras”. Es opinión de expertos en recursos humanos, que este perfil será objeto de altísima demanda en los próximos años, lo que requerirá una importante cooperación entre el estado, las empresas, y las universidades, para capacitar profesionales que puedan satisfacer esta demanda. Como reflexión final, creemos importante tener en cuenta que es necesario mantener un balance entre la intuición y la confianza en los datos. En otras palabras, que la sobreabundancia de datos no debe hacer perder de vista aspectos importantes que un profundo conocimiento del negocio, y la experiencia pueden proporcionar, y que muchas veces pueden ser contradictorios con los resultados del análisis científico. Un conocido dicho expresa que “Por cada modelo fallido existe una ideología fallida cuya inflexibilidad conduce a resultados desastrosos”. La moraleja es que no hay, casi nunca, una receta única para resolver un problema, y los encargados de tomar decisiones deben estar informados de la mejor manera posible, para reducir el riesgo de cometer equivocaciones. [1] http://www.huffingtonpost.com/2011/12/30/verizon-fee-uproar_n_1176820.h tml * La Universidad + Sedes + Institucional + Alumnos + Docentes + Graduados + Internacional + Biblioteca + Empresas + Recursos * Extensión + Vinculación Tecnológica + Acción Social + Cursos + Iniciativas * Grado + Carreras + Ingreso + Becas * Postgrado + Maestrías y Especializaciones + Diplomaturas y programas ejecutivos + Programas in company * Doctorado + Admisión + Áreas + Programas * I&D + Proyectos + Convenios + Asesoramiento + Centros Nombre ____________________________________________________________ Correo electrónico ____________________________________________________________ Asunto ____________________________________________________________ Mensaje ____________________________________________________________ ____________________________________________________________ ____________________________________________________________ ____________________________________________________________ Área Información general_______________..] ¿Cuanto es 7+9? ____________________________________________________________ Enviar contacto Contacto IFRAME: //www.googletagmanager.com/ns.html?id=GTM-K9ZZNC