miércoles, 7 de octubre de 2015

Resumen Capitulo 6: Fundamentos de inteligencia de negocios: bases de datos y administración de la información

RESUMEN CAPITULO 6

SISTEMAS DE INFORMACIÓN GERENCIAL
CAPITULO 6: Fundamentos de inteligencia de negocios: bases de datos y administración de la información
6.1 ORGANIZACIÓN DE LOS DATOS EN UN ENTORNO DE ARCHIVOS TRADICIONAL
Un sistema efectivo de información da a los usuarios información exacta, oportuna y relevante. La información exacta está libre de errores. La información es oportuna cuando está disponible en el momento que la requieren los encargados de la toma de decisiones. La información es relevante cuando es útil y adecuado para los tipos de trabajo y decisiones que la necesitan.

TÉRMINOS Y CONCEPTOS DE ORGANIZACIÓN DE ARCHIVOS




Un sistema computacional organiza los datos en una jerarquía, la cual empieza con el bit, que representa 0 o 1. Los bits se pueden agrupar para formar un byte que representa un carácter, número o símbolo. Los bytes se pueden agrupar para formar un campo, y los campos relacionados para constituir un registro. Los  registros relacionados se pueden reunir para crear un archivo, y los archivos relacionados se pueden organizar en una base de datos.

  
Un registro describe a una entidad. Una entidad es una persona, lugar, cosa o evento sobre el cual almacenamos y mantenemos información. Cada característica o cualidad que describe a una entidad específica se denomina atributo. Por ejemplo, ID_Estudiante, Curso, Fecha y Calificaciones son atributos de la entidad CURSO. Los valores específicos que pueden tener estos atributos se encuentran en los campos del registro que describe a la entidad CURSO.

PROBLEMAS CON EL ENTORNO DE ARCHIVOS TRADICIONAL
El uso de una metodología tradicional para el procesamiento de archivos impulsa a cada área funcional en una corporación a desarrollar aplicaciones especializadas. Cada aplicación requiere un archivo de datos único que probablemente sea un subconjunto del archivo maestro. Estos subconjuntos producen redundancia e inconsistencia en los datos, inflexibilidad en el procesamiento y desperdicio de los recursos de almacenamiento.
Redundancia e inconsistencia de los datos
Redundancia de datos es la presencia de datos duplicados en múltiples archivos de datos, de tal manera que los mismos datos están almacenados en más de un lugar, desperdiciando recursos de almacenamiento y también conduce a la inconsistencia de datos, en el cual el mismo atributo podría tener valores diferentes.
Dependencia entre los programas y los datos:
La dependencia programa-datos se refiere al acoplamiento de los datos almacenados en archivos y los programas específicos requeridos para actualizar y dar mantenimiento a esos archivos, de tal forma que los cambios en los programas requieran cambios en los datos.
Falta de flexibilidad:
Un sistema tradicional de archivos puede enviar informes programados de rutina, después de extensos esfuerzos de programación, pero no pueden transmitir informes con fines específicos o responder de manera oportuna a requerimientos imprevistos de información.
Seguridad defectuosa:
Dado que hay poco control o administración de datos, el acceso y difusión de la información podrían salirse de control. Es posible que la administración no tenga forma de saber quién esté teniendo acceso a los datos de la organización, o incluso modificándolos.
Falta de compartición y disponibilidad de los datos:
Debido a que la información está fragmentada en diferentes archivos y en distintas partes de la organización no se pueden relacionar entre sí, es prácticamente imposible que la información se comparta o se acceda de manera oportuna. La información no puede fluir libremente a través de las diferentes áreas funcionales o distintas partes de la organización.

6.2 LA METODOLOGÍA DE LAS BASES DE DATOS PARA LA ADMINISTRACIÓN DE DATOS
Un Sistema de Administración de Bases de Datos (DBMS) es software que permite a una organización centralizar los datos, administrarlos en forma eficiente y proveer acceso a los datos almacenados mediante programas de aplicación. El DBMS actúa como una interfaz entre los programas de aplicación y los archivos de datos físicos.
Cómo resuelve un DBMS los problemas del entorno de archivos tradicionales
Un DBMS reduce la redundancia e inconsistencia de los datos al minimizar los archivos aislados en los que se repiten los mismos datos. Tal vez el DBMS no logre que la organización elimine la redundancia de datos en su totalidad, pero puede ayudar a controlarla. El DBMS permite a la organización administrar los datos, su uso y su seguridad en forma central.

DBMS relacional
Las Bases de datos relacionales representan los datos como tablas bidimensionales (llamadas relaciones). Las tablas podrían considerarse como archivos. Cada tabla contiene datos acerca de una entidad y sus atributos.

El tipo más popular de sistemas DBMS en la actualidad para las PCs, así como para computadoras más grandes y mainframes, es el DBMS relacional. Las bases de datos relacionales representan los datos como tablas bidimensionales (llamadas relaciones), a las cuales se puede hacer referencia como si fueran archivos.
Operaciones de un DBMS relacional
En una base de datos relacional se utilizan tres operaciones básicas para generar conjuntos de datos útiles: seleccionar, proyectar y unir.
La operación seleccionar crea un subconjunto que consiste en todos los registros del archivo que cumplan con criterios establecidos. En otras palabras, la selección crea un subconjunto de filas que cumplen con ciertos criterios.
La operación unir combina tablas relacionales para proveer al usuario más información de la que está disponible en las tablas individuales.
La operación proyectar crea un subconjunto que consiste de columnas en una tabla, con lo cual el usuario puede crear nuevas tablas que contengan sólo la información requerida.
DBMS orientado a objetos
Un DBMS orientado a objetos almacena los datos y los procedimientos que actúan sobre esos datos como objetos que se pueden recuperar y compartir de manera automática. Los Sistemas de Administración de Bases de Datos Orientados a Objetos (OODBMS) están ganando popularidad debido a que se pueden utilizar para manejar los diversos componentes multimedia o los applets de Java que se utilizan en las aplicaciones Web, que por lo general integran piezas de información provenientes de una variedad de orígenes
Bases de datos en la nube
Los proveedores de computación en la nube ofrecen servicios de administración de bases de datos, pero por lo general estos servicios tienen menos funcionalidad que sus contrapartes dentro de las premisas de la empresa. Por el momento, la base de clientes primordial para la administración de datos basados en la nube consiste en Capacidades de los sistemas de administración de bases de datos empresas iníciales enfocadas en Web o negocios desde pequeños hasta medianos que
buscan capacidades de bases de datos a un menor precio que el de un DBMS relacional estándar.

CAPACIDADES DE LOS SISTEMAS DE ADMINISTRACIÓN DE BASES DE DATOS
Un DBMS incluye capacidades y herramientas para organizar, administrar y acceder a los datos en la base de datos. Las más importantes son: su lenguaje de definición de datos, el diccionario de datos y el lenguaje de manipulación de datos.
Consultas e informes
Un DBMS contiene herramientas para acceder a la información en las bases de datos y manipularla. La mayoría de los DBMS tienen un lenguaje especializado conocido como lenguaje de manipulación de datos el cual se utiliza para agregar, modificar, eliminar y recuperar los datos en la base. Este lenguaje contiene comandos que permiten a los usuarios finales y a los especialistas de programación extraer los datos de la base para satisfacer las solicitudes de información y desarrollar aplicaciones. El lenguaje de manipulación de datos más prominente en la actualidad es el lenguaje de consulta estructurado, o SQL.

DISEÑO DE BASES DE DATOS
Para crear una base de datos hay que comprender las relaciones entre la información, el tipo de datos que se mantendrán en la base, cómo se utilizarán y la forma en que tendrá que cambiar la organización para administrarlos desde una perspectiva a nivel de toda la compañía. La base de datos requiere tanto un diseño conceptual como uno físico.

Diagramas de normalización y de entidad-relación

El diseño de bases de datos conceptual describe la forma en que se deben agrupar los elementos de datos en la base. El proceso de diseño identifica las relaciones entre los elementos de datos y la manera más eficiente de agruparlos en conjunto para satisfacer los requerimientos de información de la empresa.
Los diseñadores de bases de datos documentan su modelo de datos con un diagrama entidad-relación.
Los cuadros representan las entidades, y las líneas que conectan los cuadros, las relaciones. Una línea que conecta dos entidades que termina en dos marcas cortas designa una relación de uno a uno. Una línea que conecta dos entidades y termina con una pata de cuervo y una marca corta encima de ella indica una relación de uno a varios.
• Distribución de Bases de Datos

El diseño de bases de datos también abarca la manera en que se distribuyen los datos. Se pueden diseñar sistemas de información con una base de datos centralizada que sea utilizada por un procesador central único o por múltiples procesadores en una red cliente/servidor.
Los sistemas distribuidos reducen la vulnerabilidad de un solo sitio central masivo. Incrementan el servicio y el nivel de respuesta para los usuarios locales y con frecuencia pueden correr en computadoras más pequeñas y menos caras. Sin embargo, las bases de datos locales en ocasiones pueden desviarse de los estándares y definiciones centrales de datos y plantear problemas de seguridad por la amplia distribución del acceso a datos delicados.

6.3 USO DE BASES DE DATOS PARA MEJORAR EL DESEMPEÑO DE NEGOCIOS Y LA TOMA DE DECISIONES
Las empresas utilizan sus bases de datos para dar seguimiento a las transacciones básicas. Pero también, se las necesitan para suministrar información que ayudará a la empresa a manejar los negocios de manera más eficiente, y que ayudará a los gerentes y a los empleados a tomar mejores decisiones.



ALMACENES DE DATOS
Un almacén de datos es una base de datos que almacena la información actual e histórica de interés potencial para los encargados de tomar decisiones en la compañía. Los datos se originan en muchos sistemas de transacciones operacionales básicos, como los sistemas de ventas, las cuentas de clientes, la manufactura, y pueden incluir datos de transacciones de sitios Web. El almacén de datos consolida y estandariza la información de distintas bases de datos operacionales, de modo que se pueda utilizar en toda la empresa para el análisis gerencial y la toma de decisiones.   



Mercados de datos
Un mercado de datos es un subconjunto de un almacén de datos en el que una parte resumida o altamente enfocada de los datos de la organización se coloca en una base de datos separada para una población específica de usuarios. Por lo común, un mercado de datos se enfoca en una sola área objetivo o línea de negocios, por lo que usualmente se puede construir más rápido y a un costo más bajo que un almacén de datos a nivel de toda la empresa.

HERRAMIENTAS PARA LA INTELIGENCIA DE NEGOCIOS: ANÁLISIS DE DATOS MULTIDIMENSIONAL Y MINERÍA DE DATOS
Las herramientas de inteligencia de negocios permiten a los usuarios analizar datos para ver nuevos patrones, relaciones y perspectivas que son útiles para guiar la toma de decisiones. Las principales herramientas para la inteligencia de negocios incluyen el software para consultas e informes de bases de datos, herramientas para el análisis de datos multidimensional (procesamiento analítico en línea), y herramientas para la minería de datos.

Procesamiento analítico en línea (OLAP)
El procesamiento analítico en línea soporta el análisis de datos multidimensionales, el cual permite a los usuarios ver los mismos datos en diferentes formas utilizando múltiples dimensiones. Cada aspecto de la información -producto, precio, etc- representa una dimensión diferente. OLAP permite a los usuarios obtener respuestas en línea a preguntas específicas en un lapso de tiempo sumamente rápido, aun cuando los datos estén almacenados en bases de datos bastante grandes, como las cifras de ventas de varios años.

Minería de Datos
La minería de datos está más orientada al descubrimiento de información. La minería de datos proporciona conocimientos acerca de los datos corporativos que no se podrían obtener con OLAP, al encontrar patrones y relaciones ocultas en robustas bases de datos en infiriendo reglas a partir de ellos para predecir el comportamiento futuro. Los patrones y las reglas se utilizan para orientar la toma de decisiones y predecir el efecto de tales decisiones. Los tipos de información que se pueden obtener a partir de la minería de datos incluyen asociaciones, secuencias, clasificaciones, agrupaciones y pronósticos.
La generación de pronósticos emplea una serie de valores existentes para pronosticar qué otros valores habrá.
Uno de los usos populares de la minería de datos es ofrecer análisis detallado de patrones existentes en los datos de clientes para realizar campañas de MKT o para identificar clientes rentables.
El análisis predictivo utiliza técnicas de minería de datos, datos históricos y suposiciones sobre condiciones futuras para predecir resultados de eventos, como la probabilidad de que un cliente responderá a una oferta o comprará un producto específico.
La minería de datos plantea riesgos para la protección de la privacidad individual. La tecnología de minería de datos puede combinar información de muchas fuentes diversas para crear una “imagen de datos” detallada sobre cada uno de nosotros.

Minería de datos y minería Web
La principal función de las herramientas de inteligencia de negocios es lidiar con los datos que se han estructurado en bases de datos y archivos. Sin embargo, se cree que los datos no estructurados, que en su mayoría están organizados en forma de archivos de texto, representan más del 80 por ciento de la información útil de una organización. En la actualidad hay herramientas de minería de texto disponibles para ayudar a las empresas a analizar estos datos. Estas herramientas pueden extraer elementos clave de los conjuntos de datos extensos no estructurados, descubrir patrones y relaciones, así como sintetizar la información.
La Web es otra fuente extensa de información valiosa, y parte de ésta se puede explotar en busca de patrones, tendencias y perspectivas en relación con el comportamiento de los clientes. El descubrimiento y análisis de los patrones útiles y la información proveniente de World Wide Web se denominan minería Web. Las empresas podrían recurrir a la minería Web para que les ayude a comprender el comportamiento de los clientes, evaluar la efectividad de un sitio Web específico o cuantificar el éxito de una campaña de marketing.
La minería Web busca patrones en los datos a través de la minería de contenido, la minería de estructura y la minería de uso. La minería de contenido Web es el proceso de extraer conocimiento del contenido de páginas Web, lo cual puede incluir datos de texto, imágenes, audio y video. La minería de estructura Web extrae información útil de los vínculos incrustados en documentos Web.

LAS BASES DE DATOS Y WEB
Muchas empresas utilizan ahora la Web para poner parte de la información de sus bases de datos internas a disposición de sus clientes y socios de negocios.
El usuario accede al sitio Web del detallista por medio de Internet, utilizando un navegador Web instalado en su Pc del cliente. El navegador Web del usuario solicita datos a la base de la organización, utilizando comandos HTML para comunicarse con el servidor Web.
El servidor Web pasa las solicitudes de datos a software que traduce los comandos HTML a SQL para que los pueda procesar el DBMS que trabaja con la base de datos. En un entorno cliente/servidor, el DBMS reside en una computadora dedicada denominada servidor de base de datos. El DBMS recibe las solicitudes de SQL y suministra los datos requeridos. El middleware transfiere información desde la base de datos interna de la organización de regreso al servidor Web para que se entregue en forma de página Web al usuario.

Las ventajas de utilizar la Web para acceder a las bases de datos internas de una organización:
1. Un navegador es más sencillo de utilizar que las herramientas de consulta propietarias.
2. La interfaz Web requiere pocos cambios o ninguno a la base de datos interna. Cuesta mucho menos agregar una interfaz Web a un sistema heredado que rediseñar y volver a construir el sistema para mejorar el acceso a los usuarios.
El acceso a bases de datos corporativas a través de la Web está creando nuevas eficiencias, oportunidades y modelos de negocios.

6.4 ADMINISTRACIÓN DE LOS RECURSOS DE DATOS
Toda empresa, ya sea grande o pequeña, necesita una política de información. Los datos de su empresa son un recurso importante, por lo que no es conveniente que las personas hagan lo que quieran con ellos. Necesita tener reglas sobre la forma en que se van a organizar y mantener los datos, y quién tiene permitido verlos o modificarlos

ESTABLECIMIENTO DE UNA POLÍTICA DE INFORMACIÓN
Una política de información específica las reglas de la organización para compartir, distribuir, adquirir, estandarizar, clasificar e inventariar la información. Esta establece procedimiento y responsabilidades específicos, que identifican cuáles usuarios y unidades de la organización pueden compartir información, dónde se puede distribuir la información y quién es responsable de actualizar y mantener la información.
La administración de datos es responsable de las políticas y procedimientos específicos por medio de los cuales se pueden manejar los datos como un recurso organizacional. Estas responsabilidades incluyen desarrollar la política de información, planificar los datos, supervisar el diseño lógico de la base de datos y el desarrollo del diccionario de datos, y vigilar la manera en que los especialistas en sistemas de información y los grupos de usuarios finales utilizan los datos.
Una organización grande tendrá un grupo de diseño y administración de bases de datos dentro de la división de sistemas de información corporativa, responsable de definir y organizar la estructura y contenido de la base de datos, así como su mantenimiento.

ASEGURAMIENTO DE LA CALIDAD DE LOS DATOS
Una base de datos y una política de información bien diseñadas contribuirán a garantizar que la empresa tenga la información que necesita. Sin embargo, se deben emprender acciones adicionales para asegurar que la información de las bases de datos de la organización sea exacta y confiable.
Antes de implementar una nueva base de datos, las organizaciones necesitan identificar y corregir sus datos incorrectos y establecer mejores rutinas para editar los datos una vez que su base esté en operación. Con frecuencia, el análisis de la calidad de los datos empieza con una auditoría de calidad de los datos, la cual es una encuesta estructurada de la precisión y el nivel de su integridad en un sistema de información.
Las auditorías de calidad de los datos se pueden realizar mediante la inspección de los archivos de datos completos, la inspección de muestras provenientes de los archivos de datos, o mediante encuestas a los usuarios finales sobre sus percepciones en cuanto a la calidad de los datos.

La limpieza de datos, (data scrubbing), consiste en actividades para detectar y corregir datos en una base que sean incorrectos, incompletos, que tengan un formato inapropiado o que sean redundantes. La limpieza de datos también impone la consistencia entre los distintos conjuntos de datos que se originan en sistemas de información separados. 

No hay comentarios.:

Publicar un comentario