RESUMEN CAPITULO 6
SISTEMAS DE INFORMACIÓN GERENCIAL
CAPITULO 6: Fundamentos
de inteligencia de negocios: bases de datos y administración de la información
6.1 ORGANIZACIÓN DE
LOS DATOS EN UN ENTORNO DE ARCHIVOS TRADICIONAL
Un sistema efectivo de información
da a los usuarios información exacta, oportuna y relevante. La información
exacta está libre de errores. La información es oportuna cuando está disponible
en el momento que la requieren los encargados de la toma de decisiones. La
información es relevante cuando es útil y adecuado para los tipos de trabajo y
decisiones que la necesitan.
TÉRMINOS Y CONCEPTOS DE ORGANIZACIÓN DE ARCHIVOS
Un sistema computacional organiza
los datos en una jerarquía, la cual empieza con el bit, que representa 0 o 1.
Los bits se pueden agrupar para formar un byte que representa un carácter,
número o símbolo. Los bytes se pueden agrupar para formar un campo, y los
campos relacionados para constituir un registro. Los registros relacionados se pueden reunir para
crear un archivo, y los archivos relacionados se pueden organizar en una base
de datos.
Un registro describe a una
entidad. Una entidad es una persona, lugar, cosa o evento sobre el cual
almacenamos y mantenemos información. Cada característica o cualidad que
describe a una entidad específica se denomina atributo. Por ejemplo,
ID_Estudiante, Curso, Fecha y Calificaciones son atributos de la entidad CURSO.
Los valores específicos que pueden tener estos atributos se encuentran en los
campos del registro que describe a la entidad CURSO.
PROBLEMAS CON EL ENTORNO DE ARCHIVOS TRADICIONAL
El uso de una metodología
tradicional para el procesamiento de archivos impulsa a cada área funcional en
una corporación a desarrollar aplicaciones especializadas. Cada aplicación requiere
un archivo de datos único que probablemente sea un subconjunto del archivo
maestro. Estos subconjuntos producen redundancia e inconsistencia en los datos,
inflexibilidad en el procesamiento y desperdicio de los recursos de
almacenamiento.
Redundancia e inconsistencia de los datos
Redundancia de datos es la
presencia de datos duplicados en múltiples archivos de datos, de tal manera que
los mismos datos están almacenados en más de un lugar, desperdiciando recursos
de almacenamiento y también conduce a la inconsistencia de datos, en el cual el
mismo atributo podría tener valores diferentes.
Dependencia entre los programas y los datos:
La dependencia programa-datos se
refiere al acoplamiento de los datos almacenados en archivos y los programas
específicos requeridos para actualizar y dar mantenimiento a esos archivos, de
tal forma que los cambios en los programas requieran cambios en los datos.
Falta de flexibilidad:
Un sistema tradicional de
archivos puede enviar informes programados de rutina, después de extensos
esfuerzos de programación, pero no pueden transmitir informes con fines
específicos o responder de manera oportuna a requerimientos imprevistos de
información.
Seguridad defectuosa:
Dado que hay poco control o
administración de datos, el acceso y difusión de la información podrían salirse
de control. Es posible que la administración no tenga forma de saber quién esté
teniendo acceso a los datos de la organización, o incluso modificándolos.
Falta de compartición y disponibilidad de los datos:
Debido a que la información está
fragmentada en diferentes archivos y en distintas partes de la organización no
se pueden relacionar entre sí, es prácticamente imposible que la información se
comparta o se acceda de manera oportuna. La información no puede fluir
libremente a través de las diferentes áreas funcionales o distintas partes de
la organización.
6.2 LA METODOLOGÍA DE LAS BASES DE DATOS PARA LA ADMINISTRACIÓN DE
DATOS
Un Sistema de Administración de
Bases de Datos (DBMS) es software que permite a una organización centralizar
los datos, administrarlos en forma eficiente y proveer acceso a los datos
almacenados mediante programas de aplicación. El DBMS actúa como una interfaz
entre los programas de aplicación y los archivos de datos físicos.
Cómo resuelve un DBMS los
problemas del entorno de archivos tradicionales
Un DBMS reduce la redundancia e
inconsistencia de los datos al minimizar los archivos aislados en los que se
repiten los mismos datos. Tal vez el DBMS no logre que la organización elimine
la redundancia de datos en su totalidad, pero puede ayudar a controlarla. El
DBMS permite a la organización administrar los datos, su uso y su seguridad en
forma central.
DBMS relacional
Las Bases de datos relacionales
representan los datos como tablas bidimensionales (llamadas relaciones). Las
tablas podrían considerarse como archivos. Cada tabla contiene datos acerca de
una entidad y sus atributos.
El tipo más popular de sistemas
DBMS en la actualidad para las PCs, así como para computadoras más grandes y
mainframes, es el DBMS relacional. Las bases de datos relacionales representan
los datos como tablas bidimensionales (llamadas relaciones), a las cuales se
puede hacer referencia como si fueran archivos.
Operaciones de un DBMS relacional
En una base de datos relacional
se utilizan tres operaciones básicas para generar conjuntos de datos útiles:
seleccionar, proyectar y unir.
La operación seleccionar crea un
subconjunto que consiste en todos los registros del archivo que cumplan con
criterios establecidos. En otras palabras, la selección crea un subconjunto de
filas que cumplen con ciertos criterios.
La operación unir combina tablas
relacionales para proveer al usuario más información de la que está disponible
en las tablas individuales.
La operación proyectar crea un
subconjunto que consiste de columnas en una tabla, con lo cual el usuario puede
crear nuevas tablas que contengan sólo la información requerida.
DBMS orientado a objetos
Un DBMS orientado a objetos
almacena los datos y los procedimientos que actúan sobre esos datos como
objetos que se pueden recuperar y compartir de manera automática. Los Sistemas
de Administración de Bases de Datos Orientados a Objetos (OODBMS) están ganando
popularidad debido a que se pueden utilizar para manejar los diversos
componentes multimedia o los applets de Java que se utilizan en las
aplicaciones Web, que por lo general integran piezas de información
provenientes de una variedad de orígenes
Bases de datos en la nube
Los proveedores de computación en
la nube ofrecen servicios de administración de bases de datos, pero por lo
general estos servicios tienen menos funcionalidad que sus contrapartes dentro
de las premisas de la empresa. Por el momento, la base de clientes primordial
para la administración de datos basados en la nube consiste en Capacidades de
los sistemas de administración de bases de datos empresas iníciales enfocadas
en Web o negocios desde pequeños hasta medianos que
buscan capacidades de bases de datos a un menor precio que el de un DBMS relacional estándar.
buscan capacidades de bases de datos a un menor precio que el de un DBMS relacional estándar.
CAPACIDADES DE LOS SISTEMAS DE ADMINISTRACIÓN DE BASES DE DATOS
Un DBMS incluye capacidades y
herramientas para organizar, administrar y acceder a los datos en la base de
datos. Las más importantes son: su lenguaje de definición de datos, el diccionario
de datos y el lenguaje de manipulación de datos.
Consultas e informes
Un DBMS contiene herramientas
para acceder a la información en las bases de datos y manipularla. La mayoría
de los DBMS tienen un lenguaje especializado conocido como lenguaje de
manipulación de datos el cual se utiliza para agregar, modificar, eliminar y
recuperar los datos en la base. Este lenguaje contiene comandos que permiten a
los usuarios finales y a los especialistas de programación extraer los datos de
la base para satisfacer las solicitudes de información y desarrollar
aplicaciones. El lenguaje de manipulación de datos más prominente en la
actualidad es el lenguaje de consulta estructurado, o SQL.
DISEÑO DE BASES DE DATOS
Para crear una base de datos hay
que comprender las relaciones entre la información, el tipo de datos que se
mantendrán en la base, cómo se utilizarán y la forma en que tendrá que cambiar
la organización para administrarlos desde una perspectiva a nivel de toda la
compañía. La base de datos requiere tanto un diseño conceptual como uno físico.
Diagramas de normalización y de entidad-relación
El diseño de bases de datos
conceptual describe la forma en que se deben agrupar los elementos de datos en
la base. El proceso de diseño identifica las relaciones entre los elementos de
datos y la manera más eficiente de agruparlos en conjunto para satisfacer los
requerimientos de información de la empresa.
Los diseñadores de bases de datos
documentan su modelo de datos con un diagrama entidad-relación.
Los cuadros representan las
entidades, y las líneas que conectan los cuadros, las relaciones. Una línea que
conecta dos entidades que termina en dos marcas cortas designa una relación de
uno a uno. Una línea que conecta dos entidades y termina con una pata de cuervo
y una marca corta encima de ella indica una relación de uno a varios.
• Distribución de Bases de Datos
El diseño de bases de datos
también abarca la manera en que se distribuyen los datos. Se pueden diseñar
sistemas de información con una base de datos centralizada que sea utilizada
por un procesador central único o por múltiples procesadores en una red
cliente/servidor.
Los sistemas distribuidos reducen
la vulnerabilidad de un solo sitio central masivo. Incrementan el servicio y el
nivel de respuesta para los usuarios locales y con frecuencia pueden correr en
computadoras más pequeñas y menos caras. Sin embargo, las bases de datos
locales en ocasiones pueden desviarse de los estándares y definiciones
centrales de datos y plantear problemas de seguridad por la amplia distribución
del acceso a datos delicados.
6.3 USO DE BASES DE DATOS PARA MEJORAR EL DESEMPEÑO DE NEGOCIOS Y LA
TOMA DE DECISIONES
Las empresas utilizan sus bases
de datos para dar seguimiento a las transacciones básicas. Pero también, se las
necesitan para suministrar información que ayudará a la empresa a manejar los
negocios de manera más eficiente, y que ayudará a los gerentes y a los
empleados a tomar mejores decisiones.
ALMACENES DE DATOS
Un almacén de datos es una base
de datos que almacena la información actual e histórica de interés potencial
para los encargados de tomar decisiones en la compañía. Los datos se originan
en muchos sistemas de transacciones operacionales básicos, como los sistemas de
ventas, las cuentas de clientes, la manufactura, y pueden incluir datos de
transacciones de sitios Web. El almacén de datos consolida y estandariza la
información de distintas bases de datos operacionales, de modo que se pueda
utilizar en toda la empresa para el análisis gerencial y la toma de decisiones.
Mercados de datos
Un mercado de datos es un
subconjunto de un almacén de datos en el que una parte resumida o altamente
enfocada de los datos de la organización se coloca en una base de datos
separada para una población específica de usuarios. Por lo común, un mercado de
datos se enfoca en una sola área objetivo o línea de negocios, por lo que
usualmente se puede construir más rápido y a un costo más bajo que un almacén
de datos a nivel de toda la empresa.
HERRAMIENTAS PARA LA INTELIGENCIA DE NEGOCIOS: ANÁLISIS DE DATOS
MULTIDIMENSIONAL Y MINERÍA DE DATOS
Las herramientas de inteligencia
de negocios permiten a los usuarios analizar datos para ver nuevos patrones,
relaciones y perspectivas que son útiles para guiar la toma de decisiones. Las
principales herramientas para la inteligencia de negocios incluyen el software
para consultas e informes de bases de datos, herramientas para el análisis de
datos multidimensional (procesamiento analítico en línea), y herramientas para la
minería de datos.
Procesamiento analítico en línea (OLAP)
El procesamiento analítico en
línea soporta el análisis de datos multidimensionales, el cual permite a los
usuarios ver los mismos datos en diferentes formas utilizando múltiples
dimensiones. Cada aspecto de la información -producto, precio, etc- representa
una dimensión diferente. OLAP permite a los usuarios obtener respuestas en
línea a preguntas específicas en un lapso de tiempo sumamente rápido, aun
cuando los datos estén almacenados en bases de datos bastante grandes, como las
cifras de ventas de varios años.
Minería de Datos
La minería de datos está más
orientada al descubrimiento de información. La minería de datos proporciona
conocimientos acerca de los datos corporativos que no se podrían obtener con
OLAP, al encontrar patrones y relaciones ocultas en robustas bases de datos en
infiriendo reglas a partir de ellos para predecir el comportamiento futuro. Los
patrones y las reglas se utilizan para orientar la toma de decisiones y
predecir el efecto de tales decisiones. Los tipos de información que se pueden
obtener a partir de la minería de datos incluyen asociaciones, secuencias,
clasificaciones, agrupaciones y pronósticos.
La generación de pronósticos
emplea una serie de valores existentes para pronosticar qué otros valores
habrá.
Uno de los usos populares de la
minería de datos es ofrecer análisis detallado de patrones existentes en los
datos de clientes para realizar campañas de MKT o para identificar clientes
rentables.
El análisis predictivo utiliza
técnicas de minería de datos, datos históricos y suposiciones sobre condiciones
futuras para predecir resultados de eventos, como la probabilidad de que un
cliente responderá a una oferta o comprará un producto específico.
La minería de datos plantea
riesgos para la protección de la privacidad individual. La tecnología de
minería de datos puede combinar información de muchas fuentes diversas para
crear una “imagen de datos” detallada sobre cada uno de nosotros.
Minería de datos y minería Web
La principal función de las
herramientas de inteligencia de negocios es lidiar con los datos que se han
estructurado en bases de datos y archivos. Sin embargo, se cree que los datos
no estructurados, que en su mayoría están organizados en forma de archivos de
texto, representan más del 80 por ciento de la información útil de una
organización. En la actualidad hay herramientas de minería de texto disponibles
para ayudar a las empresas a analizar estos datos. Estas herramientas pueden
extraer elementos clave de los conjuntos de datos extensos no estructurados,
descubrir patrones y relaciones, así como sintetizar la información.
La Web es otra fuente extensa de
información valiosa, y parte de ésta se puede explotar en busca de patrones,
tendencias y perspectivas en relación con el comportamiento de los clientes. El
descubrimiento y análisis de los patrones útiles y la información proveniente
de World Wide Web se denominan minería Web. Las empresas podrían recurrir a la
minería Web para que les ayude a comprender el comportamiento de los clientes,
evaluar la efectividad de un sitio Web específico o cuantificar el éxito de una
campaña de marketing.
La minería Web busca patrones en
los datos a través de la minería de contenido, la minería de estructura y la
minería de uso. La minería de contenido Web es el proceso de extraer
conocimiento del contenido de páginas Web, lo cual puede incluir datos de
texto, imágenes, audio y video. La minería de estructura Web extrae información
útil de los vínculos incrustados en documentos Web.
LAS BASES DE DATOS Y WEB
Muchas empresas utilizan ahora la
Web para poner parte de la información de sus bases de datos internas a
disposición de sus clientes y socios de negocios.
El usuario accede al sitio Web
del detallista por medio de Internet, utilizando un navegador Web instalado en
su Pc del cliente. El navegador Web del usuario solicita datos a la base de la
organización, utilizando comandos HTML para comunicarse con el servidor Web.
El servidor Web pasa las
solicitudes de datos a software que traduce los comandos HTML a SQL para que
los pueda procesar el DBMS que trabaja con la base de datos. En un entorno
cliente/servidor, el DBMS reside en una computadora dedicada denominada
servidor de base de datos. El DBMS recibe las solicitudes de SQL y suministra
los datos requeridos. El middleware transfiere información desde la base de
datos interna de la organización de regreso al servidor Web para que se
entregue en forma de página Web al usuario.
Las ventajas de utilizar la Web
para acceder a las bases de datos internas de una organización:
1. Un navegador es más sencillo
de utilizar que las herramientas de consulta propietarias.
2. La interfaz Web requiere pocos
cambios o ninguno a la base de datos interna. Cuesta mucho menos agregar una
interfaz Web a un sistema heredado que rediseñar y volver a construir el
sistema para mejorar el acceso a los usuarios.
El acceso a bases de datos
corporativas a través de la Web está creando nuevas eficiencias, oportunidades
y modelos de negocios.
6.4 ADMINISTRACIÓN DE LOS RECURSOS DE DATOS
Toda empresa, ya sea grande o
pequeña, necesita una política de información. Los datos de su empresa son un
recurso importante, por lo que no es conveniente que las personas hagan lo que
quieran con ellos. Necesita tener reglas sobre la forma en que se van a organizar
y mantener los datos, y quién tiene permitido verlos o modificarlos
ESTABLECIMIENTO DE UNA POLÍTICA DE INFORMACIÓN
Una política de información específica
las reglas de la organización para compartir, distribuir, adquirir,
estandarizar, clasificar e inventariar la información. Esta establece
procedimiento y responsabilidades específicos, que identifican cuáles usuarios
y unidades de la organización pueden compartir información, dónde se puede
distribuir la información y quién es responsable de actualizar y mantener la
información.
La administración de datos es
responsable de las políticas y procedimientos específicos por medio de los
cuales se pueden manejar los datos como un recurso organizacional. Estas responsabilidades
incluyen desarrollar la política de información, planificar los datos,
supervisar el diseño lógico de la base de datos y el desarrollo del diccionario
de datos, y vigilar la manera en que los especialistas en sistemas de
información y los grupos de usuarios finales utilizan los datos.
Una organización grande tendrá un
grupo de diseño y administración de bases de datos dentro de la división de
sistemas de información corporativa, responsable de definir y organizar la
estructura y contenido de la base de datos, así como su mantenimiento.
ASEGURAMIENTO DE LA CALIDAD DE LOS DATOS
Una base de datos y una política
de información bien diseñadas contribuirán a garantizar que la empresa tenga la
información que necesita. Sin embargo, se deben emprender acciones adicionales
para asegurar que la información de las bases de datos de la organización sea
exacta y confiable.
Antes de implementar una nueva
base de datos, las organizaciones necesitan identificar y corregir sus datos
incorrectos y establecer mejores rutinas para editar los datos una vez que su
base esté en operación. Con frecuencia, el análisis de la calidad de los datos
empieza con una auditoría de calidad
de los datos, la cual es una encuesta estructurada de la precisión y el nivel
de su integridad en un sistema de información.
Las auditorías de calidad de los
datos se pueden realizar mediante la inspección de los archivos de datos
completos, la inspección de muestras provenientes de los archivos de datos, o
mediante encuestas a los usuarios finales sobre sus percepciones en cuanto a la
calidad de los datos.
La limpieza de datos, (data scrubbing), consiste en actividades para
detectar y corregir datos en una base que sean incorrectos, incompletos, que
tengan un formato inapropiado o que sean redundantes. La limpieza de datos
también impone la consistencia entre los distintos conjuntos de datos que se
originan en sistemas de información separados.
No hay comentarios.:
Publicar un comentario