Diplomado en Herramientas de Minería de Datos para Soporte en la Toma de Decisiones

Solicita información

Analisis de educaedu

Margarita Rueda

Diplomado en Herramientas de Minería de Datos para Soporte en la Toma de Decisiones

  • Modalidad de impartición Los contenidos del Diplomado se dictan en las aulas designadas para ellos de modo Presencial.
  • Número de horas Se requiere de un tiempo de 120 horas divididas en 3 módulos.
  • Titulación oficial ITAM otorga un certificado de participación y conocimientos a los asistentes del diplomado.
  • Valoración del programa Es deseable que un profesional que lleve a curso este programa comprenda el manejo y uso de la herramienta datawarehouse con el fin de poder analizar los datos de transacciones de empresas y la información del entorno organizacional. Con los conocimientos obtenidos el estudiante podrá llevar a cabo repositorios multidimensionales que serán la base sobre la que se consolidan las acciones de minería de datos tradicional.
  • Precio del curso Consultar Precio.
  • Dirigido a El contenido está dirigido a las personas que desean ser parte de la toma de decisiones empresariales a través de la minería de datos archivados o nuevos.
  • Empleabilidad Concluyendo este programá será posible trabajar en empresas de investigación de mercados y marketing en el campo de análisis de bases de datos.

Diplomado en Herramientas de Minería de Datos para Soporte en la Toma de Decisiones

  • Contenido Diplomado en Herramientas de Minería de Datos para Soporte en la Toma de Decisiones.

    Coordinador:   MTRO. RAFAEL GREGORIO GAMBOA HIRALES 
    Área:   Tecnología y Computación
    Inicia: 6 de agosto de 2018
    Termina: 16 de enero de 2019
    Horario:   Lunes de 19:00 a 22:00 h. y Miércoles de 19:00 a 22:00 h.
    Módulos:   3
    Horas:   120
    Notas:   LA ÚLTIMA CLASE DE CADA MÓDULO SERÁ DE 18:00 A 22:00 H.

    Descripción

    El programa cubre dos grandes necesidades: por un lado, contemplar los niveles de detalle y las dimensiones de vista consolidada que satisfagan las necesidades previsibles de las empresas; por otro lado, proporciona técnicas y herramientas para analizar los datos transaccionales de la empresa y de los correspondientes a la información del entorno. Con este Diplomado, el participante podrá llevar a cabo los diseños de los repositorios para el primer caso, y conocerá las técnicas y las herramientas para llevar a cabo las tareas ya clásicas en las aplicaciones de minería de datos.

    ¿A quién se dirige?

    A personal responsable de las actividades directas de la formación del repositorio consolidado, o bien, de la elaboración de los modelos de minería de datos. Se requieren conocimientos previos de bases de datos relacionales y uso de hoja electrónica.

    ¿Qué beneficios ofrece?

    El participante aprenderá a utilizar las herramientas MSAccess, MSQuery, SQL Analysis Services, MSExcel y SAS como apoyo para los análisis estadísticos. Todo ello con el fin de configurar y explotar repositorios multidimensionales y para apoyar las tareas de minería de datos, formación de conjeturas y su validación estadística.

    Temario:

    Módulo 1. Los datos.

    Objetivo:
     
    Actualmente, los datos provienen de distintas fuentes. Por un lado, se tienen bases de datos relacionales, y por el otro, los datos conocidos como no estructurados provenientes de bitácoras o repositorios en JSON o XML, o en texto libre. En el primer módulo se examinan los conceptos y procesos para el tratamiento de los datos y para elaborar las tablas de hechos, o bien, repositorios o procesos de explotación especializados para uso en las labores de análisis de datos. Se estudian las técnicas para elaborar junturas de tablas y la formación de cuadros resumen, con las agrupaciones de conteo, suma, promedios y desviación estándar.  

     
    Temario 

    1. Tablas y gráficos dinámicos en MS Excel. Funciones de agregación. Atributos e ítems agregados. Gráficos de dispersión. 
    2. Bases de datos relacionales. Uso de MS Access. Repaso de atributos y relaciones. Consultas, uniones y junturas. Consolidación de cuadros resumen.
    3. Python y uso de pandas. Dataframes. Consultas, uniones y junturas. Consolidación de cuadros resumen. Salida gráfica.
    4. Transformación de datos. Atributos calculados.
    5. Explotación de datos en repositorios públicos. Datos de INEGI. Procesos automatizados de descarga de tablas. Armado de tablas de hechos. 
     
     
    Módulo 2 TÉCNICAS.
     
    Objetivo:

    En el segundo módulo se presentan los fundamentos de las técnicas aplicadas a las actividades de elaboración y de prueba de conjeturas. El módulo inicia con la presentación de las técnicas estadísticas y continúa con las herramientas de modelado analítico. Se analizan los conceptos de correlación lineal y se revisan las distribuciones estadísticas más comunes. Se contemplan las transformaciones de los datos y su justificación. Se revisan los procedimientos para imputar datos faltantes de acuerdo con las distribuciones y correlaciones observadas en los datos o derivados de información adicional. Se contemplan los cuatro modelos básicos: clasificación y estimación de continuos como métodos supervisados, y asociaciones y conglomerados como métodos no supervisados, y se justifica su funcionamiento.
     
    Temario:

    1. Variables continuas y variables discretas. La estadística como herramienta de exploración de los hechos representados por los datos. Creación de modelos. Variable objetivo y variables explicativas. Estadística descriptiva. Estimadores estadísticos principales. Histogramas y cruces de variables. Variables discretas y variables continuas. Combinaciones. Tratamiento. Elección de intervalos para los cruces de las variables continuas. Variables ordinales. Distribuciones de probabilidad. Supuestos y hechos importantes. Inferencia estadística.
    2. Correlación lineal. Regresión lineal. Variable objetivo. Estimación como valor esperado. Variantes. Series de tiempo, autorregresión, estacionalidad. Pronóstico. La correlación y la covarianza. Relaciones lineales y relaciones no lineales. Análisis multidimensional. Análisis Discriminante. Componentes principales. 
    3. Concepto y medida de información e información mutua.
    4. Técnicas analíticas / KDD. Modelos de clasificación. Modelos predictivos. Formación de conglomerados. Alternativas para formación de conglomerados. Reglas de asociaciones y técnicas de canasta.
    5. Minería / analítica de datos. Método general de trabajo. Separación en datos de prueba y datos de entrenamiento para el caso de modelos con aplicación a futuro. Método de MultiFold para validación cruzada.
    6. Clasificadores: Objetivo. Información y métricas básicas de ajuste. Área de la ROC. Función de utilidad. Lift. Score de corte. Árboles de clasificación, métodos bayesianos, regresión logística y su relación con el análisis discriminante. Redes neuronales como clasificadores. Arquitectura. Bosques aleatorios. Máquinas de soporte vectorial. Modelos KNN.
    7. Pronóstico: Revisión de la regresión lineal. Correlación lineal como medida de bondad de ajuste. CART o árbol de regresiones, criterio de separación de los nodos u hojas. Redes neuronales como estimadores de continuos. Arquitecturas. Redes neuronales en series de tiempo. Arquitecturas. Modelos KNN.
    8. Asociaciones: Problema básico de la canasta de productos. Método a priori. Métricas aplicables. Cadenas de Markov y patrones de comportamiento.
    9. Conglomerados: Métricas de similitud y separación. Técnicas y métodos. Técnicas basadas en la distancia. Técnicas basadas en la similitud.
     
     
    Módulo 3 APLICACIONES.
     
    Objetivo En el tercer módulo se perfecciona el uso de los conceptos, las técnicas y las herramientas mediante el desarrollo de casos con volúmenes apreciables de datos. Se consideran situaciones en las que se parte de datos transaccionales para las labores de minería. Los datos se toman de repositorios públicos. 
     
    Temario 

    1. Patrones y relaciones entre elementos. Representación y formación de redes. 
    2. Sobrecarga y compensación en modelos de clasificación. 
    3. Exportación de los modelos. Inserción en aplicaciones transaccionales para automatización de decisiones.
    4. Análisis exploratorio de los datos. Establecimiento de conjeturas. Establecimiento de los modelos. Entrenamiento, prueba y validación. Validación estadística de los resultados.
    5. Minería de textos. Definición del dominio. Restricciones. Técnicas por medio de transformación de palabras. Técnicas por detección de patrones de expresiones.
    6. Aplicaciones “establecidas”. Análisis de potenciales acreditados. Valuación de bienes. Análisis y pronóstico de ventas. Eficiencia de campañas publicitarias. Prospección de venta cruzada.  

Otra formación relacionada con base de datos

  • Diplomado en Ciencia de Datos

  • Centro: UNAM - Universidad Nacional Autónoma de México
  • Solicita información
  • Curso de Fundamentos de Análisis de Datos

  • Centro: KMMX Centro de Capacitación en TI, Web y Multimedia
  • Solicita información
  • Curso en Manejo de bases de datos con SQL

  • Centro: KMMX Centro de Capacitación en TI, Web y Multimedia
  • Solicita información
  • Curso de Access Nivel 1: Introducción a Bases de Datos Relacionales

  • Centro: Folder X Centro de Capacitación
  • Solicita información
  • Curso de Oracle Fundamentos y Taller de SQL

  • Centro: CASE - Computación Avanzada y Sistemas Empresariales, S.A. de C.V.
  • Solicita información
  • Curso - Administración de Bases de Datos SQL Server

  • Centro: Calidad COM
  • Solicita información
  • Curso - PYTHON For Data Science

  • Centro: ISC Intelligence Software Consulting
  • Solicita información