Diplomado en Herramientas de Minería de Datos para Analítica Empresarial VL

Solicita información

Analisis de educaedu

Inés Gonzalez

Diplomado en Herramientas de Minería de Datos para Analítica Empresarial VL

  • Modalidad de impartición La metodología de impartición del Diplomado en Herramientas de Minería de Datos para Analítica Empresarial es Online.
  • Número de horas El programa tiene un tiempo de duración de 120 horas.
  • Titulación oficial Consultar al Instituto Tecnológico Autónomo de México para obtener más detalles.
  • Valoración del programa Con el Diplomado en Herramientas de Minería de Datos para Analítica Empresarial del Instituto Tecnológico Autónomo de México obtendrás las herramientas básicas de programación para el tratamiento de datos, para manejar arreglos, series y dataframes en Python. Crear una plataforma general para la adquisición y procesamiento de datos y analizar los métodos generales para procesar tablas por medio de dataframes en pandas.
  • Dirigido a El Diplomado está diseñado para personal con conocimientos sobre ejecución de programas, manejo de archivos y carpetas, compresión y descompresión de archivos, consulta y descarga de archivos de la red, manejo hojas electrónicas y nociones de bases de datos relacionales. Se requieren conocimientos básicos de álgebra, álgebra lineal, probabilidad y estadística, y nociones elementales de cálculo diferencia.
  • Empleabilidad Al completar el tiempo de estudio, los egresados podrán insertarse laboralmente como analista de datos, arquitecto de datos, analista o estratega de datos, Jefe de proyecto, Emprendedor de negocios y Analista de proyectos de I+D, entre otras posibilidades.

Diplomado en Herramientas de Minería de Datos para Analítica Empresarial VL

  • Contenido Diplomado en Herramientas de Minería de Datos para Analítica Empresarial VL.

    Área: Tecnología Y Computación
    Horario: Lunes De 19:00 A 21:00 H. Y Miércoles De 19:00 A 21:00 H.
    Módulos A Cursar: 5
    Horas: 120
    Notas: Las Sesiones Se Llevaran A Cabo Con El Uso De La Herramienta Zoom.


    ACERCA DEL PROGRAMA.
    El diplomado proporcionará a los participantes las herramientas, técnicas, habilidades y conocimientos que necesitan para elaborar modelos de analítica enfocados al ámbito empresarial. Se estudiarán los modelos supervisados y los no supervisados, así como las técnicas para la transformación de datos. Con los modelos elaborados se realizarán nuevos procesos a partir de los resultados para perfeccionar el modelado en los términos de los objetivos de negocio. Por ejemplo, en los clasificadores se determinará la calificación de corte para los casos en que haya utilidades y costos asociados a la decisión. Se utilizará Python como herramienta general de procesamiento de datos y formación de modelos, con bibliotecas en este lenguaje o interfaces. Asimismo, se usará Weka por su versatilidad y facilidad para el desarrollo rápido de prototipos y modelos. Se contemplará la puesta en producción en Python y Weka y se estudiará R como alternativa. En la revisión de las herramientas se examinarán los tipos de variables para determinar la idoneidad de la herramienta y las transformaciones requeridas o posibles para optimizar la asertividad del modelo.

    ¿A QUIÉN VA DIRIGIDO?
    Los participantes deben contar con habilidades en el manejo de algún sistema operativo: saber ejecutar programas, manejar archivos y carpetas, comprimir y descomprimir archivos, consultar y bajar archivos de la red, manejar hojas electrónicas y tener nociones de bases de datos relacionales. Se requieren conocimientos básicos de álgebra, álgebra lineal, probabilidad y estadística, y nociones elementales de cálculo diferencia.

    PROCESO DE INSCRIPCIÓN PARA DIPLOMADOS
    Genera una cuenta de acceso.
    Completa el formulario de registro en línea.
    Adjunta documentos escaneados por ambos lados en formato PDF. 
    a) Identificación oficial (INE o pasaporte) o CURP
    Realiza el pago mediante las formas que recibirás por correo electrónico (el monto por concepto de inscripción no es reembolsable).


    Plan de Estudio.

    Modulo 1.
    HERRAMIENTAS DE PROCESAMIENTO GENERAL DE DATOS

    Objetivo.
    Se proporcionará a los participantes las herramientas básicas de programación para el tratamiento detallado de datos y para manejar arreglos, series y dataframes en Python. Con ello se establecerá una plataforma general para la adquisición y procesamiento de datos. Se analizarán los métodos generales para procesar tablas por medio de dataframes en pandas.

    Temario.
    1. Programación en Python, datos, colecciones y su procesamiento. Iteraciones
    explícitas e implícitas
    2. Numpy, pandas, seaborn y matplotlib
    3. Estructura del dataframe. Índices y columnas
    4. Importación y exportación de datos. Codificación
    5. Métodos de consolidación de información. Limpieza y transformación de datos
    6. Selección de registros. Funciones lambda. Mutación de valores. Concatenación
    y fusión. Agrupamientos y tablas pivote
    7. Visualización de datos
    8. Herramientas de raspado web
    9. Herramientas para el análisis exploratorio de datos. Ejecución de R y Python en RStudio
    10. Generación de documentos con el resultado de las ejecuciones. RMarkdown

    Modulo 2.
    MODELOS SUPERVISADOS

    Objetivo.
    Los participantes comprenderán los fundamentos, hipótesis y finalidad de los métodos supervisados, la manera en que se establecen los objetivos de negocio en términos de la variable objetivo y las métricas que se utilizan para evaluar la bondad de ajuste de los modelos desarrollados. En los clasificadores, se analizará el comportamiento de la calificación de pertenencia del caso a cada una de las clases y su impacto en términos de negocio.


    Temario.
    1. Introducción a la minería de datos. Modelos supervisados y modelos no supervisados
    2. Clasificadores. Entropía e información. Información ganada
    3. Métricas de bondad de ajuste. Característica operativa del receptor y curva de
    recuperación de precisión. Concepto de calificación de corte
    4. Submuestras de entrenamiento y de prueba. Validación cruzada
    5. Bayesiano ingenuo
    6. Árboles de clasificación y regresión
    7. Regresión logística
    8. Máquinas de soporte vectorial
    9. Redes neuronales como clasificadores
    10. Algoritmos K de vecinos próximos como clasificadores
    11. Sobrecarga y compensación
    12. Predictores. Objetivo
    13. Modelos lineales. Correlación lineal
    14. Regresión lineal. Medidas de bondad de ajuste
    15. Modelos no lineales. Redes neuronales como predictores
    16. Árboles para regresión
    17. Algoritmos K de vecinos próximos como predictores
    18.Series de tiempo: modelos AR, MA y ARIMA

    Modulo 3.
    MODELOS NO SUPERVISADOS Y TRANSFORMACIÓN DE DATOS

    Objetivo.
    Los participantes asimilarán los fundamentos y objetivos de los modelos de asociación y aprenderán a derivar y aplicar las reglas de asociación. Se analizarán las métricas correspondientes a estos modelos y sus implicaciones para el negocio.
    Se revisarán las principales técnicas para elaborar modelos de agrupamiento y los criterios para formar el número adecuado de grupos. Se investigará cómo con ayuda de los clasificadores se analiza el contenido de los grupos resultado de un agrupamiento dado y el impacto para el negocio.

    Temario.
    1. Definición, motivación y panorama del aprendizaje no supervisado
    2. Modelos de asociación: a priori, Eclat, FPGrowth
    3. Modelado y descripción de grafos
    4. Minería e interpretación de grafos
    5. Agrupamiento: dendrogramas y método de Ward
    6. Agrupamiento: K de vecinos próximos y DBSCAN. Métricas
    7. Reducción de dimensionalidad: análisis de los principales componentes
    8. Reducción de dimensionalidad: incrustación de vecinos estocásticos distribuidos en t
    9. Reducción de dimensionalidad: proyecciones
    10.Mapas autoorganizativos
    11.Detección de anomalías
    12.Redes neuronales no supervisadas (autosupervisadas).

    Modulo 4.
    PROCESAMIENTO Y ANÁLISIS DE TEXTO

    Objetivo.
    Se examinarán los problemas que surgen al elaborar modelos para tratamiento de texto. Se configurarán procesamientos para extraer la información para el análisis de textos y se utilizará esta información con los modelos supervisados y no supervisados vistos en los módulos previos. Los participantes comprenderán la finalidad del análisis de texto en función de sus objetivos.

    Temario.
    1. Captura de datos en páginas web
    2. Captura de tuits
    3. Corpus. Proceso general de detección de asociación de términos. Medidas de
    relevancia
    4. Matriz de documentos y términos. Búsqueda de narrativas
    5. Expresiones regulares para las narrativas
    6. Variables indicadoras de narrativas para clasificadores, predictores,
    asociaciones o conglomerados. Puesta en producción de detección de
    narrativas en textos
    7. Herramientas disponibles para lenguaje hablado. Explotación de datos para chabots
    8. Bolsa de palabras. Frecuencia de término y frecuencia inversa de documento
    9. N-gramas
    10. Incrustaciones
    11. Análisis de sentimientos

    Modulo 5.
    SISTEMAS DE RECOMENDACIONES. USO DE HERRAMIENTAS EN LA NUBE

    Objetivo.
    Los participantes entenderán la importancia de estudiar los sistemas de
    recomendaciones, pues constituyen una de las herramientas comerciales más importantes de la actualidad, y aprenderán a elaborar los modelos
    correspondientes.

    Temario.
    1. Sistemas de recomendaciones
    2. Análisis de “clientes” y su comportamiento
    3. Conformación de agrupamientos y asociación de “ítems”
    4. Procesamiento en flujo
    5. Ejemplos en R para proceso de datos
    6. Bibliotecas equivalentes para modelos supervisados y no supervisados
    7. Procesamiento de matrices dispersas
    8. Datos en la nube y herramientas en nube
    9. Prácticas con herramientas en nube para elaboración de modelos
    10.Avance y presentación del proyecto

Otra formación relacionada con data mining