El objetivo de este workshop es que el estudiante aprenda los conocimientos necesarios para desarrollar una arquitectura de producto de datos basado en el modelo de sistemas complejos a través de redes (grafos) . En este curso se aprenderá la teoría en la que se sustenta el desarrollo de modelos de sistemas complejos y al mismo tiempo, las habiliades técnicas para desarrollar un producto de ciencia de datos. Se verán dos aplicaciones que se usan hoy en día en la ciencia de datos con está visión: analisis de redes sociales (digitales) y sistemas de recomendación. En ambos, se busca utilizar la ciencia de datos para caputrar el comportamiento complejo de un sistema social, también conocido como inteligencia colectiva.

La parte teórica comprende la lectura de algunos artículos (papers) y capitulos de libros relevantes para cimentar los conocimientos que dan sustento teórico a los producto de datos  basados de grafos.

Para este curso es necesario que el estudiante tenga conocimiento basico del lenguaje de programación Python.

Modulo 1

  1. Sistemas complejos y Ciencia de Datos
  2. Teoría de Grafos conPython:NetwrokX
  3. Analisis de Redes Sociales
  4. Bases de Datos de Grafos con Neo4j

Modulo 2

  1. Twitter como un sistema complejo
  2. Twitter y Python
    • Twitter API & librerias de Py2neo
  3. Tiny-Producto de Datos (TPD) con Twitter y Neo4j
  4. Analisis de Redes Sociales (centralidad)

 

Modulo 3 

  1. Computación en la nube: ejecutando nuestro TPD en AWS
  2. Levantando una base de datos relacional en la nube: PostgreSQL
  3. Analisis de Texto: LDA