INTRODUCCIÓN

¡Hola a todos!

¡Bienvenidos al mundo de los datos!

En la actualidad las Ciudades producen millones de datos por segundo y hoy tenemos la oportunidad de aprovecharlos desde nuestra profesión para poder trabajar y tomar decisiones en base a evidencia real.

El objetivo del manual es presentarle a los profesionales interesados en analizar diversas variables territoriales (sociodemográficas, mercado inmobiliario, actividad económica, transporte, movilidad, salud, educación, etc), la importancia de conocer herramientas analíticas que les permitan manipular y extraer conocimiento de grandes volúmenes de datos para tomar mejores decisiones a la hora de diagnosticar, comprender e intervenir el territorio.

Concretamente, el manual introducirá los conocimientos básicos del lenguaje de programación R y del software libre RStudio, y su potencialidad para el análisis de datos urbanos.

A lo largo de cada módulo se aplicará la herramienta a datos reales, con el fin de analizar, describir, interpretar, visualizar y extraer conocimiento de datos existentes.

Indice

Módulo 1: INTRODUCCIÓN BIG DATA Y CIUDAD

¿Qué es la Ciencia de Datos? ¿Cómo utilizar grandes volúmenes de datos para analizar dinámicas urbanas? ¿Qué datos existen? ¿Qué información contienen las bases de datos? ¿Cómo se estructuran?

Introducción a programación en lenguaje R y el software RStudio.

Para esta clase será necesario tener previamente instalado el lenguaje de programación R (https://cloud.r-project.org/), y la interfaz gráfica RStudio Desktop (https://rstudio.com/products/rstudio/download/).

En el caso de no poder instalar correctamente el programa, se recomienda utilizar RStudio Cloud (https://rstudio.cloud/).

Módulo 2: MANIPULACIÓN DE DATOS

Manipular y transformar los datos: Técnicas de data wrangling.

¿Cómo extraer información útil de los datos? ¿Cómo encontrar información específica?

Análisis exploratorio de datos. Las funciones de tidyverse: Seleccionar, Filtrar, Ordenar, Modificar, Resumir, Agrupar y Renombrar los datos.

Módulo 3: ANÁLISIS Y VISUALIZACIÓN DE DATOS

Análisis y Visualización de Información.

¿Por qué representar gráficamente los datos? ¿Qué tipo de visualización conviene usar?

Extraer conocimiento de los datos a partir de la correcta visualización de los mismos. Comunicar resultados desarrollando gráficos con ggplot.

Módulo 4: INFORMACIÓN GEOGRÁFICA Y MAPAS

Análisis y Visualización de Información Geográfica.

¿Qué son los Sistemas de Información Geográfica (SIG)? ¿Por qué mapear datos? ¿Dónde se ubican los datos? ¿Cómo se distribuyen en el territorio? ¿Presentan algún patrón espacial?

Análisis exploratorio de datos espaciales. Adquirir conocimiento de las herramientas básicas del paquete sf para manipular información geográfica teniendo en cuenta formatos, sistemas de coordenadas y proyecciones. Generación de mapas temáticos con ggplot.