Los datos que utilizan los profesionales de las ciencias ambientales y sociales para tomar decisiones y contrastar hipótesis usualmente cuentan con estructura jerárquica (multi-nivel), como mediciones en plantas agrupadas en distintos sitios a su vez agrupados por características climáticas, o el análisis de datos provenientes de individuos agrupados en estudios los cuáles pertenecen a distintas regiones. Estos datos no cumplen con los supuestos de los modelos y análisis estadísticos comúnmente aprendidos en los cursos de grado, entre ellos regresión lineal simple/múltiple y experimentos factoriales (o en bloques) de efectos fijos.
Discutiremos cómo colectar datos con estructura jerárquica (diseño de estudios) para obtener respuestas válidas a nuestras preguntas, modelos que abordan estas situaciones, su estimación y bondades relativas. Abarcaremos conceptos relacionados con medidas repetidas en el tiempo y en el espacio, autocorrelación, series de tiempo, diseño en parcelas dividas, modelos mixtos, modelos lineales generalizados, independencia, bondad de ajuste, inferencia y selección de modelos, entre otros. Nuestro curso no presenta una revisión exhaustiva de los múltiples modelos de dependencia espacial o temporal de los datos, para lo cuál recomendamos otros cursos más específicos (por ejemplo, de geoestadística).
Dedicaremos la mitad del curso frente a computadoras analizando datos reales. Modelaremos datos con distintas distribuciones estocásticas (e.g., normal, binomial), limitándonos al estudio de modelos con una sola variable de respuesta (dependiente). Aplicaremos estos conceptos a ejemplos de ciencias ambientales y sociales.