CDA

Centro de Alumnos

Unidades

16px

Unidad 1: ¿Qué dicen los gráficos? Análisis crítico de la información

1. Vocabulario clave

  • Histograma: gráfico de barras para datos agrupados.
  • Polígono de frecuencia: línea que une puntos medios del histograma.
  • Frecuencia acumulada: suma progresiva de frecuencias.
  • Diagrama de caja y bigotes: muestra mediana, cuartiles y posibles valores atípicos :contentReference[oaicite:2]{index=2}.
  • Nube de puntos: gráfico para ver relación entre dos variables.
  • Tendencia: dirección general de un conjunto de datos.

2. Conceptos y estructuras

  • Seleccionar gráfico adecuado: barras para categorías; cajas para distribución; nube para relación.
  • Etiquetas y escalas: ejes deben tener títulos y unidades claras :contentReference[oaicite:3]{index=3}.
  • Interpretar mediana y dispersión: posición de mediana dentro de la caja indica asimetría :contentReference[oaicite:4]{index=4}.
  • Detectar valores atípicos: puntos fuera de los "bigotes" (1.5×IQR) :contentReference[oaicite:5]{index=5}.

Fórmula IQR: IQR = Q₃ – Q₁

Bigotes: desde Q₁ – 1.5·IQR hasta Q₃ + 1.5·IQR

3. Método para elegir y analizar gráficos

  1. ¿Qué tipo de datos tienes? (categoría o numérico)
  2. Elige el gráfico apropiado (barras, caja, nube).
  3. Etiqueta ejes, define adecuadamente escalas.
  4. Mira tendencia, dispersión y outliers.
  5. Pregunta: ¿qué historia cuentan los datos?

4. Ejemplos resueltos (como si fueran con frutas)

Ejemplo 1: Histograma vs barra

Tienes 20 frutas: 8 manzanas, 5 peras, 7 naranjas. Quieres mostrar frecuencias:

  • Gráfico de barras: manzanas=8, peras=5, naranjas=7.
  • No uses histograma (eso sería para peso, por ejemplo).

Decisión: barras, porque se comparan tipos.

Ejemplo 2: Caja y bigotes

Pesos de manzanas (g): [100,120,130,150,200]

  • Ordenados: igual
  • Q₁=120, mediana=130, Q₃=150 → IQR=30
  • Bigotes entre 120−45=75 y 150+45=195
  • 200 es outlier (fuera del rango) → se marca fuera de la caja :contentReference[oaicite:6]{index=6}.

Ejemplo 3: Nube de puntos

Relación entre tamaño y peso de frutas:

  • Tamaño (diámetro): 5,6,7,8 cm
  • Peso (g): 80,100,130,160
  • Punto a punto se observa tendencia: a mayor diámetro, mayor peso.

5. Procedimientos paso a paso

Para diagrama de caja:
  1. Ordenar datos.
  2. Calcular Q₁, Q₂ (mediana), Q₃.
  3. Calcular IQR.
  4. Determinar límites de bigotes.
  5. Dibujar caja y marcar valores atípicos.
Para gráficos: seleccionar gráfico acorde al tipo de datos y contar frecuencia, luego etiquetar ejes y títulos.
Para nube de puntos:
  1. Marcar parejas (x,y).
  2. Observar tendencia y si hay valores atípicos.

6. Conclusión

Dominar este análisis te permite:

  • Elegir el gráfico correcto según el tipo de datos.
  • Entender qué dicen medianas, dispersión y extremos.
  • Saber interpretar tendencias y anomalías.
  • Tomar decisiones fundamentadas con evidencia.

Unidad 2: Comprender la media muestral, medidas de dispersión y correlación

1. Propósito de la unidad

Entender cómo la media muestral resume un conjunto de datos, cómo las medidas de dispersión (rango, varianza, desviación) muestran qué tan dispersos están esos datos, y cómo se relacionan dos variables mediante la correlación.

2. Vocabulario clave

  • Media muestral (𝑥̄): promedio de los datos.
  • Rango: diferencia entre máximo y mínimo.
  • Varianza (muestral): promedio del cuadrado de las diferencias respecto a la media.
  • Desviación estándar (s): raíz cuadrada de la varianza.
  • Correlación: medida de relación lineal entre dos variables.
  • Coeficiente de correlación (r): valor entre –1 y 1.

3. Conceptos explicados con claridad

Pensemos en peras y manzanas:

  • La media es como el número promedio de frutas por canasta si distribuyes igual.
  • El rango muestra cuánta diferencia hay del más "pesado" al más "ligero".
  • La varianza y desviación nos dicen qué tan lejos están las canastas de la media.
  • Si mides peso y azúcar, la correlación te dice si más peso significa más azúcar (r cercano a 1).

4. Fórmulas clave

  • 𝑥̄ = (Σ xᵢ)/n
  • Rango = xₘₐₓ – xₘᵢₙ
  • Varianza: s² = [Σ(xᵢ – 𝑥̄)²] / (n–1)
  • Desviación estándar: s = √s²
  • Correlación de Pearson: r = [Σ(xᵢ–𝑥̄)(yᵢ–𝑦̄)] / [√Σ(xᵢ–𝑥̄)² √Σ(yᵢ–𝑦̄)²]

5. Pasos para resolver problemas

  1. Ordena los datos y calcula 𝑥̄.
  2. Calcula rango, luego varianza y desviación.
  3. Si hay dos variables, construye nube de puntos y calcula r.
  4. Interpreta r: cercano a 1→muy relacionada, –1→opuesta, 0→sin relación lineal.
  5. Dibuja caja y bigote con Q₁, mediana y Q₃.

6. Ejemplos resueltos

Ejemplo 1: Media y desviación

Pesos (g): 100, 120, 130, 150, 200

  • Media = (100+120+130+150+200)/5 = 700/5 = 140 g
  • Desviaciones: −40, −20, −10, 10, 60 → Cuadrados: 1600,400,100,100,3600; sumatoria = 5800
  • Varianza = 5800/(5−1)=1450 → desvest ≈38 g

Ejemplo 2: Correlación simple

Tamaño (cm):5,6,7; Azúcar(g):10,12,14

  • Media t=6, media a=12
  • Σ(xᵢ–6)(yᵢ–12)= (−1×−2)+(0×0)+(1×2)=4
  • Σ(xᵢ–6)²=2, Σ(yᵢ–12)²=8 → r=4/√(2×8)=4/4=1 → relación perfecta

Ejemplo 3: Caja y bigotes

Pesos: 80, 100, 120, 140, 160

  • Q₁=100, mediana=120, Q₃=140 → IQR=40
  • Bigotes: 100–1.5×40=40 y 140+60=200 → rango real entre 80 y 160, no hay outliers

7. Actividades para practicar

  • Calcula media, desvest, varianza y rango para: [4,5,5,7,9,10].
  • Relaciona y con x: x=[1,2,3,4], y=[2,4,6,8] → calcula r.
  • Construye una caja y bigote con datos: [60,75,80,95,120,150,200].

8. Conclusión

Conocer media, dispersión y correlación permite comprender la distribución de datos y cómo se relacionan entre sí. Estas herramientas son clave para interpretar información y tomar decisiones fundamentadas.

Unidad 3: Modelaje con distribuciones Binomial y Normal

1. Vocabulario clave

  • Distribución binomial: número de éxitos en n pruebas con probabilidad p :contentReference[oaicite:2]{index=2}.
  • Distribución normal: curva de campana, variables continuas, centrada en μ con desviación σ :contentReference[oaicite:3]{index=3}.
  • Teorema del límite central: suma de variables → distribución normal :contentReference[oaicite:4]{index=4}.

2. Fórmulas esenciales

  • Binomial: P(X=k) = C(n,k)·pᵏ·(1−p)ⁿ⁻ᵏ :contentReference[oaicite:5]{index=5}.
  • Media: μ = n·p | Varianza: σ² = n·p·(1−p) :contentReference[oaicite:6]{index=6}.
  • Normal estándar (Z): Z = (X−μ)/σ :contentReference[oaicite:7]{index=7}.

3. ¿Por qué usar distribución binomial?

Como contar cuántas “peras” saldrán si lanzas 10 veces con p=0.3. Modela experimentos con dos resultados (éxito/fracaso), con probabilidad fija y repeticiones independientes :contentReference[oaicite:8]{index=8}.

4. ¿Por qué usar distribución normal?

Cuando n es grande, la distribución binomial se parece a la normal (teorema de De Moivre–Laplace) :contentReference[oaicite:9]{index=9}. Además, la normal ayuda a calcular probabilidades rápidamente usando tablas Z :contentReference[oaicite:10]{index=10}.

5. Pasos para resolver problemas

  1. Binomial: define n, p; calcula P(X=k) con fórmula o tabla.
  2. Normal: identifica μ y σ; calcula Z; usa tabla o software.
  3. Aproximación: si n·p ≥ 5 y n·(1−p) ≥ 5, puedes usar normal para binomial :contentReference[oaicite:11]{index=11}.

6. Ejemplos con peras y manzanas

Ejemplo 1 (Binomial):

Lanzas 5 veces una “pera” con p=0.2, ¿P(2 peras)?

  • P(X=2) = C(5,2)·0.2²·0.8³ = 10·0.04·0.512 = 0.2048

Ejemplo 2 (Binomial como normal):

Lanzas 100 veces, p=0.3 → μ=30, σ≈4.58. ¿P≈ entre 25 y 35? → Z₁=(24.5−30)/4.58≈−1.20, Z₂=(35.5−30)/4.58≈1.20 → P≈0.884

Ejemplo 3 (Normal directa):

Peso de manzanas ~ N(150g, σ=15g). ¿P(entre 135g y 165g)? → Z=(135−150)/15=−1 y Z=1 → P≈0.68 (regla empírica).

7. Caja de bigotes aplicada

Usa pesos de manzanas [120,130,140,150,160,170,180]: Q₁=140, mediana=150, Q₃=170 → IQR=30; bigotes entre 140−45=95 y 170+45=215, no hay outliers; útil para ver simetría y dispersión.

8. Conclusión

La binomial sirve para contar “peras” en ensayos discretos; la normal para encontrar probabilidades de largo plazo (n grande) o variables continuas. Ambas son herramientas complementarias, apoyadas por visualización estadística como cajas de bigotes.

Unidad 4: Hacer inferencia estadística

1. Propósito de la unidad

Aprender a deducir información sobre una población bien modelada por una distribución normal a partir de una muestra representativa.

2. Vocabulario clave

  • Población: conjunto total de elementos.
  • Muestra: segmento representativo de la población :contentReference[oaicite:0]{index=0}.
  • Parámetro: característica poblacional (e.g., media μ).
  • Estadístico muestral: estimación calculada desde la muestra (e.g., media muestral x̄) :contentReference[oaicite:1]{index=1}.
  • Error estándar: desviación estándar de la distribución de x̄.
  • Intervalo de confianza: rango donde probablemente está μ.
  • Prueba de hipótesis: proceso para aceptar o rechazar supuestos sobre μ.
  • Distribución muestral: comportamiento de x̄ en muestreos repetidos :contentReference[oaicite:2]{index=2}.

3. Conceptos explicados

Imagina que tienes una gran caja con peras. Sacas 30 al azar y pesas cada una. Con esos datos estimas el peso promedio de todas las peras (población). Aunque no pesas todas, con la media muestral y su error puedes inferir el promedio real.

Si las peras vienen de una población con distribución normal, la media muestral x̄ también sigue una distribución normal (teorema del límite central) :contentReference[oaicite:3]{index=3}.

4. Fórmulas clave

  • Media muestral: x̄ = Σxᵢ / n
  • Error estándar: SE = σ / √n (si σ conocido)
  • Intervalo de confianza 95 %: x̄ ± 1.96·SE
  • Estadístico de prueba (Z): Z = (x̄ – μ₀) / SE

5. Método paso a paso

  1. Sacar muestra aleatoria y calcular x̄.
  2. Calcular SE con σ o estimado por s/√n.
  3. Determinar intervalo de confianza (ej. 95 %).
  4. Para hipótesis: calcular Z y comparar con valor crítico.
  5. Interpretar resultado: ¿aceptar o rechazar H₀?

6. Ejemplos resueltos

Ejemplo 1: Intervalo de confianza

Pesos (g) de 36 peras: x̄=150, σ=12. SE=12/6=2. Intervalo = 150 ± 1.96·2 → [146.08, 153.92] g.

Ejemplo 2: Prueba de hipótesis

Se afirma que μ=155g. Z = (150–155)/2 = -2.5. Z crítico ±1.96 → rechazo H₀ (la media no es 155g).

Ejemplo 3: Caja de bigotes

Pesos: [130,140,150,150,155,160,170]

  • Q₁=145, mediana=150, Q₃=160 → IQR=15
  • Bigotes: [145–22.5,160+22.5] = [122.5,182.5]
  • No hay outliers (todos dentro del rango)

7. Actividades propuestas

  • Saca muestra de 25 peras, calcula x̄ y un IC 90 %.
  • Prueba si la media es diferente de 148g con α=0.05.
  • Dibuja la caja de bigotes de los pesos y explica simetría o asimetría.

8. Conclusión

La inferencia estadística te permite estimar características de una población (media, proporción) y evaluar hipótesis usando una muestra y supuestos de normalidad. Las cajas de bigote complementan este análisis al mostrar dispersión y simetría.