Logo Passei Direto

Guía de Estadística General - UNALM

Herramientas de estudio

Material
¡Estudia con miles de materiales!

Vista previa del material en texto

UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 1 
CAPÍTULO I 
 
CONCEPTOS BÁSICOS 
 
La Estadística proporciona una serie de métodos y técnicas que permiten analizar 
información de las diferentes especialidades como Agronomía, Industrias Alimentarias, 
Zootecnia, Economía, etc. con la finalidad de analizarla y tomar decisiones. 
 
Objetivo. Entender conceptos básicos y los alcances de la estadística, que servirán de 
base para la comprensión y desarrollo de los capítulos posteriores. 
 
1.1 Definición de Estadística 
 
La Estadística es la ciencia del aprendizaje a partir de los datos y de medición, control y 
comunicación de la incertidumbre, proporcionando los medios esenciales para el avance 
científico y social. 
 
Los estadísticos proporcionan una guía crucial para determinar qué información es fiable 
y que predicciones son confiables. Ayudan a la búsqueda de pistas sobre la solución de 
un misterio científico y, a veces a evitar que los investigadores sean engañados por 
falsas impresiones. 
 
Fuente: Davidian, M. and Louis, T. Whats is Statistics?. Consultado el 24 de Julio de 
2014, página web de la American Statistical Association. 
http://www.amstat.org/careers/whatisstatistics.cfm 
 
División de la Estadística 
 
La Estadística puede ser dividida en: 
 
 La Estadística Descriptiva. Parte de la estadística que se ocupa de la clasificación, 
descripción, simplificación y presentación de los datos. Comprende el uso de tablas 
de frecuencias, gráficos y el cálculo de medidas estadísticas. 
 
 La Estadística Inferencial. Parte de la estadística que se ocupa de la estimación y 
prueba de hipótesis de los parámetros de una población, a partir de una muestra 
aleatoria extraída de dicha población. 
 
Ejemplo 1 
Se ha hecho estudio del medio de transporte que usan los estudiantes de la UMALM. 
Para lo cual se tomó una muestra aleatoria de 350 estudiantes. 
 
Se aplicó la Estadística Descriptiva: con la finalidad de organizar y presentar en una 
tabla de frecuencias y en forma gráfica los datos recogidos de la encuesta. 
 
 
 
 
 
 
 
 
 
 
 
 
 
Fuente: Elaboración propia 
 
Medio de 
transporte Número Porcentaje 
Propia 100 28,6 
Público 180 51,4 
Privado 30 8,6 
Bicicleta 40 11,4 
Total 350 100,0 
 Fuente: Elaboración propia 
 
Distribución del medio de transporte 
que usan los estudiantes 
 
28.6
51.4
8.6
11.4
00
10
20
30
40
50
60
Propia Público Privado Bicicleta
%
Distribución del medio de transporte
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 2 
Además, se calculó la medida estadística: el gasto promedio por el medio de transporte 
usado fue de S/. 35.5 semanal 
 
Se aplica la Estadística Inferencial: se estimó que la proporción de estudiantes de la 
UNALM que usan el medio de transporte público es 51.4% y tienen un gasto promedio 
de S/. 42.5 semanal. Se desea probar si proporción de estudiantes de la UNALM que 
usan el medio de transporte público es mayor al 62.0% y que el gasto promedio es 
menor a S/. 42.0. 
 
1.2. Conceptos básicos 
 
1) Población. Es el conjunto de unidades elementales con características similares. El 
estudio de toda la población constituye un censo. 
 
Ejemplo 2 
1. Todos los ganaderos del valle de Cajamarca. 
2. Todos los futbolistas que participarán en el campeonato descentralizado de 
fútbol 2018. 
3. Todas las semanas de venta en una comercializadora de PC entre el 2010-2017. 
 
2) Unidad Elemental. Es un elemento particular de la población o muestra. 
 
Ejemplo 3 
1. Un ganadero del valle de Cajamarca 
2. Un futbolista que participará en el campeonato descentralizado de fútbol 2018. 
3. Una semana de venta en una comercializadora de PC entre el 2010-2017. 
 
3) Muestra. Es un subconjunto de la población. Al proceso de obtención de una 
muestra se le llama “muestreo”. Para que una muestra sea representativa debe 
cumplir con las siguientes condiciones: 
a) Debe haber sido obtenida al azar. 
b) Su tamaño y sus elementos deben haber sido seleccionados aplicando un 
método de muestreo. 
 
Ejemplo 4 
1. 420 ganaderos del valle de Cajamarca. 
2. 380 futbolistas que participarán en el campeonato descentralizado de fútbol 
2018. 
3. 25 semanas de venta en una comercializadora de PC entre el 2010-2017. 
 
Ejercicio 1. Se desea realizar un estudio sobre el consumo de agua de los estudiantes 
de la UNALM matriculados en el ciclo de verano 2017. Para el estudio se obtuvo una 
muestra aleatoria de 260 estudiantes. Defina población, unidad elemental y muestra. 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 3 
Ejercicio 2. El instituto Nacional Agraria e Innovación (INAI), va realizar un estudio de 
reforestación en la Selva Central del Perú. Para el estudio se desea evaluar una muestra 
de 650 árboles que tengan más de 10 años de edad. Defina población, unidad 
elemental y muestra. 
 
 
 
 
 
 
 
 
 
 
 
 
4) Variable. Son las características que toman diferentes valores cuando son 
evaluadas en las unidades elementales de una población o muestra. Se representan 
por las últimas letras mayúsculas del alfabeto, por ejemplo: X, Y, Z, W, P, T, X1, X2, 
Y1, etc. 
 
Tipos de Variables 
Pueden ser de dos tipos: Cuantitativas y Cualitativas. 
 
Variables Cuantitativas. Son aquellas que se expresan en forma numérica y tiene 
sentido realizar operaciones matemáticas con ellas. Pueden ser: Continuas o Discretas. 
 
 Variable Cuantitativa Continua. Son aquellas que pueden tomar cualquier valor 
numérico dentro de un intervalo continuo. Se utiliza un instrumento de medición 
para generar sus valores: balanza, termómetros, test, escalas, cronómetros, 
winchas, etc. 
 
Ejemplo 5 
1. Costo de inventario (soles) 
2. Longitud del langostino de río (cm) 
3. Tiempo para atender un pedido en una pizzería (minutos) 
 
 Variable Cuantitativa Discreta. Son aquellas que cumplen con la condición de 
que entre un valor cualesquiera y su consecutivo no es posible que existan valores 
intermedios. Generalmente son representados por el conjunto de números enteros. 
Las observaciones cuantitativas discretas se registran por conteo. 
 
Ejemplo 6 
1. Número de pacientes atendidos cada 15 minutos en el área ambulatoria 
2. Número de predios que posee un agricultor de un valle 
3. Número de quejas de los clientes de una aseguradora 
 
Variable Cualitativa. Son aquellas que permiten que una unidad elemental pueda ser 
clasificada como poseedora o no de cierta cualidad, propiedad o atributo. No tiene 
sentido realizar operaciones matemáticas con ellas. Son aquellas cuyos valores posibles 
son atributos o categorías. Pueden ser: Nominal o Jerárquica. 
 
 Variable Cualitativa Nominal. Son aquellas cuyos valores (cualidades, 
propiedades o atributos) no son factibles de ser clasificados a través de un criterio 
de orden o jerarquía. Sus valores posibles no tienen un orden de importancia. 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 4 
Ejemplo 7 
1. Sexo de los estudiantes (Masculino o Femenino) 
2. Estado civil de una persona (Soltero, Casado, Divorciado, Viudo o Conviviente) 
3. Las zonas de las sucursales de un banco (Sur, Centro o Norte)4. Los estados del agua (Sólido, Líquido o Gaseoso) 
 
 Variable Cualitativa Jerárquica u Ordinal. Son aquellas donde sí se puede 
establecer un criterio de orden o jerarquía entre sus atributos de la variable. 
 
Ejemplo 8 
1. Calificación del servicio del comedor de la UNALM (Bueno, Regular o Malo) 
2. Nivel de instrucción (Sin instrucción, Primaria, Secundaria o Superior) 
3. Nivel socioeconómico de un cliente (Alto, Medio o Bajo) 
4. Rango de ingreso familiar (500 - 2500, 2501 – 5000, 5001 – 7500, Más de 7500) 
 
5) Observación. Es el valor posible que toma una variable. A las observaciones se les 
suele representar con las letras minúsculas subindicadas, como por ejemplo ix , iy
, iz 
Ejemplo 9 
 
1. X = Peso del langostino de río (en gr). Observaciones: 
2.3,..,0.3,5.2 1021  xxx 
2. Y = Calificación de un servicio. Observaciones: MaloygularyBuenoy  321 ,Re, 
 
Ejercicio 3. En un estudio para evaluar la satisfacción de los socios de un club social-
deportivo, se aplicó la siguiente encuesta. 
 
 
 
 
 
 
 
 
 
 
 
 
 
Complete el siguiente cuadro: 
 
Variable Tipo de variable Observación 
Edad 
Tipo de socio 
Estado de los campos 
deportivos 
 
Frecuencia que encuentra 
libre los campos deportivos 
 
Número de veces que viene 
al club mensualmente 
 
Pago mensual 
 
 
Encuesta de satisfacción 
1. Edad 
2. ¿Qué tipo de socio es? 
1=Principal 2=Asociado 3=Condicionado 
3. ¿Cómo encuentra el estado de los campos deportivos? 
1=Muy bueno 2=Bueno 3=Regular 4=Malo 
4. ¿Con qué frecuencia encuentra libre los campos deportivos? 
1=Siempre 2=Casi siempre 3=Raramente 4=Nunca 
5. Número de veces que viene al club mensualmente 
6. Pago mensual (S/.) 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 5 
Ejercicio 4. Con la finalidad de establecer una línea base, para evaluar un programa 
productivo a los agricultores de la sierra central, se ha aplicado la siguiente encuesta. 
 
 
 
 
 
 
 
 
 
 
 
 
 
Complete el siguiente cuadro: 
 
Variable Tipo de variable Observación 
Nivel tecnológico usado 
Usa fungicidas 
Usa insecticidas 
Número de meses que está en el programa 
 
 
Tamaño del predio 
Ingreso mensual 
 
6) Medidas estadísticas. Son calculadas con la finalidad de describir el 
comportamiento de una variable en la población o en la muestra. 
 
Notación de los principales parámetros y estadísticos 
Medidas estadísticas Parámetro 
(población) 
Valor estadístico 
(muestra) 
Media o Promedio  X 
Mediana ME me 
Moda MO mo 
Proporción  p 
Variancia o Varianza 2 S2 
Desviación Estándar  S 
Coeficiente de Variabilidad CV cv 
 
 
Parámetro. Son medidas estadísticas, para describir el comportamiento de una 
variable en la población. Son calculadas con los datos de toda la población. Es un valor 
constante. Se representan con letras griegas. 
 
Ejemplo 10 
1. Suponga que el número promedio de cocinas vendidas en todos los meses de venta 
es 15.4 ( = 15.4). 
2. El Censo Nacional 2007: XI de Población y VI de Vivienda indica que en el grupo 
edad de 20 a 29 años, el 1.4% de los hombres no sabe leer y escribir mientras que 
el 3.1% de las mujeres no sabe leer y escribir (1 = 0.014 y 2 = 0.031). 
 
Encuesta para la evaluación del programa productivo 
1. Nivel tecnológico usado 
1=Alto 2=Medio 3=Bajo 
2. Usa fungicidas 
1=Si 2=No 
3. Usa insecticidas 
1=Si 2=No 
4. Número de meses que está en el programa 
5. Tamaño de su predio (has) 
6. Ingreso mensual (en soles) 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 6 
3. Suponga que en todo Breña la proporción del nivel de instrucción resultó: 
 
Instrucción Proporción (i) 
Primaria 0.455 
Secundaria 0.445 
Superior 0.100 
TOTAL 1.000 
 
Valor estadístico o Estadígrafo. Son medidas estadísticas, para describir el 
comportamiento de una variable en la muestra. Se calculan con los datos obtenidos de 
una muestra. Son valores variables (varían de muestra a muestra). Los estadísticos 
sirven para estimar a los parámetros. Se representan con letras latinas. 
 
Ejemplo 11 
4. En una muestra de 30 meses de venta se encontró que el número promedio de 
cocinas vendidas fue de 14.9 )9.14( x . 
2. En la encuesta nacional de hogares (ENAHO) indica que el 1.1% de los hombres no 
sabe leer y ni escribir )011.0( p . 
2. Suponga que en distrito de Breña se ha seleccionado una muestra de 500 personas 
encontrándose los siguientes resultados: 
 
 Instrucción Proporción (pi) 
Primaria 0.460 
Secundaria 0.430 
Superior 0.110 
TOTAL 1.000 
 
Ejemplo 12 
En el siguiente ejercicio, identificar: la población, la muestra, unidad elemental, la 
variable, tipo de variable, observación, parámetro y valor del estadístico. 
 
La Oficina de Servicios Generales de la UNALM desea conocer los medios en los cuales 
con mayor frecuencia se transportan los alumnos de la UNALM. Para ello, realiza una 
encuesta a 50 alumnos de pregrado en el semestre 2013-II y encuentra los siguientes 
resultados: 
a) El 70% de los encuestados usa el transporte público y un 20% usa el transporte de 
la universidad y el resto propio. 
b) El 20% de los encuestados consideran que el estado de las unidades de transporte 
de la UNALM es bueno, el 35% que es regular y el 45% que es malo. 
c) El número promedio de unidades que toma para llegar a la universidad es de 1.5. 
d) El tiempo promedio de traslado de su casa a la universidad es de 39.70 minutos. 
 
Solución 
Población: 
Todos los alumnos de la UNALM La Molina de pregrado del semestre 2013-II 
 
Unidad elemental: 
Cada alumno de la UNALM La Molina de pregrado del semestre 2013-II 
 
Muestra: 
50 alumnos de la UNALM La Molina de pregrado del semestre 2013-II 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 7 
Variable 
Tipo de 
Variable 
Observación 
Valor del 
Estadístico 
(estimación) 
Parámetro 
a) X= Medio de transporte 
usado para llegar a la 
UNALM. 
 
 
 
Cualitativa 
nominal 
22x público
 
 
0.70pp  
0.20up  
0.10op  
La proporción de 
alumnos según el 
medio de transporte 
usado para llegar a 
la UNALM. 
b) Y= Opinión sobre el estado 
de las unidades de 
transporte de la 
UNALM. 
 
 
 
 
Cualitativa 
jerárquica 
40y  bueno 0.20bp  
0.35rp  
0.45mp  
La proporción de 
alumnos según la 
opinión sobre el 
estado de las 
unidades de 
transporte de la 
UNALM. 
c) Z= Número de unidades de 
transporte que toma 
para llegar a la 
UNALM. 
 
 
Cuantitativa 
discreta 
4 1z  1.45z  El número promedio 
de unidades de 
transporte que toma 
para llegar a la 
UNALM 
d) V= Tiempo de traslado de 
la universidad a su 
casa. 
Cuantitativa 
continua 
48 55v  39.70v  El tiempo promedio 
de traslado de la 
universidad a su 
casa 
 
Ejemplo 13 
Se presentaron algunos resultados del informe gerencial de marketing “Perfil del adulto 
joven” elaborado por Apoyo Opinión y Mercado. (www.apoyo.com). El informe fue 
elaborado a partir de los resultados de una encuesta realizada el 25 Abril del 2010 a 
una muestra aleatoria conformada por 2000 jóvenes de Lima Metropolitana de todos los 
niveles socioeconómicos y cuyas edades fluctúan entre los 21 y 35 años de edad. 
 El ingreso medio mensual es de 1320 nuevos soles. 
 El 5% tiene estudios de postgrado, el 17% universitaria completa, el 33% 
universitaria incompleta, el 35% secundaria completa y el resto secundaria 
incompleta. 
 El 42% de jóvenes trabaja en empresas estatales. 
 
Solución 
 
Población. 
Todos los jóvenes de Lima Metropolitana de todos los niveles socioeconómicos y cuyas 
edades fluctúan entre los 21 y 35 años. 
 
Muestra. 
2000 jóvenes de Lima Metropolitana de todos los niveles socioeconómicos y cuyas 
edades fluctúan entre los 21 y 35años. 
 
Unidad Elemental. 
Un joven de Lima Metropolitana de cualquier nivel socioeconómicos y cuya edad fluctúa 
entre los 21 y 35 años. 
 
Variables Tipo de variable Observación 
Ingreso mensual de los jóvenes Variable cuantitativa continua 1000 
Grado de instrucción Variable cualitativa jerárquica Superior 
Tipo de empresa que trabaja Variable cualitativa nominal Estatal 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 8 
Valores estadísticos 
El ingreso medio mensual es de 1320 nuevos soles. 
El 17% universitaria completa 
El 42% de jóvenes trabaja en empresas estatales. 
Parámetros 
El ingreso promedio mensual 
Porcentaje de jóvenes que tienen cierto grado de instrucción. 
Porcentaje de jóvenes que trabajan en cierto tipo de empresa. 
 
Ejemplo 14 
Con la finalidad de efectuar mejoras con los servicios al turista, se seleccionaron 200 
turistas franceses al azar que arribaron a nuestro país el 2013 y se les aplicó una 
encuesta en la que se preguntó por: 
 
 Número de días que permanecieron en el país, obteniéndose un promedio de 8 días. 
 Medio de transporte que utilizaron para viajar, a lo que el 20% respondió que viajó 
en avión, el 30% en tren y el 50% en bus. 
 Monto gastado durante el tiempo de estadía, de lo que se obtuvo un promedio de 
4560.6 soles por encuestado. 
 En cuanto al servicio de alimentación el 30% lo calificó de excelente, el 20% muy 
bueno y el 50% bueno. 
 
Solución: 
 
Población: 
Todos los turistas franceses que arribaron a nuestro país el 2013 
 
Muestra: 
200 turistas franceses que arribaron a nuestro país el 2013 
 
Unidad elemental: 
Un turista francés que arribó a nuestro país el 2013 
 
Variables: Tipo de variables: Observación: 
X1 : Número de días de permanencia en el país Cuantitativa discreta 10 días 
X2 : Medio de transporte para trasladarse Cualitativa nominal Avión 
X3 : Monto gastado durante el tiempo de estadía Cuantitativa continua S/. 3520 
X4: Opinión sobre el servicio de alimentación Cualitativa jerárquica Excelente 
 
Valor estadístico: 
Número promedio de días de permanencia en el país )8( díasx  
Porcentaje del medio de transporte para trasladarse en avión %)0.20( p 
Monto gastado promedio durante el tiempo de estadía ( / .4560.6)x S 
Porcentaje que opinaron sobre el servicio de alimentación excelente %)0.30( p 
 
Parámetros: 
Número promedio de días de permanencia en el país 
Porcentaje del medio de transporte para trasladarse 
Monto gastado promedio durante el tiempo de estadía 
Porcentaje que opinaron sobre el servicio de alimentación 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 9 
Ejercicio 5. La Dirección de Salud (DISA) de una zona rural desea realizar un estudio 
para evaluar la calidad de servicio de las postas de salud. Con esta finalidad se extrae 
aleatoriamente 45 postas de la DISA con lo cual se obtiene la siguiente información: 
 El 45% de las postas de salud registraron como enfermedad principal las 
respiratorias, 35% estomacales y el resto de la piel. 
 El número promedio de niños menores de 6 años atendidos fue de 120.5 
 Sólo el 25% de las postas tienen como turno de atención mañana y tarde. 
Identificar la población, unidad elemental, muestra, variables, tipos de variables, 
observación, parámetros y valor estadístico. 
 
 
 
 
 
 
 
Variable Tipo de 
Variable 
Observación Valor del 
Estadístico 
Parámetro 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Ejercicio 6. Una empresa distribuidora desea evaluar su eficiencia para atender los 
pedidos de sus clientes. Selecciona aleatoriamente 30 pedidos realizados en el 2013 y 
registra los siguientes datos: Tiempo que se tarda para atender el pedido, nivel de 
satisfacción del cliente (Completamente satisfecho, satisfecho, poco satisfecho, nada 
satisfecho) y el distrito en el que se encuentra el cliente. Algunos resultados fueron: El 
tiempo promedio de atención es de 52 minutos, el 40% está completamente satisfecho 
y el 30% de los pedidos son del distrito de Ate. 
Identificar la población, unidad elemental, muestra, variables, tipos de variables, 
observación, parámetros y valor estadístico. 
 
 
 
 
 
 
 
Variable Tipo de 
Variable 
Observación Valor del 
Estadístico 
Parámetro 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 10 
EJERCICIOS PROPUESTOS 
 
1. Indique el tipo de variable que sea la más apropiada para cada una de las siguientes 
variables: 
 Edad 
 Tamaño de bebida (pequeño, mediano, grande) 
 Ventas anuales 
 Número de camiseta de un jugador 
 Placa del automóvil. 
 Número de DNI 
 Forma de pago ( efectivo, cheque, tarjeta de crédito) 
 Tipo de medalla( Oro, Plata, Bronce) 
 Puesto de llegada en una competencia. 
 Número de celular. 
 Número de personas a favor del aborto. 
 Número de hermanos. 
 
Para cada ejercicio, identificar: la población, la muestra, unidad elemental, la 
variable, tipo de variable, observación, parámetro y valor del estadístico. 
 
2. Se presentaron algunos resultados del informe gerencial de marketing “Perfil del 
adulto joven” elaborado por Apoyo Opinión y Mercado. (www.apoyo.com). El 
informe fue elaborado a partir de los resultados de una encuesta realizada el 14 
Julio del 2011 a una muestra aleatoria conformada por 2000 jóvenes de Lima 
Metropolitana, de todos los niveles socioeconómicos y cuyas edades fluctúan entre 
los 21 y 35 años de edad. 
 El ingreso medio mensual es de 850 nuevos soles. 
 El 1% tiene estudios de postgrado, el 12% educación universitaria completa, el 
15% educación universitaria incompleta y el 2% educación primaria incompleta. 
 El 42% de jóvenes trabaja en empresas estatales. 
 
3. Con el fin de realizar una modificación en el Impuesto al Valor del Patrimonio 
Predial del Municipio de La Molina, se hace un estudio socioeconómico sobre una 
muestra aleatoria de 300 familias residentes en el distrito. Del presente estudio se 
encontraron los siguientes resultados: 
 El ingreso familiar promedio es de S/ 2500.00 nuevos soles. 
 El tipo de material predominante usado en la construcción de la vivienda, 24 de 
ellos dijeron que era de material noble. 
 El 40% de ellos afirmaron que el estado de conservación de su vivienda era 
excelente, 20% muy buena, 20% buena, 10% regular y 10% en pésimas 
condiciones. 
Identificar la población, unidad elemental, muestra, variables, tipos de variables, 
observación, parámetros y valor estadístico. 
4. En un estudio de preferencia de bebidas gaseosas realizado en una muestra de 100 
alumnos de la universidad peruana de las Américas en el semestre 2011-II se han 
obtenido los siguientes resultados: 
 El 52% de los encuestados fueron de sexo masculino 
 El 47% de los encuestados prefieren la gaseosa en presentación de plástico 
 El 40% de los encuestados prefiere la marca Inca Kola y el 30% prefiere Coca 
Cola. 
 La edad promedio de los encuestados es de 20.47 años 
 El número promedio de gaseosas tamaño mediano consumidas por alumno 
semanalmente es de 3.4 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 11 
5. Estudios realizados sobre la contaminación ambiental coinciden en que los 
principales causantes de la contaminación del aire son la combustión en los 
vehículos con motores diesel y la falta de un mantenimiento técnico. Para tener 
información cuantitativa de lo mencionado anteriormente,se ha tomado una 
encuesta a una muestra de 30 choferes de la ruta Portada del Sol-Santa Anita 
(Línea P) encontrándose los siguientes resultados: 
 El número promedio de veces que los choferes realizan una revisión técnica a sus 
vehículos es 1.36 veces al año. 
 La ganancia promedio por día es de 97.73 nuevos soles 
 20 choferes poseen un grado de instrucción secundario, 5 choferes poseen 
primaria completa, 5 choferes poseen nivel universitario. 
 
6. La microempresa “Milglen”, fabrica yogurt y va a lanzar al mercado un nuevo sabor 
de yogurt; como desea conocer la necesidad de los consumidores realiza una 
encuesta a 90 consumidores de yogurt que acuden al supermercado “Metro” de La 
Molina, encontrándose los siguientes resultados: 
 El 75% de los encuestados consume yogurt por costumbre, frente a un 20% que 
lo hace por gusto y un 5% que lo hace por dieta. 
 El 33% consume la marca “Gloria”. 
 El precio promedio que estarían dispuestos a pagar por un yogurt de 1 litro es de 
4.50 nuevos soles. 
 El 95% prefiere el yogurt con fruta frente a un 5% que lo prefiere natural. 
 
7. Con la finalidad de efectuar mejoras con los servicios al turista, se seleccionaron 
200 turistas al azar y se les aplicó una encuesta en la que se preguntó por: 
 Número de días que permanecieron en el país, obteniéndose un promedio de 8 
días. 
 Medio de transporte que utilizaron para viajar, a lo que el 20% respondió que 
viajó en avión, el 30% en tren y el 50% en bus. 
 Dinero gastado durante el tiempo de estadía, de lo que se obtuvo un promedio de 
1253.6 nuevos soles por encuestado. 
 En cuanto al servicio de alimentación el 30% lo calificó de excelente, el 20% muy 
bueno y el 50% bueno. 
8. El Departamento de Estadística e Informática de la Universidad Nacional Agraria La 
Molina con la finalidad de contar con mayor información sobre los alumnos 
matriculados en el curso de Estadística General, aplicó una encuesta a dichos 
alumnos en la que se preguntó por: 
 Facultad a la que pertenece, a lo que el 35% respondió pertenecer a Agronomía. 
 Número de veces que ha llevado el curso. 
 Promedio ponderado, obteniéndose un promedio para todos los alumnos de 
12.10. 
 Expectativa sobre la dificultad del curso (muy fácil, fácil, difícil, muy difícil). 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 12 
Preguntas de Autoevaluación 
 
1. Las medidas estadísticas calculadas con los datos de una población se llaman 
___________________ y las calculadas con los datos de una muestra 
___________________________. 
2. La parte de la estadística que permite la estimación y prueba de hipótesis de los 
parámetros se llama ____________________ y el cálculo de medidas estadística se 
denomina ___________________. 
3. El valor posible que toma una variable de denomina _____________________. 
4. Una ONG que brinda asistencia técnica a productores de truchas en el valle de 
Huancayo ha aplicado una encuesta para establecer una línea de base en tres zonas 
(A, B y C). Los resultados obtenidos indicaron que la edad promedio de los 
productores es de 35.8 años; el peso promedio de las truchas en la zona A, B y C 
son 1.2, 1.8 y 1.6 kgrs. respectivamente. Entonces las variables son 
_______________________________________________________________. 
5. Si el ganadero Juan Pérez, desea registrar el número diario de litros de leche 
producidas, entonces la unidad elemental es ____________________. 
6. Si se han definido cuatro rangos de las edades de una muestra de 100 agricultores: 
de 18 a 25, de 26 a 40, de 41 a 60 y de 61 a más años, entonces la variable rango 
de edades es del tipo ______________________________________. 
7. Para un estudio sobre la contaminación de un reservorio de agua, se extraen 400 
muestras de dos litros de agua y se halló que el número promedio de bacterias fue 
de 10.5. Entonces: 
Población: __________________________________________. 
Unidad elemental: ____________________________________. 
Variable: ___________________________________________. 
8. En la ENAHO (Encuesta Nacional de Hogares) del 2011, respecto al material 
predominante en las viviendas, el 65% es de material noble, el 20% de calamina, el 
10% de esteras y 5% otros. La variable en estudio es de tipo _________________. 
9. Si un establecimiento de salud del MINSA registra trimestralmente el número de 
niños atendidos menores a 5 años, entonces la unidad elemental es __________ y 
la variable es del tipo _______________________. 
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados: 
 
Item Enunciado V/F 
a. La población y una muestra extraída de ella pueden tener diferentes 
unidades elementales 
 
b. Las medidas estadísticas que se pueden calcular con los datos de un 
censo son parámetros y valores estadísticos. 
 
c. Las poblaciones pueden ser finitas e infinitas 
d. Una condición para que una muestra sea representativa de una 
población es que sea aleatoria. 
 
e. Los valores de las variables sólo pueden ser obtenidos de las unidades 
elementales de una población. 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 13 
CAPÍTULO II 
 
ORGANIZACIÓN DE DATOS 
 
La organización de datos consiste en la elaboración de tablas de frecuencias y gráficos 
con la finalidad de clasificar, agrupar y presentar la información en forma resumida, 
facilitando el análisis descriptivo de los conjuntos de datos. La elaboración de una tabla 
de frecuencia y su gráfico respectivo dependerá del tipo de variable definida. 
 
Objetivo. Aplicar en forma adecuada los procedimientos de la estadística descriptiva 
para tabular, clasificar, analizar, graficar y presentar información según sea la variable 
cualitativa o cuantitativa. 
 
2.1 Organización para variables cualitativas (nominal o jerárquica) 
 
La tabla de frecuencia es organizada por clases o categorías que corresponden a los 
distintos valores (atributos) que toma la variable cualitativa. 
 
Tabla de frecuencias 
 
N° de clase Clase o 
categoría 
Frecuencia 
Absoluta 
(fi) 
Frecuencia 
Relativa 
(fri) 
Frecuencia 
Porcentual 
(pi) 
1 Atributo 1 f1 fr1 p1 
2 Atributo 2 f2 fr2 p2 
. 
. 
. 
 
K Atributo k fk frk pk 
Total n 1 100 
 
Donde: 
k= Número de clases 
n= Número de observaciones o unidades elementales 
 
Frecuencia absoluta (fi). Es el número de observaciones que existen en la clase o 
categoría i. Se cumple: nf
k
i
i 
1
 
Frecuencia relativa (fri). Es la proporción de observaciones con respecto al total (n) 
que existen en la clase o categoría i. Se calcula: 
n
f
fr ii  . Se cumple: 1
1


k
i
ifr . 
Frecuencia porcentual (pi). Es el porcentaje de observaciones con respecto al total 
(n) que existen en la clase o categoría i. Se tiene: 100i ip fr  . Se cumple: 
%100
1


k
i
ip 
 
Tipo de gráficos 
 
Se pueden usar las frecuencias absolutas (fi), relativas (fri) o porcentuales (pi) para 
elaborar dos tipos de gráficos: 
 
 Gráfico de barras vertical u horizontal 
 Gráfico circular 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 14 
Ejemplo 1 
Se hizo una encuesta a una muestra de 45 clientes del Banco Comercial y se obtuvo los 
siguientes resultados: 
 
Caso Edad 
Ingreso 
Mensual 
(miles de S/.) 
Nº de 
viajes 
(mensual) 
Tarjeta 
de 
crédito 
usada 
Lugar de uso de 
tarjeta de crédito 
Monto de 
deuda 
(miles de S/.) 
Sexo 
1 29 3.00 3 Ta1 centros comerciales 1.80 F 
2 34 1.99 3 Ta2 discotecas 1.10 F 
3 61 2.90 2 Ta3 restaurantes 0.60 M 
4 28 4.70 0 Ta2 grifos 2.70 M 
5 41 3.00 1 Ta4 centros comerciales 1.30 F 
6 57 5.80 2 Ta1 otros 0.80 F 
7 30 4.50 4 Ta4 grifos 0.64 M 
8 43 7.09 0 Ta3 centro de estudios 0.90 F 
9 45 4.40 1 Ta5 centros comerciales 1.40 M 
10 35 6.82 0 Ta2 grifos 2.46 F 
11 425.30 3 Ta1 restaurantes 1.10 F 
12 28 5.80 2 Ta4 discotecas 0.20 M 
13 28 5.70 1 Ta2 grifos 0.80 F 
14 24 4.70 4 Ta4 restaurantes 0.50 M 
15 35 6.60 1 Ta5 discotecas 0.40 F 
16 42 6.60 2 Ta4 restaurantes 3.46 F 
17 48 5.74 1 Ta1 discotecas 1.20 M 
18 34 4.23 0 Ta5 centros comerciales 1.90 F 
19 66 5.50 3 Ta1 restaurantes 2.35 M 
20 36 6.60 1 Ta4 centros comerciales 1.90 F 
21 59 3.85 1 Ta4 restaurantes 0.30 M 
22 37 6.70 3 Ta6 centros comerciales 0.70 F 
23 53 3.50 0 Ta5 restaurantes 0.67 F 
24 35 8.80 1 Ta1 discotecas 0.50 F 
25 63 10.00 4 Ta5 restaurantes 1.50 M 
26 28 10.10 2 Ta1 centro de estudios 0.70 F 
27 43 13.40 2 Ta2 discotecas 1.50 F 
28 60 3.90 0 Ta5 otros 1.99 M 
29 59 5.84 1 Ta5 restaurantes 0.60 M 
30 63 3.50 1 Ta4 grifos 1.50 M 
31 55 4.40 2 Ta2 centro de estudios 0.40 M 
32 42 3.70 0 Ta5 centros comerciales 1.80 F 
33 51 4.50 1 Ta1 otros 0.70 M 
34 39 5.63 1 Ta1 otros 0.80 M 
35 55 4.60 4 Ta1 discotecas 1.25 M 
36 35 5.79 0 Ta5 discotecas 1.60 M 
37 42 2.93 3 Ta5 grifos 0.20 M 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 15 
Caso Edad 
Ingreso 
Mensual 
(miles de S/.) 
Nº de 
viajes 
(mensual) 
Tarjeta 
de 
crédito 
usada 
Lugar de uso de 
tarjeta de crédito 
Monto de 
deuda 
(miles de S/.) 
Sexo 
38 36 6.60 1 Ta3 grifos 4.37 F 
39 49 4.60 0 Ta3 centros comerciales 2.00 M 
40 27 6.60 0 Ta4 grifos 0.90 F 
41 36 2.90 4 Ta1 discotecas 0.47 M 
42 42 4.69 2 Ta2 centros comerciales 0.80 F 
43 25 3.99 1 Ta4 restaurantes 4.32 F 
44 32 6.70 2 Ta1 centros comerciales 0.60 M 
45 28 2.58 1 Ta4 otros 1.70 M 
 
Organización de datos cualitativos 
 
Organicemos las observaciones de la variable tarjeta de crédito usada. 
 
Tabla de frecuencias del tipo de tarjeta de crédito usada 
 
N° de clase 
Tarjeta de 
crédito usada 
Frecuencia 
Absoluta 
fi 
Frecuencia 
Relativa 
fri 
Frecuencia 
Porcentual 
pi 
1 Ta1 12 0.2667 26.67 
2 Ta2 7 0.1556 15.56 
3 Ta3 4 0.0889 8.89 
4 Ta4 11 0.2444 24.44 
5 Ta5 10 0.2222 22.22 
6 Ta6 1 0.0222 2.22 
Total 45 1.0000 100.00 
Fuente: Elaboración propia 
 
f3 = 4 indica que 4 de los clientes del Banco Comercial utilizan la tarjeta de 
crédito Ta3 
fr1 = 0.2667 indica la proporción de clientes del Banco Comercial que utilizan la tarjeta 
de crédito Ta1. 
p2 = 15.56 indica que el 15.56% de clientes del Banco Comercial utilizan la tarjeta 
de crédito Ta2. 
 
Gráfico de barras de frecuencia porcentual 
 
Tarjeta de crédito
%
Ta6Ta5Ta4Ta3Ta2Ta1
30
25
20
15
10
5
0
Tarjetas de crédito usada
 
 Fuente: Elaboración propia 
 
En el gráfico de barras, se aprecia que la tarjeta Ta1 es la de uso más frecuente. 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 16 
Gráfico Circular 
 
1, 2.2%
Ta6
10, 22.2%
Ta5
11, 24.4%
Ta4
4, 8.9%
Ta3
7, 15.6%
Ta2
12, 26.7%
Ta1
Category
Ta5
Ta6
Ta1
Ta2
Ta3
Ta4
Tarjetas de crédito usada
 
 Fuente: Elaboración propia 
 
En el gráfico circular, se aprecia que la tarjeta de crédito Ta6 es la de uso menos 
frecuente. 
 
Ejercicio 1. Se ha realizado una encuesta para evaluar el grado de satisfacción de 
cuatro planes de seguro familiar (A, B, C y D). Los resultados para una muestra de 40 
clientes que adquirieron el seguro familiar en los dos últimos años se muestra en la 
siguiente tabla. 
 
A Bueno A Regular A Malo D Regular C Bueno 
A Malo A Malo A Malo C Malo B Bueno 
B Regular D Regular D Regular B Regular D Regular 
C Regular C Bueno B Regular C Malo C Bueno 
B Malo B Bueno C Malo B Regular C Malo 
D Malo C Malo B Regular D Bueno A Bueno 
A Regular B Regular D Bueno A Bueno C Malo 
D Regular B Malo B Bueno D Malo B Regular 
 
a. Elabore una tabla de frecuencias y un gráfico de barras de frecuencias absolutas para 
la variable plan de seguro familiar. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 17 
b. Elabore una tabla de frecuencias y un gráfico circular de frecuencias porcentual para 
la variable grado de satisfacción del plan de seguro familiar. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Tabulaciones cruzadas 
 
También llamadas tablas de contingencia o de doble entrada. Se usan para resumir y 
presentar de manera simultánea los datos para dos variables cualitativas. 
 
Ejercicio 2. En el 2010 el Instituto Nacional de Estadística e Informática (INEI) en 
convenio con la Asamblea Nacional de Rectores (ANR) realizó el II Censo Nacional 
Universitario. A continuación se presentan los resultados de dos características 
generales. 
 
Distribución de los alumnos de pre-grado según el sexo y edad 
 
Sexo 
Edad 
Total De 15 a 
20 años 
De 21 a 
25 años 
De 26 a 
30 años 
De 31 a 
35 años 
De 36 a 
40 años 
Más de 
40 años 
Masculino 126214 169306 60006 21465 10651 12503 400145 
 Femenino 150859 159091 42243 15313 7333 7986 382825 
 Total 277073 328397 102249 36778 17984 20489 782970 
Fuente: PERÚ, II Censo Nacional Universitario 2010 
 
 Las variables utilizadas esta tabla de contingencia son: ______________________ 
___________________________________________________________________ 
 El total de alumnos de pre-grado del sexo masculino es ______________________ 
 El total de alumnos de pre-grado de 31 a 35 años es _________________________ 
 El % de los alumnos de pre-grado del sexo masculino que tienen 26 a 30 años es 
___________________ 
 El % de alumnos de pre-grado de 21 a 25 años que son del sexo femenino es 
___________________ 
 El % de alumnos de pre-grado de 26 a 30 años y que son del sexo femenino es 
___________________ 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 18 
2.2 Organización para variables cuantitativas discretas 
 
La tabla de frecuencia es organizada por clases o categorías que corresponden a los 
distintos valores (números) que toma la variable cuantitativa discreta. Se usa cuando el 
conjunto de valores posible de la variable cuantitativa discreta es pequeño. 
 
Tabla de frecuencias 
 
N° de clase Valor de la 
variable 
Frecuencia 
Absoluta 
(fi) 
Frecuencia 
Relativa 
 (fri) 
Frecuencia 
Porcentual 
(pi) 
1 x1 f1 fr1 p1 
2 x2 f2 fr2 p2 
. 
. 
. 
 
k xk fk frk pk 
Total n 1 100 
 
Tipo de gráfico. Se elabora el gráfico de bastones o varas con las frecuencias 
absolutas, relativas o porcentual. 
 
Ejemplo 2. Organización de datos cuantitativos discretos 
Organicemos las observaciones de la variable número de viajes al mes de los clientes. 
 
Tabla de frecuencias del número de viajes al mes 
 
N° de viajes al 
mes 
Frecuencia 
Absoluta 
No de clientes 
fi 
Frecuencia 
Relativa 
fri 
Frecuencia 
Porcentual 
pi 
0 10 0.2222 22.22 
1 15 0.3333 33.33 
2 9 0.2000 20.00 
3 6 0.1333 13.33 
4 5 0.1111 11.11 
Total 45 1.0000* 100.00* 
 Fuente: Elaboración propia 
 
Interprete: 
f2 = 15 Existen 15 clientes del Banco Comercial que hacen un viaje al mes. 
p1 = 22.22 El 22.22% de los clientes no han realizado viajes. 
 
Gráfico de bastones o varas de frecuncia porcentual 
 
Viajes
%
43210
35
30
25
20
15
10
5
0
Viajes al mes
 
 Fuente:Elaboración propia 
En el gráfico de varas, se aprecia que en la variable número de viajes al mes, el número 
1 (un viaje al mes) es el más frecuente. 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 19 
Ejercicio 3. En una estación experimental se ha determinado el número de larvas de 
insectos encontrados en 40 parcelas, en un cultivo de frijol. Los datos se muestran a 
continuación: 
 
1 3 3 5 6 6 9 9 10 10 
1 3 5 5 6 3 9 10 3 1 
10 3 5 5 6 5 9 10 1 1 
3 3 5 6 6 5 9 5 3 1 
 
a. Elabore una tabla de frecuencias y su respectivo gráfico de bastones. 
 
 
 
 
 
 
 
 
 
 
 
 
 
b. Interprete f3 y p3 
 
 
 
 
 
c. ¿Qué número y porcentaje de parcelas muestran al menos 6 larvas? 
 
 
 
 
2.3 Organización para variables cuantitativas continuas 
 
El conjunto de datos es agrupado por intervalos de clase que conforman las clases o 
categorías de la tabla de frecuencias. 
 
Tabla de frecuencias 
N° de 
clases 
Intervalos 
 de clase 
 
[LI-LS> 
Marca 
de 
clase 
'
ix 
Frec. 
Absoluta 
 
fi 
Frec. 
Relativa 
 
fri 
Frec. 
Porc. 
 
pi 
Frec. 
Acumulada 
Absoluta 
Fi 
Frec. 
Acumulada 
Relativa 
Fri 
Frec. 
Acum. 
Porc. 
Pi 
1 [LI1-LS1> x’1 f1 fr1 p1 F1 Fr1 P1 
2 [LI2-LS2> x’2 f2 fr2 p2 F2 Fr2 P2 
. 
. 
. 
 
k [LIk-LSk] x’k fK frK pk FK FrK Pk 
Total N 1 100 1 100 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 20 
Donde: 
 
LIi = Límite inferior de la clase i (Límite cerrado) 
LSi= Límite superior de la clase i (Límite abierto, salvo la última clase que es cerrado) 
 
Marcas de Clase (
'
iX ). Es el punto medio del intervalo de clase. Se considerada como 
el valor representativo de los valores que pertenecen al intervalo de clase. 
Se calcula: TICXXo
LSLI
X ii
ii
i 

 
'
1
''
2
, donde TIC es el tamaño del intervalo 
de clase 
 
Frecuencia Porcentual (pi). Indica el porcentaje de observaciones o unidades 
elementales que hay en la clase i. Se cumple: 
1
100%
k
i
i
p

 
 
Frecuencia Acumulada Absoluta (Fi). Indica el número de observaciones o unidades 
elementales que hay desde la primera clase hasta la clase i. Se calcula por: 
1 2
1
...
k
k i k
i
F f f f f

     . 
 
Frecuencia Acumulada Relativa (Fri). Indica la proporción de observaciones o 
unidades elementales que hay desde la primera clase hasta la clase i. Se calcula por: 





i
j
j
i
j
j
fr
n
f
n
Fi
Fri
1
1
 
Frecuencia Acumulada Porcentual (Pi). Indica el porcentaje de observaciones o 
unidades elementales que hay desde la primera clase hasta la clase i. 
 
 
Pasos para la construcción de una tabla de frecuencias: 
 
Paso 1. Hallar el rango o amplitud (r). MínimoMáximor  
 
Paso 2. Hallar el número de intervalos de clase (k). Se aplica la regla de Sturges: 
)log(3.31 nk  . Eligiendo un valor: 3 ≤ k ≤ 15 
 
 Se aplica el redondeo normal a entero. 
Si el primer dígito decimal: es  5, se redondea al entero inmediato 
superior y si es < 5, se considera el entero obtenido. 
Paso 3. Hallar el tamaño de Intervalo de Clase (TIC). 
k
r
TIC  
 El número de decimales debe ser igual al de las observaciones. 
 Se aplica el redondeo por exceso. Si la posición del decimal es  1, se 
redondea al valor inmediato superior, de lo contrario no se redondea. 
 
Paso 4. Hallar los límites inferiores y superiores de cada intervalo de clase. 
 
LI1 = Mínimo LS1= LI1 + TIC 
LI2 = LI1 + TIC = LS1 LS2= LI2 + TIC 
LI3 = LI2 + TIC = LS2 LS3= LI3 + TIC 
. . . 
LIk = LIk-1 + TIC = LSk-1 LSk= LIk + TIC 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 21 
Paso 5. Realizar el conteo del conjunto de datos, como el resultado de asignar cada 
observación a alguno de los intervalos de clase. Luego completar la tabla hallando x’i , fi , 
fri , Fi , Fri . 
 
Tipos de gráficos 
 Histograma. Se usan las frecuencias absolutas o relativas en el eje vertical y los 
intervalos de clase en el eje horizontal. 
 Polígono. Se usan las frecuencias absolutas o relativas en el eje vertical y las 
marcas de clase en el eje horizontal. 
 
Ejemplo 3. Organización de datos cuantitativos continuos 
 
Organicemos las observaciones de la variable ingreso mensual de los clientes (en miles 
de nuevos soles). 
 
Paso 1. Calcule el rango ( R ). R = xmax - xmin 
En el ejemplo R = 13.40 – 1.99 = 11.41 
 
Paso 2. Determine el número de intervalos de clase ( k ). Utilice la regla de 
Sturges 
k = 1 + 3.3 log n = 1 + 3.3 log 45 = 6.4556 
 
Redondeo estadístico: Se toma en consideración el primer valor decimal, si es: 
 
 5 se redondea al entero inmediato superior 
< 5 se considera el entero obtenido 
 
En nuestro ejemplo, k = 6.4556, estamos en el segundo caso, por lo que el número 
de clases que se debe considerar es k = 6. 
 
Paso 3. Halle el tamaño de los intervalos de clase (TIC) 
11.41
1.90167
6
R
TIC
k
   
 
Redondeo por exceso: se toma en consideración el número mayor de decimales que 
tienen las observaciones. Considerando la posición de este decimal, se presentan 2 
casos: 
 
 Si existe alguna cifra significativa a la derecha de este valor, se redondea al 
valor inmediato superior 
 Si no existe ninguna cifra significativa a la derecha de este valor, entonces no se 
realiza ningún redondeo 
 
1.90167TIC  
 
Como las observaciones tienen 2 decimales en el TIC también se considerará con 2 
decimales y como hay al menos un valor diferente de cero a la derecha de las 
centésimas se incrementa en una centésima quedando TIC = 1.91 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 22 
Paso 4. Construya la tabla de frecuencias. 
Tener en cuenta que en la última clase el intervalo es cerrado en el lado derecho. 
Tabla de frecuencias del ingreso mensual 
 
 
N° de 
clases 
 
Ingreso 
mensual 
[LI-LS> 
 
Marca 
de 
clase 
'
ix 
Frec
. 
Abs. 
 
fi 
Frec. 
Rel. 
 
fri 
Frec. 
Porc. 
 
pi 
Frec. 
Acum. 
Abs. 
Fi 
Frec. 
Acum. 
Rel. 
Fri 
Frec. 
Acum. 
Porc. 
Pi 
1 [1.99 - 3.90> 2.945 11 0.2444 24.44 11 0.2444 24.44 
2 [3.90 - 5.81> 4.855 20 0.4444 44.44 31 0.6888 68.88 
3 [5.81 - 7.72> 6.765 10 0.2222 22.22 41 0.9110 91.10 
4 [7.72 - 9.63> 8.675 1 0.0222 2.22 42 0.9332 93.32 
5 [9.63 -11.54> 10.585 2 0.0444 4.44 44 0.9776 97.76 
6 [11.54-13.45] 12.495 1 0.0222 2.22 45 1.000 100 
 45 1.0000 100 
 Fuente: Elaboración propia 
 
Interprete: 
 f2 = 20; 20 de los clientes tienen un ingreso mensual de por lo menos S/. 
3900 pero menos de S/. 5810. 
 
 fr4 = 0.0222; 0.0222 es la proporción de clientes que ganan por lo menos 
S/. 7720 pero menos de S/. 9630 
 
 p5 = 4.44; 4.44% de los clientes ganan por lo menos S/. 9630 pero menos de 
S/. 11540. 
 
 
3
3 i 1 2 3
i 1
F f f f f 11 20 10 41

        41 de los clientes ganan mensualmente por 
lo menos S/. 1990 pero menos de S/. 7720 
 
 F5 – F2 = 44 – 31 =13 
F5 – F2 = 
5
3 4 5
3
10 1 2 13i
i
f f f f

       13 de los clientes ganan por lo menos 
S/. 5810 pero menos de S/. 11540 
 
4
4 i 1 2 3 4
i 1
Fr fr fr fr fr fr 0.2444 0.4444 0.2222 0.0222 0.9332

          , indica 
que 0.9332 es la proporción de clientes que ganan por lo menos S/. 1990 pero 
menos de S/. 9630. 
 
 Fr5 – Fr3 =0.9776 – 0.9110 = 0.0666 
Fr5 – Fr3 = 
5
4 5
4
0.0222 0.0444 0.0666i
i
fr fr fr

     , indica que 0.0666 es la 
proporción de los clientes que ganan por lo menos S/.7720 pero menos de 
S/.11540. 
 
 
3
3 i 1 2 3
i 1
P p 24.44 44.44 22.22 91.10p p p

        , indica que el 91.10% de los 
clientes tienen ingresos mensuales de por lo menos S/.1990 pero menos de 
S/.7720 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 23 
 P5 – P2 = 97.76 – 68.88 = 28.88 
P5 – P2 = 
5
3 4 5
3
22.22 2.22 4.44 28.88i
i
p p p p

       , indica que el 28.88% de 
los clientes de ese banco tienen ingresos mensuales por lo menos S/. 5810 pero 
menos de S/. 11540. 
 
 
'
3 6.765x  es el valor representativo de los clientes que ganan por lo menos 
S/.5810 pero menos de S/.7720. Las diez observaciones (f3 = 10) que hay en la 
clase 3 son representadas por el valor S/. 6765. 
 
 
Histograma de frecuencias porcentuales 
 
Ingreso
%
13.4511.549.637.725.813.901.99
50
40
30
20
10
0
Ingreso Mensual
 
 Fuente: Elaboración propia 
 
En el histograma se puede apreciar que la clase más frecuente es la segunda esto 
indica que los ingresos más frecuentes son de por lo menos S/. 3900 pero menores a 
S/. 5810. 
 
 
Polígono de frecuencias absolutas 
 
Ingreso Mensual 
 
 Fuente: Elaboración propia 
 
En el polígono de frecuencias se observa que son pocos los clientes con ingresos 
mensuales altos. 
 
 
Series1, 1.035, 0
Series1, 2.945, 11
Series1, 4.855, 20
Series1, 6.765, 10
Series1, 8.675, 1Series1, 10.585, 2Series1, 12.495, 1Series1, 14.405, 0
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 24 
Ejercicio 4. Con la finalidad de evaluar la viabilidad de un proyecto de reforestación de 
una zona sometida a estrés turístico, para el que se ha solicitado una subvención 
pública, se ha tomado muestras sobre la composición en mg/cm3 de desechos 
orgánicos en el suelo. Los datos obtenidos fueron: 
 
Composición de desechos orgánicos (mg/cm3) 
8.2 12.9 15.3 18.8 20.8 
9.2 12.9 15.8 19.7 21.0 
9.4 14.0 15.9 20.3 21.4 
10.8 14.2 16.9 20.3 22.2 
10.8 14.4 18.2 20.3 22.5 
11.1 15.1 18.4 20.2 23.2 
11.2 15.1 18.6 20.7 25.8 
 
a. Construir la tabla de frecuencias usando la regla de Sturges. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b. A partir de la tabla de frecuencias interprete: f3, fr3, p3, F4 , Fr4, P4 
 
 
 
 
 
 
 
 
c. ¿Entre qué niveles de composición se encuentra aproximadamente el 51.4% de las 
observaciones con menores niveles registrados? 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 25 
Ejercicio 5. La gerencia de marketing del Supermercado ABC desea realizar un estudio 
con la finalidad de evaluar la satisfacción de sus clientes. Para el estudio se selecciona 
aleatoriamente a 40 clientes que acudieron al supermercado en un día y se registró los 
siguientes datos. 
 
N° Tipo 
pago 
Estado de 
los 
productos 
Número de 
compras 
semanal 
Monto 
(nuevos
soles) 
N° Tipo 
pago 
Estado de 
los 
productos 
Número de 
compras 
semanal 
Monto 
(nuevos
soles) 
1 1 2 2 200.5 21 3 4 2 350.5 
2 2 2 4 200.3 22 3 2 4 250.3 
3 2 1 1 136.0 23 3 4 5 180.4 
4 2 2 2 150.2 24 2 3 1 320.8 
5 2 2 3 300.6 25 2 1 2 150.6 
6 1 1 2 320.8 26 3 4 3 190.8 
7 3 2 2 310.8 27 1 3 2 240.5 
8 3 1 4 229.2 28 2 1 3 275.8 
9 1 2 3 180.5 29 3 2 3 130.8 
10 2 3 5 110.6 30 3 3 1 180.2 
11 3 1 1 140.8 31 2 4 4 315.4 
12 1 3 3 368.6 32 1 2 2 290.6 
13 2 2 2 160.2 33 2 3 2 265.8 
14 3 1 3 180.9 34 3 4 1 360.8 
15 3 2 1 190.5 35 1 1 3 260.2 
16 2 3 2 210.4 36 2 2 3 140.5 
17 3 2 3 89.4 37 1 3 2 180.2 
18 1 3 3 110.6 38 3 4 3 220.5 
19 2 1 4 100.5 39 3 1 2 345.8 
20 1 1 1 120.3 40 3 2 3 95.4 
Considerar: Tipo de pago: 1=Contado 2=Tarjeta de crédito 3=Crédito ABC 
Estado de los productos: 1=Muy bueno 2=Bueno 3=Regular 4=Malo 
a. Elabore una tabla de frecuencias y un gráfico de barras de frecuencia relativa de la 
variable tipo de pago. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 26 
b. Elabore la tabla de frecuencias para la variable número de compras semanal. 
Elabore el respectivo gráfico de varas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
c. Elabore la tabla de frecuencias usando la regla de Sturges para la variable monto 
semanal. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
d. Interprete f4, F5-F2, 1- Fr4 , 100-P2 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 27 
e. Elabore el respectivo histograma y polígono de frecuencias. 
 
 
 
 
 
 
 
 
 
 
 
 
Ejercicio 6. Se ha recolectado información de 20 sacos de papa tomados al azar, 
cosechados para un trabajo experimental. Se muestra a continuación el número de 
papas que están comenzando descomponerse por saco y las variedades de papas 
cosechadas. 
Número de papas 
descomponiéndose 
 
 
Variedades de papa cosechadas 
8 12 
 
 Variedad de papa 
Fuente: Estudio Experimental. 
8 12 
8 12 
9 16 
9 16 
9 16 
12 16 
12 17 
12 17 
12 18 
 
 
a. Elabore una tabla de frecuencias para la variable cuantitativa.b. Elabore un cuadro que resuma la información de la variable cualitativa. 
 
 
 
 
 
 
 
0
2
4
6
8
10
Serie1 3 5 9 2 1
amarilla negra blanca tomasa serrana
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 28 
Práctica Dirigida N° 1 
 
1. Una fábrica textil para su próxima campaña de verano debe decidir la fabricación de 
tres tipos de diseños de polos (D1, D2 y D3). Para apoyar su decisión la gerencia 
de producción realizó un estudio extrayendo una muestra aleatoria de 60 clientes 
potenciales, registrándose los siguientes resultados: 
 El 45.5% de los clientes prefieren el diseño D1, el 35.5% el D2 y el resto el 
diseño D3. 
 El 55% tienen la talla S, el 25% M y el resto L. 
 El número promedios de polos que comprarían es de 1.8 
 El precio promedio que pagarían es de S/. 45.5 
 La edad promedio es de 35.8 años 
 
a) De acuerdo al enunciado identifique la población de estudio, unidad elemental y 
muestra. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b) Identifique las variables, tipos, observación, estadístico o parámetro. 
 
Variable Tipo de 
Variable 
Observación Estadístico Parámetro 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 29 
2. El ministerio de la Producción está realizando un estudio sobre las embarcaciones 
de pesca de la zona norte el país y que abastecen a los mercados locales. Para el 
análisis seleccionó una muestra aleatoria de 30 embarcaciones en el último mes y 
se registra la producción de pesca (en decenas de kgs), el tipo de embarcación y el 
número de días de pesca. Los datos se presentan en la siguiente tabla: 
Producción 
Tipo de 
paquete 
Número de 
días de 
pesca 
 
Producción 
Tipo de 
paquete 
Número de 
días de 
pesca 
22.0 T1 4 39.8 T1 3 
23.7 T1 2 40.0 T2 2 
24.6 T2 2 40.3 T3 2 
24.8 T2 4 40.6 T3 4 
25.0 T3 2 42.8 T3 5 
26.4 T3 4 43.0 T4 6 
26.6 T4 6 44.1 T4 5 
27.5 T3 6 44.5 T4 4 
29.9 T2 2 44.8 T2 3 
31.1 T1 4 45.6 T2 4 
32.5 T2 3 46.0 T3 3 
34.8 T3 5 46.4 T1 2 
35.0 T2 6 48.0 T2 6 
38.4 T4 3 52.0 T1 3 
38.5 T4 3 54.0 T1 5 
39.1 T3 4 56.0 T2 6 
 
a) Con respecto a la información proporcionada, identifique la población, unidad 
elemental y muestra. 
 
 
 
 
 
 
 
 
 
 
b) Elabore una tabla de frecuencias sobre el tipo de embarcación y un gráfico de 
barras de frecuencias porcentuales. 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 30 
c) Elabore la tabla de frecuencias para la producción de pesca. Use la regla de 
Sturges. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
d) Interprete f4, p4, F5, y 100-P5. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 31 
e) Elabore el respectivo histograma de frecuencias porcentuales. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
f) Elabore la tabla de frecuencias para la variable número de días de pesca y su 
gráfico respectivo. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 32 
EJERCICIOS PROPUESTOS 
 
1. En Marzo del 2009 la empresa de investigación de mercados “CONTHEOS”, fue 
contratada por el banco “Nuevo Horizonte” para que realice un estudio sobre la 
aceptación de los créditos anuales que ofrecen a sus clientes en sus sucursales de 
los distritos de La Molina y Surco. La empresa “CONTHEOS” después de hacer un 
estudio de las características de los clientes activos del banco, seleccionó una 
muestra de 36 clientes de la sucursal de La Molina, y recolectó de ellas información 
para un conjunto de variables seleccionadas para tal fin. Los resultados se muestran 
a continuación: 
 
Nº 
Cliente 
Tipo de 
crédito 
Nº de 
solicitudes 
Monto de crédito. 
(miles de soles) 
Tipo de 
cliente 
1 1 1 30.0 2 
2 2 2 35.3 3 
3 3 1 48.4 2 
4 1 2 50.1 2 
5 2 1 55.3 3 
6 4 2 57.2 2 
7 5 1 58.1 1 
8 3 1 60.4 3 
9 5 2 65.3 3 
10 4 1 66.0 2 
11 3 3 68.0 2 
12 4 1 69.1 2 
13 2 3 70.2 3 
14 5 3 72.5 2 
15 4 1 73.1 3 
16 2 4 75.3 3 
17 3 4 77.2 3 
18 4 1 79.1 3 
19 4 3 82.7 2 
20 5 7 84.3 3 
21 3 1 86.0 1 
22 4 5 90.3 1 
23 1 6 95.2 2 
24 3 1 100.1 3 
25 4 2 101.2 3 
26 1 4 102.2 1 
27 3 1 102.2 3 
28 4 2 104.3 2 
29 1 4 110.1 2 
30 3 1 115.3 3 
31 4 3 118.4 2 
32 1 2 119.1 1 
33 3 1 125.1 3 
34 1 3 128.0 2 
35 1 1 130.2 2 
36 2 2 140.0 3Tipo de Crédito: (1) Inversión en negocio, (2) Compra de inmuebles, 
(3) Compra de maquinarias, (4) Inversión en bolsa de valores 
(5) Compra de autos. 
Tipo de cliente: (1) Casado (a), (2) Soltero (a), (3) Divorciado(a) 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 33 
a) Elabore una gráfica adecuada para la variable cualitativa. 
b) Haciendo uso de la regla de Sturges construya un cuadro de distribución de 
frecuencias para la variable Monto de crédito (miles de soles). 
c) Interprete según enunciado los valores de f2, p3, F4, P5 y (p5+p6). 
d) Construya el polígono de frecuencias para la variable Monto de crédito. 
e) Construya un cuadro de distribución de frecuencias para la variable cuantitativa 
discreta. 
 
 
2. La siguiente información se tomó de los registros del Hospital Centro de Salud 
Materno Infantil San Bartolomé. Sección Maternidad entre el 18 y el 22 de Mayo 
del 2012. 
 
 Madre Hijo 
Caso Edad Estado Civil No de partos Peso Sexo 
1 25 conv 2 2.90 F 
2 22 conv 2 2.90 F 
3 32 conv 4 4.04 M 
4 22 conv 1 4.35 F 
5 18 casada 1 3.60 M 
6 21 casada 3 3.50 M 
7 20 soltera 2 3.20 M 
8 19 casada 1 3.00 F 
9 23 casada 3 3.60 M 
10 26 casada 2 2.80 M 
11 36 casada 5 3.00 M 
12 30 conv 5 3.30 F 
13 23 soltera 3 3.10 F 
14 29 conv 4 3.30 F 
15 22 conv 2 3.30 F 
16 23 casada 1 3.50 F 
17 27 conv 2 3.62 M 
18 28 conv 3 3.30 F 
19 19 conv 1 2.65 F 
20 32 casada 2 2.86 F 
21 17 conv 1 2.62 M 
22 21 conv 2 3.56 F 
23 18 casada 2 3.10 M 
24 27 conv 3 3.62 F 
25 21 casada 1 3.18 M 
26 19 casada 1 2.95 M 
27 19 conv 2 3.90 M 
28 31 casada 3 3.00 F 
29 32 casada 4 4.00 F 
30 21 conv 2 3.85 M 
31 23 casada 2 2.75 F 
32 19 casada 1 3.18 F 
33 19 conv 1 3.14 F 
34 26 conv 3 3.08 F 
35 18 casada 1 2.80 F 
36 24 casada 2 3.40 M 
37 30 casada 3 3.00 F 
38 26 casada 3 3.05 F 
39 19 casada 1 2.90 F 
40 34 casada 3 3.10 F 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 34 
 Madre Hijo 
Caso Edad Estado Civil No de partos Peso Sexo 
41 28 casada 3 3.40 M 
42 24 casada 2 2.97 F 
43 26 casada 2 2.94 F 
44 22 casada 2 3.80 M 
45 34 casada 5 4.65 F 
 
a) Elabore una tabla y grafica adecuada para la variable ESTADO CIVIL. 
b) Haciendo uso de la regla de Sturges construya un cuadro de distribución de 
frecuencias para la variable PESO DEL RECIEN NACIDO. 
c) Interprete según enunciado los valores de f2, fr4, p5, F3, P3 y (P5-P2) del cuadro de 
distribución de frecuencias anterior. 
d) Construya el polígono de frecuencias para la variable PESO DEL RECIEN 
NACIDO. 
e) Construya un cuadro de distribución de frecuencias para la variable Nº DE 
PARTOS. 
 
3. Con el objeto de determinar el número de horas diarias que los alumnos de la 
facultad de ciencias se dedican a estudiar en la biblioteca de la UNALM, se llevó a 
cabo una encuesta a 49 de ellos, obteniéndose los siguientes resultados expresados 
en horas: 
 
1.2 1.8 2.3 2.6 3.0 3.1 3.6 
1.2 1.8 2.3 2.7 3.0 3.1 3.6 
1.3 2.3 2.3 2.7 3.0 3.1 3.6 
1.3 2.3 2.4 2.8 3.0 3.4 4.0 
1.5 2.3 2.4 2.8 3.1 3.4 4.1 
1.8 2.3 2.6 2.8 3.1 3.4 4.5 
1.8 2.3 2.6 2.9 3.1 3.4 4.5 
 
a) Construya una tabla de frecuencia completa, usando la regla de Sturges. 
b) Interpretar la marca de clase del tercer intervalo de clase. 
c) Interpretar la frecuencia relativa del tercer intervalo de clase. 
 
4. Tomando como base la información tomada en la pregunta 3, se encuestó también 
a 35 alumnos de la facultad de Agronomía obteniéndose los siguientes resultados 
en horas: 
 
 
2 2 2.1 2.1 2.2 2.5 2.6 
2.6 2.7 2.7 3 3 3.1 3.2 
3.3 3.4 3.4 3.5 3.6 3.6 3.6 
3.8 4 4 4 4.1 4.3 4.3 
4.4 4.5 4.5 4.6 4.7 4.7 4.7 
 
Construya la tabla de frecuencias comparativa entre las dos facultades. Mencionar 
tres conclusiones importantes en términos del enunciado. 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 35 
5. Los siguientes datos corresponden a la longitud de la cabeza del feto a los 45 días 
de gestación de un total de 60 ovejas que produjeron un solo feto y de las cuales el 
día de apareamiento es conocido. Las medidas están en mm y fueron obtenidas 
con imágenes de ultrasonido: 
 
19.4 20.4 21.0 21.6 21.9 21.9 22.0 22.1 22.1 22.2 22.3 22.3 
22.6 22.7 22.7 22.7 22.8 22.9 23.0 23.1 23.2 23.2 23.4 23.6 
23.6 23.6 23.7 24.0 24.0 24.0 24.0 24.0 24.1 24.1 24.3 24.4 
24.5 24.6 24.7 24.7 24.8 24.8 25.0 25.0 25.0 25.2 25.3 25.3 
25.5 25.5 25.5 25.6 25.6 25.6 25.8 25.9 26.0 26.4 26.9 27.5 
 
a) Defina variable y unidad elemental. 
b) Construya la tabla de frecuencias. Utilice la regla de Sturges para determinar el 
número de intervalos. Presente 3 decimales para sus frecuencias relativas. 
c) Interprete fr3, Fr5, F5 – F2. 
d) Grafique el histograma de frecuencias y el polígono de frecuencias. 
 
6. Una compañía manufacturera tiene a prueba a 48 nuevos trabajadores. Para evaluar 
su rendimiento, se les asignó una tarea rutinaria y se midió el tiempo que tardaron 
en realizarla. Los tiempos en minutos son los siguientes: 
 
105 105 107 108 108 108 109 109 110 111 111 111 
113 114 114 117 118 119 121 121 123 125 126 126 
126 126 128 129 130 131 134 134 137 145 145 150 
150 152 153 154 157 157 158 164 170 171 179 183 
 
a) Construya la tabla de frecuencias. Use la regla de Sturges para determinar el 
número de intervalos. Presente 3 decimales para sus frecuencias relativas. 
b) Interprete F5 - F2, 1 - Fr4, fr5+fr6. 
 
7. Se ha llevado a cabo un estudio para evaluar los volúmenes de venta (miles de 
soles por día) de los establecimientos comerciales de un distrito de Lima. Para ello 
se eligieron al azar 36 establecimientos encontrándose los siguientes resultados: 
 
1.5 2.1 2.5 3.2 3.7 4.4 4.5 4.6 4.6 4.6 4.7 5.2 5.3 5.4 5.7 5.7 5.8 6.1 
6.4 6.7 6.7 7.2 7.4 7.4 7.7 7.8 8.4 8.4 8.5 8.7 9.1 9.8 10.1 11.7 12.1 15.4 
a) Construya la tabla de frecuencias. Use la regla de Sturges para determinar el 
número de intervalos. 
b) Interprete f4, F3, p5 
c) Graficar el histograma y el polígono de frecuencias. 
 
8. En una fábrica de pernos se desea estimar el número de pernos defectuosos por 
caja para verificar si estos valores están dentro de los límites permisibles. Se 
selecciona una muestra de 40 cajas y se obtienen los siguientes resultados: 
 
1 1 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 
4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 7 7 
 
a) Construya la tabla de frecuencias. Use la regla de Sturges para determinar el 
número de intervalos. 
b) Interprete f2, p4 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 36 
9. Un profesor decide registrar el mes de nacimiento de cada uno de los 40 estudiantes 
de su clase. 
 
junio julio noviembre abril enero febrero septiembre 
julio agosto septiembre diciembre julio junio noviembre 
mayo abril febrero agosto junio mayo octubre 
agosto noviembre enero junio abril septiembre diciembre 
agosto junio julio marzo diciembre marzo junio 
noviembre septiembre junio marzo noviembre 
 
Construya la tabla de frecuencias, elabore e interprete el diagrama de barras. 
¿Cuál es el mes que presenta la mayor y cuál la menor frecuencia de 
nacimientos? 
 
10. Un Ing. Pesquero está realizando un estudio sobre el salmón plateado con la 
finalidad de introducirlo al país. Una de las variables de interés es la longitud (en 
centímetros). El resultado luego de la evaluación a 45 peces elegidos al azar de 
esta especie se presenta a continuación: 
 
93.30 93.36 94.48 94.68 95.76 95.95 96.31 96.37 96.43 
96.53 96.58 96.60 96.61 96.80 96.86 96.93 97.29 97.40 
97.41 97.45 97.58 97.66 97.66 97.88 97.92 98.22 98.40 
98.47 98.49 98.53 98.56 98.63 98.76 98.79 99.21 99.29 
99.32 99.44 99.68 100.08 100.22 100.82 101.24 101.31 102.79 
 
a) Construya la tabla de frecuencias usando la regla de Sturges. 
b) Presenteel polígono de frecuencias. 
 
11. La empresa Nicronics S.A. se dedica a la venta de placas circulares plásticas de 
policarbonato, que importa de Alemania, Holanda y Japón. Las cantidades 
porcentuales que importa de cada país son 16%, 64% y 20% respectivamente. Las 
longitudes de los diámetros de dichas placas se expresan en pulgadas y los pesos de 
los mismos varían de 480 a 920 gramos. En los últimos tres meses, los clientes 
nacionales, le han devuelto sus productos debido a la baja resistencia encontrada, 
por ello, el área de control de calidad ha seleccionado al azar 500 placas circulares 
(en cantidades proporcionales a lo que importa de cada país) y analizado en un 
laboratorio, la resistencia a las ralladuras y a los impactos (en ambos casos la 
resistencia puede ser alta, media o baja). Si la empresa encuentra que 
efectivamente las placas no satisfacen las condiciones del cliente, se verán obligados 
a cambiar de proveedores. 
 
En base a la variable país de importación elabore un cuadro de frecuencias de la 
muestra seleccionada y su respectivo gráfico 
 
12. Una fábrica textil para su próxima campaña de verano debe decidir la fabricación de 
tres tipos de diseños de polos (D1, D2 y D3). Para apoyar su decisión la gerencia de 
producción realizó un estudio extrayendo una muestra aleatoria de 60 clientes 
potenciales, registrándose los siguientes resultados: 
 El 45.5% de los clientes prefieren el diseño D1, el 35.5% el D2 y el resto el 
diseño D3. 
 El 55% tienen la talla S, el 25% M y el resto L. 
 El número promedios de polos que comprarían es de 1.8 
 El precio promedio que pagarían es de S/. 45.5 
 La edad promedio es de 35.8 años 
 
a. De acuerdo al enunciado identifique la población de estudio, unidad elemental y 
muestra. 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 37 
b. Identifique las variables, tipos, observación, estadístico o parámetro. 
 
Variable Tipo de Variable Observación Estadístico Parámetro 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
13. El ministerio de la Producción está realizando un estudio sobre las embarcaciones de 
pesca de la zona norte el país y que abastecen a los mercados locales. Para el 
análisis seleccionó una muestra aleatoria de 32 embarcaciones en el último mes y 
se registra la producción de pesca (en decenas de kgs), el tipo de embarcación y el 
número de días de pesca. Los datos se presentan en la siguiente tabla: 
Producción 
Tipo de 
paquete 
Número de 
días de 
pesca 
 
Producción 
Tipo de 
paquete 
Número de 
días de 
pesca 
22.0 T1 4 39.8 T1 3 
23.7 T1 2 40.0 T2 2 
24.6 T2 2 40.3 T3 2 
24.8 T2 4 40.6 T3 4 
25.0 T3 2 42.8 T3 5 
26.4 T3 4 43.0 T4 6 
26.6 T4 6 44.1 T4 5 
27.5 T3 6 44.5 T4 4 
29.9 T2 2 44.8 T2 3 
31.1 T1 4 45.6 T2 4 
32.5 T2 3 46.0 T3 3 
34.8 T3 5 46.4 T1 2 
35.0 T2 6 48.0 T2 6 
38.4 T4 3 52.0 T1 3 
38.5 T4 3 54.0 T1 5 
39.1 T3 4 56.0 T2 6 
a) Con respecto a la información proporcionada, identifique la población, unidad 
elemental y muestra. 
b) Elabore una tabla de frecuencias sobre el tipo de embarcación y un gráfico de 
barras de frecuencias porcentuales. 
c) Elabore la tabla de frecuencias para la producción de pesca. Use la regla de 
Sturges. 
d) Interprete f4, p4, F5, y 100-P5. 
e) Elabore el respectivo histograma de frecuencias porcentuales. 
f) Elabore la tabla de frecuencias para la variable número de días de pesca y su 
gráfico respectivo. 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 38 
Preguntas de Autoevaluación 
 
1. Para graficar un polígono, en el eje de ordenadas se usa _________________ y en 
el eje de abscisas _____________________. 
2. Si en una tabla de frecuencias las marcas de clases: X’1=25 y X’6=75, entonces el 
valor del TIC es ___________________ y el valor del LI1 es _________________. 
3. El gráfico asociado a una variable cuantitativa discreta se conoce como 
______________________. 
4. El valor representativo de un intervalo de clase se conoce como 
_________________________ 
5. Para graficar un histograma, en el eje de ordenadas se usa ________________ y en 
el eje de abscisas _____________________. 
6. La frecuencia acumulada relativa 
4r
F puede ser calculada en términos de la 
frecuencia relativa por ____________________ y en términos de la frecuencia 
acumulada absoluta por _________________________. 
7. Los gráficos que se pueden elaborar para la variable estado civil son llamados 
__________________________________ 
8. Para los siguientes valores del TIC, halle el valor usando el redondeo por exceso 
para los casos de un entero, un decimal y dos decimales. 
 
 
 
 
 
 
 
9. El número de decimales del Tamaño de Intervalo de Clase (TIC), debe ser siempre 
igual a _________________________________ 
 
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados: 
 
Item Enunciado V/F 
a. Para hallar el número de intervalos de clase se aplica el redondeo por 
exceso. 
 
b. El número de decimales de la marca de clase es igual a la de las 
observaciones. 
 
c. Para una muestra de 55 clientes, la frecuencia absoluta acumulada de 
la última clase es mayor a 55. 
 
d. El gráfico circular se elabora usando las frecuencias absolutas 
e. Es posible que el límite superior de la última clase sea menor que el 
máximo valor. 
 
 
 
TIC Entero Un decimal Dos decimales 
4.051 
12.106 
35.09 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 39 
CAPÍTULO III 
 
MEDIDAS ESTADÍSTICAS 
 
Las medidas estadísticas pueden ser calculadas con los datos provenientes de una 
población (N: Tamaño de la población) o muestra (n: Tamaño de la muestra) para 
evaluar diferentes variables (cuantitativas y cualitativas), cuya finalidad es resumir y 
representar el conjunto de datos. 
 
 
 
 
 
Observaciones 
 Las medidas estadísticas asumen las mismas unidades de medida de la variable en 
estudio, con la excepción de ciertas medidas estadísticas relativas. 
 Para las variables cuantitativas, se pueden calcular medidas estadísticas como: 
media, mediana, moda, rango, rango intercuartílico, varianza, desviación estándar, 
coeficiente de variabilidad, y otras. En el caso de las variables cualitativas, sólo es 
posible calcular las medidas como la moda y la proporción. 
 
Objetivo. Reconocer las características básicas de una distribución de datos a través de 
las principales medidas de tendencia central, de posición y variabilidad. 
 
3.1 Medidas de tendencia central 
Son medidas estadísticas que se localizarían en la parte central de la distribución de los 
datos. Permiten resumir y representar en un sólo valor el conjunto de datos. Las 
medidas de tendencia central revisadas en este texto son las siguientes: 
 
 La media aritmética 
 La media ponderada 
 La mediana 
 La moda 
 
La media aritmética o Promedio 
La media aritmética simple o promedio de un conjunto de datos provenientes de una 
población (N) o muestra (n), es igual al cociente entre la suma total de sus valores y el 
número de observaciones. 
 
Media poblacional: 
1
1 N
j
j
X
N


  Media muestral: 
1
1 n
j
j
X X
n 
  
 
Ejemplo 1 
Suponga que se tiene los datos de las ventas semanales (en dólares) de una muestra 
de 8 vendedores. Calcule la venta promedio semanal. 
 
150 120 300 280 350 250 160 280 
 
Solución 
 
 
 
 
La venta promedio semanal por vendedor fue de $ 236.3 
 
 
 
3.236
8
890,1
8
280160250350280300120150
8
1 8
1


 
i
ixX
ParámetrosXXXNPoblacion
EstadìstiValoresXXXnMuestra
N
n


,...,,:)(
cos,...,,:)(
21
21
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 40 
Ejercicio 1. Los siguientes datos corresponden a una muestra de 12 apicultores sobre 
su producciónde miel anual (Kgrs.) por colmena. Halle e interprete la media. 
 
250.5 320.0 345.5 260.4 358.2 268.5 380.1 410.2 430.4 480.3 410.3 420.1 
 
 
 
 
 
 
 
Propiedades: 
 
1. La media está afectada por valores extremos (altos o pequeños). Es una desventaja 
de la media. 
2. La media aritmética localiza la parte central de un conjunto de observaciones. 
3. Para un conjunto de observaciones la media es única. 
4. Si la media sustituye a cada observación, la suma total no cambia. 
5. La suma de las desviaciones de las observaciones con respecto al promedio es igual 
a cero.  
1 1
0
n n
j j
j j
X X X n X n X n X
 
       
6. La suma de los cuadrados de las desviaciones de las observaciones con respecto a 
la media es mínima:    
2 2
1 1
,
n n
j j
j j
X X X c donde c R
 
     
 
Ejemplo 2 
Los siguientes datos corresponden a los ingresos mensuales de dos grupos de 
empleados: 
 
Grupo Ingreso x 
A 520 525 518 523 545 580 510 500 527.625 
B 530 545 520 8000 580 590 560 600 1490.625 
 
Propiedad 1. 
 
 
 
 
En el grupo A el promedio es similar a los 8 valores (promedio representativo), 
mientras que en el grupo B eso no ocurre (el valor 8000 es un dato extremo alto). 
 
Propiedad 5. 
 
 
 
 
Propiedad 6. 
 
 
 
 
 
 
 
0625.1490811925)(:
0625.52784221)(:
8
1
8
1
8
1
8
1






xXnXXXBPara
xXnXXXAPara
i
i
i
i
i
i
i
i
15060351082231403)(:510
875.4297625.52782231403)(:
2
8
1
22
8
1
2
2
8
1
22
8
1
2






xncXcXc
xXnXXXAPara
i
i
i
i
i
i
i
i
00.64125625510866206425)(:510
88.48430721625.1490866206425)(:
2
8
1
22
8
1
2
2
8
1
22
8
1
2






xncXcXc
xXnXXXBPara
i
i
i
i
i
i
i
i
625.1490
8
11925
8
1
:
625.527
8
4221
8
1
:
8
1
8
1






i
i
i
i
XXBPara
XXAPara
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 41 
La media aritmética ponderada 
 
La media ponderada de un conjunto de observaciones 1 2, , ... , kx x x con pesos o 
ponderaciones 1 2, , , kw w w está dada por: 
1 1 1 2 2
1 2
1
k
j j
j k k
p k
k
j
j
x w
x w x w x w
x
w w w
w


  
 
  


 
 
La media ponderada se usa en aquellos casos donde las observaciones tienen diferente 
importancia dentro de una población o muestra. 
 
Casos particulares: 
n
xf
f
xf
x
k
j
jj
k
j
j
k
j
jj
p







1
1
1
 
 





k
j
j
k
j
jj
p
n
xn
x
1
1
 
 
 
 
Ejemplo 3 
Un empresario que vende ropa para Caballeros, posee dos tiendas, administradas por 
Gerentes contratados, los ternos vendidos por estas tiendas son comprados a un 
proveedor a un costo de 150 nuevos soles 
 
 La tienda A vendió 95 ternos al precio original de 400 nuevos soles, luego de esto 
en una oferta vendió 126 ternos a 280 nuevos soles y por cierre de temporada 
vendió los 79 ternos restantes a 200 nuevos soles. 
 La Tienda B, ha vendido el 30% de sus ternos a 400 nuevos soles, el 40% a 300 
nuevos soles y el resto al precio de costo. 
 
a. ¿Cuál ha sido el precio promedio por terno vendido en la tienda A? 
 
Media de A: (95*400+126*280+79*200)/(95+126+79)= 296.9333 
 
b. Considerando el precio promedio por terno vendido como indicador de buena 
administración, ¿Cuál de ellas ha sido mejor administrada? 
 
Media de B: 0.3*400+0.4*300+0.3*150 = 285. La tienda A pues tiene un precio 
promedio mayor que la de B 
 
c. Si la tienda B recibió el doble de cantidad de ternos para vender que la tienda A. 
¿Cuál es el precio promedio por terno vendido considerando ambas tiendas? 
 
Media de A y B: (300*296.933+600*285)/(900) = 288.98 
 
 Cuando los datos se encuentran en una tabla 
de frecuencias correspondiente a una variable 
cuantitativa discreta. La media se calcula por: 
 Si 1 2, ,..., kx x x son las medias de k grupos y 
cada grupo tiene tamaño 1 2, ,..., kn n n 
respectivamente, entonces la media de todos 
los datos 1 2 ... kn n n n    se calcula por: 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 42 
Ejercicio 2. En la siguiente tabla se presenta la distribución del número de parcelas 
que poseen para una muestra de 50 agricultores de la sierra central. 
 
Número de parcelas 
Xi 
Número de agricultores 
fi 
1 15 
2 8 
4 12 
5 10 
6 5 
Total 50 
 
Halle e interprete el número promedio de parcelas que tienen por agricultor. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Ejercicio 3. Los tiempos promedios de tardanza (minutos) de muestras de 40, 25 y 15 
empleados de los turnos de día, tarde y noche fueron 8.5, 12.0 y 15.5 respectivamente. 
Hallar el tiempo promedio de tardanza de los trabajadores para los tres turnos. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 43 
La mediana 
 
La mediana es el valor que ocupa la posición central de un conjunto de datos, 
previamente ordenados: )()2()1( ,...,, nXXX . La mediana poblacional se representa por 
Me y la mediana muestral por me. 
 
 
 
 
 
 
 
Otra forma: 
   
        1
1
50 Entero
100
Si
1
50 Decimal . 0.
100
E
E E E
n
E me x
n
E d me x d x x

  
    
 

           
 
Ejemplo 4 
Los siguientes datos corresponden a los pesos (en Kg.) de 10 personas: 50, 77, 53, 76, 
63, 64, 75, 54, 52, 80. Calcule la mediana 
 
Datos ordenados: 50, 52, 53, 54, 63, 64, 75, 76, 77, 80 
 
         5.6363645.0635.05.550
100
110
:
5.63
2
6463
2
,10
565
)1
2
10
()
2
10
(





 






xxxmeformaOtra
XX
meparn
 
Interpretación. Un 50% de personas pesan menos de 63.5 Kg. y el otro 50% pesa más 
de 63.5 Kg. 
 
Ejercicio 4. En un estudio del medio ambiente para evaluar la calidad de aire, se 
registró el número de microgramos de partículas en suspensión por mt2 de aire para 
muestras evaluadas en dos zonas. 
 
Zona A 38 32 45 30 24 45 42 18 28 
Zona B 25 28 25 32 26 35 54 38 
 
Halle e interprete la mediana del número de microgramos de partículas en suspensión 
por mt2 de aire para cada zona. 
 
 
 
 
 
 
 
 
 
 
 
 












2
,
,
)1
2
()
2
(
)
2
1
(
nn
e
ne
XX
mparn
Xmimparn
Si
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 44 
Propiedades: 
 
1. La mediana divide las n observaciones en dos partes iguales. El 50% con valores 
menores a la mediana y el otro 50% con valores mayores a la mediana. 
2. La suma de las desviaciones absolutas de las observaciones con respecto a la 
mediana es un valor mínimo. 
1 1
,
n n
j j
j j
X me X c donde c R
 
     
3. La mediana noestá influenciada por valores extremos. 
 
Ejemplo 5 
Los siguientes datos corresponden a los ingresos mensuales de dos grupos de 
empleados: 
 
Grupo Ingreso 
em 
A 520 525 518 523 545 580 510 523 
B 530 545 520 8000 580 590 560 560 
 
Comente las medianas de los dos grupos. 
 
Solución 
Se observa que la mediana no está afectada por el valor extremo 8000, como es la 
media. 
 
 
La moda 
 
La moda de un conjunto de datos es el valor que ocurre con mayor frecuencia. La 
moda poblaciones se representa por Mo y la moda muestral por mo. 
 
Propiedades: 
1. La moda puede no existir o puede haber más de una moda en un conjunto de 
datos. 
2. La moda no está afectada por valores extremos. 
3. Se aplica tanto para información cualitativa como cuantitativa. 
 
Ejemplo 6 
1. Se tiene las longitudes de peces de río (cm) de la zona A: 4.0, 4.1, 4.2, 4.3, 4.5, 
4.7, 4.8. No hay moda. 
2. Las siguientes longitudes sonde la zona B: 4.0, 4.1, 4.1, 4.1, 4.2, 4.2, 4.5, 4.2. 
Se distinguen dos modas mo1 = 4.1 y mo2 = 4.2 (distribución bimodal). 
 
Ejercicio 5. Se tiene una muestra de los niveles de ozono alrededor de una ciudad 
(220 partes por billón). Halle e interprete la moda. 
 
160 124 156 164 178 163 163 178 164 185 196 164 170 145 164 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 45 
Ejercicio 6. En una encuesta realizada a una muestra de estudiantes de una 
universidad, se les preguntó por el club deportivo de su preferencia. Los datos se 
muestran en la siguiente tabla de frecuencias. Halle e interprete la moda. 
 
 
Club de preferencia Número de estudiantes 
Alianza Lima 230 
Universitario 240 
Sporting Cristal 80 
Sport Boys 45 
 
 
 
 
 
 
Ejercicio 7. En la siguiente tabla se presenta el número de cursos matriculados en el 
presente semestre para una muestra de 300 alumnos. 
 
Número de cursos 
matriculados 
Número de 
alumnos 
2 20 
3 40 
4 100 
5 80 
6 60 
 
Halle e interprete la media, mediana y moda. 
Sugerencia: 
Use la expresión: 
n
fX
X
k
i
ii
 , donde k es el número de clases y n el tamaño de 
la muestra. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 46 
Propiedades de transformación 
 
Para una nueva variable transformada: , donde a y b son constantes reales. 
Entonces, sus medidas estadísticas son calculadas: 
 
 
Medida estadística 
Media 
Mediana 
Moda 
 
Ejemplo 7 
En un parque de atracciones la media de los gastos por visitante un día especial es de 
S/.40, sabiendo que los adultos gastaron una media de S/.43 y los niños S/.35. 
 
a. Calcule el número de adultos y niños que visitaron el parque, si en total fueron 400 
personas. 
Se tiene: 
400
40
400
35*43***







NiñosAdultos
NiñosAdultos
NiñosAdultos
NiñosNiñosAdultosAdultos
p
nn
nn
nn
xnxn
x
 
Entonces: 250150  NiñosAdultos nyn 
b. Si los gastos por asistir al parque de atracciones se incrementaron en un 10% en el 
caso de los adultos y en un 5% en el caso de los niños. ¿Cuál será ahora el 
promedio de los gastos por visitante? 
76.40
400
75.36*2503.47*150
75.3635*05.1*05.1
3.4743*1.1*1.1








p
NiñosNiños
AdultosAdultos
y
xy
xy
 
 
Ejercicio 8. La gerencia de marketing ha decidido aumentar 10% los precios de los 
ternos en la sucursal Sur pero restando 90 nuevos soles, mientras que en la sucursal 
Norte disminuir en 4.5% los precios de los ternos y en la sucursal Centro aumentar 125 
nuevos soles cada terno. A continuación se presenta las medidas estadísticas de los 
precios de las sucursales obtenidas con MINITAB. Halle las medidas estadísticas de los 
nuevos precios de los ternos para la sucursal Sur, Norte y Centro 
. 
Estadísticas descriptivas: Sucursal Sur; Sucursal Norte; Sucursal Centro 
 N para 
Variable N N* Media Mínimo Mediana Máximo Moda moda 
Sucursal Sur 15 0 450,5 345,0 450,0 650,0 450 3 
Sucursal Norte 15 0 582,3 320,0 580,0 910,0 600 2 
Sucursal Centro15 0 500,3 310,0 550,0 810,0 550 3 
 
 
 
 
 
 
 
 
 
 
ii bXaY 
XbaY 
XY bmeame 
XY bmoamo 
ii bXaY 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 47 
 
 
 
 
 
 
 
 
 
 
 
 
3.2 Percentiles (Pq) 
 
El percentil Pq divide a un conjunto ordenado de observaciones en un q% menores que 
Pq y un (100 – q)% mayores que Pq. El percentil Pq es un valor expresado en las 
mismas unidades que la variable en estudio. 
 
Cálculo del Percentil 
q
n
Posición 




 

100
1
 , 
   
        1
1
Entero
100
Si
1
Decimal . 0.
100
q E
q E E E
n
q E P x
n
q E d P x d x x

  
    
 

          
 
 
 
Ejemplo 8 
Se cuenta con los datos de los tiempos (en minutos) de tardanza de los trabajadores de 
una compañía de seguro. Halle e interprete el percentil 45. 
 
15 12 18 22 24 10 9 13 25 18 6 14 
 
Datos ordenados: 6, 9, 10, 12, 13, 14, 15, 18, 18, 22, 24, 25 
 
         utosxxxPPosición min85.13131485.01385.085.545
100
112
56545 




 

 
Interpretación: El 45% de los trabajadores tienen un tiempo de tardanza menor 
13.85 minutos y el otro 55% más de 13.85 minutos. 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 48 
Ejercicio 9. Suponga que se quiere evaluar el número de insectos encontrados en 40 
parcelas, en un cultivo de maíz. Los resultados fueron los siguientes: 
 
1 2 3 5 6 7 9 9 12 18 
1 3 5 5 6 7 9 11 12 18 
1 3 5 5 6 8 9 11 15 19 
2 3 5 6 6 8 9 11 18 23 
 
a. Halle e interprete el percentil 35 
 
 
 
 
 
 
 
b. ¿Cuál debe ser el valor mínimo de insectos para que una parcela sea considerada 
dentro del 18% de las parcelas con mayores números de insectos? 
 
 
 
 
 
 
c. ¿Cuál debe ser el valor máximo de insectos para que una parcela sea considerada 
dentro del 22% de las parcelas con menores números de insectos? 
 
 
 
 
 
 
d. ¿Para qué valores del número de insectos se tendrá el 80% central de parcelas?Ejercicio 10. Se tiene las notas de los promedio ponderados de los estudiantes 
graduados en el último ciclo. Halle el promedio ponderado mínimo para que un alumno 
sea considerado dentro del quinto superior. 
 
10.5 10.9 11.2 11.3 11.5 11.5 11.7 12.8 12.9 13.6 13.7 13.9 14.0 15.6 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 49 
Cuartiles 
 
Son percentiles que dividen el conjunto de datos en 4 partes iguales (25% cada una). 
Son conocidos también como Q1=P25, Q2=P50 y Q3=P75. 
 
Ejemplo 9 
Los siguientes datos corresponden a los pesos, en Kg. de 10 personas: 50, 52, 53, 54, 
63, 64, 75, 76, 77, 80. 
 
a. Calcule e interprete el percentil 25 
           KgxxxxxP 75.52525375.05275.0 23275.2
25
100
11025






 
 
Interpretación: El 25% de las personas pesa menos de 52.75 Kg. y el otro 75% 
pesa más de 52.75 Kg. 
 
b. Halle el percentil 75 
           KgxxxxxP 25.76767725.07625.0 89825.8
75
100
11075






 
 
Interpretación: Un 75% de personas pesa menos de 76.25 Kg. y el otro 25% pesa 
más de 76.25 Kg. 
 
Ejemplo 10 
Se ha desarrollado un experimento para evaluar el efecto de alimentos balanceados en 
la ganancia de pesos de pollos. Una muestra aleatoria de 30 pollos que recibieron el 
alimento balanceado fue seleccionada. Al cabo de 10 días se registraron las ganancias 
de pesos (en gr) 
 
 
 
 
a. Halle e interprete las medidas de tendencia central para la ganancia de peso. 
b. ¿Cuál es el peso mínimo de un pollo que fue alimentado con el alimento balanceado 
para estar en el 10% superior de los que pesan más? 
c. ¿Cuál es peso máximo del 60% de pollos que pesan menos con el alimento 
balanceado? 
 
Solución: 
a) 
 N Media StDev CoefVar Minimo Q1 Mediana Q3 Maximo 
 30 117,40 11,57 9,85 93,00 110,00 118,00 125,75 141,00 
 
La ganancia de peso por pollo alimentado con A es de 117.4 gr. 
El 50% de los pollos alimentados con A tuvieron ganancias de peso menores de 118 
gr. y el restante 50% tuvieron ganancias de peso mayores a 118 gr. 
El valor de la ganancia de peso más frecuente es de 120gr. 
 
b) 90 27.5 134.5 .P X gr  
c) .1191860 grXP  
 
 
93 98 100 102 107 109 110 110 111 111 113 114 115 116 118 
118 119 119 120 120 120 124 125 128 129 129 130 135 138 141 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 50 
3.3 Diagrama de Tallos y Hojas 
 
Un diagrama de tallos y hojas es un ingenioso artificio que ofrece una representación 
parecida a un histograma. La ventaja de este diagrama es que no sólo muestran las 
frecuencias sino que contienen los valores reales. A diferencia de las tablas de 
frecuencias con este procedimiento ningún dato se pierde. 
 
Pasos para elaborar un diagrama de tallos y hojas 
 
Paso 1. Cada dato se divide en dos: la primera se llama tallo y la segunda hoja. 
Paso 2. Cada tallo se forma con uno o más dígitos iniciales de cada dato y las hojas se 
forman con los dígitos restantes (generalmente de un solo dígito). 
Paso 3. Los tallos se presentan en una columna ordenada de menor a mayor 
Paso 4. Las hojas se muestran en filas ordenadas y listadas a la derecha de su 
respectivo tallo. 
 
Nota.- 
 En caso de datos decimales, al construir el diagrama de tallos y hojas el punto 
decimal se pierde, por tal razón se acostumbra indicar unidades que los datos del 
tallo representan. Por ejemplo para un dato: 4.12 Unidad de Hoja=0.01 
 Es necesario pone todos los tallos consecutivos. Si no existe el dato, se pone el valor 
del tallo y en la fila de hoja se deja en blanco. 
 Si es necesario se divide en dos hojas cada tallo, según los rango: (0 – 4) y (5 – 9). 
 
Ejemplo 11 
Los siguientes datos corresponden a la estatura de una muestra de 30 alumnos 
universitarios. 
 
158, 159, 161, 161, 163, 163, 164, 166, 166, 167, 168, 168, 168, 169, 170, 170, 170, 
171, 171, 171, 172, 173, 174, 174, 174, 174, 174, 177, 182, 191 
 
Diseño de Tallo y Hoja: Estatura 
 
Tallo y Hoja de Estatura n = 30 
Unidad de hoja = 1.0 
 
 
 2 15 89 
 7 16 11334 
 14 16 6678889 
 (13) 17 0001112344444 
 3 17 7 
 2 18 2 
 1 18 
 1 19 1 
El diagrama de tallos y hojas representa la estatura de 30 alumnos. Existen tres partes 
en el gráfico. 
 La primera columna representa la profundidad 
 La segunda columna representa los tallos 
 La última columna representa las hojas. 
 
Cada dígito de las hojas representa una observación. 
 
El diagrama de tallos y hojas muestra 8 tallos con sus respectivas hojas. El primer tallo 
es 15 y la primera hoja es 8. La observación correspondiente es 158 que se obtuvo 
juntando los dígitos del tallo y de la hoja y se multiplica por la unidad de hoja 
(158*1.0=158). 
 
Profundidad 
Tallos 
Hojas 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 51 
La primera columna (la profundidad) indica cuantas observaciones hay en esa línea o 
antes. El número 14 en la tercera línea indica que hay 14 observaciones en esa línea y 
en las líneas anteriores (14 observaciones menores o iguales a 169). Hay una línea 
especial, la línea que contiene la mediana. El valor que muestra es encerrado entre 
paréntesis e indica cuantas observaciones hay en esa línea. A partir de la siguiente línea 
que contiene la mediana, la columna de profundidad indica cuantas observaciones hay 
en esa línea y en las líneas posteriores. El número 3 en la quinta línea indica que hay 3 
observaciones en esa línea y en las líneas posteriores (3 observaciones mayores o 
iguales a 177). 
 
La séptima línea muestra al tallo 18 (1 18 ); sin embargo no tiene ninguna hoja, 
lo que significa que no hay ninguna observación en ese tallo. (Un error muy frecuente 
es considerar el tallo 18 y la hoja 0 y por consiguiente considerar la observación 18.0 
con lo que se tendrían 31 observaciones). 
 
Ejercicio 11. Se tiene una muestra de pacientes sobre el tiempo (minutos) de 
concentración de un medicamento: 105, 126, 120, 119, 133, 145, 123, 108, 136, 156, 
142, 130, 112, 123. A continuación se presenta su respectivo diagrama de tallos y 
hojas. 
 
Tallo y hoja de Tiempo N = 14 
Unidad de hoja = 1.0 
 
 
 2 10 58 
 3 11 2 
 4 11 9 
 7 12 033 
 7 12 6 
 6 13 03 
 4 13 6 
 3 14 2 
 2 14 5 
 1 15 
 1 15 6 
 
 
a. Si se desconocen los datos originales, calcule la media, mediana, moda y P28 a 
partir del diagrama de tallos y hojas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 52 
Ejercicio 12. Se tienen datos de las concentraciones de lactato en la sangre 
(milimoles/litros) para una muestra de pacientes: 
 
2.1, 2.5, 2.8, 3.5, 3.6, 3.8, 3.8, 4.6, 5.2, 5.4, 5.6, 5.9, 6.2, 6.5, 6.5 
 
A continuación se presenta su respectivo diagrama de tallos y hojas. 
 
Tallo y hoja de Concentracion N = 15 
Unidad de hoja = 0.10 
 
 
 1 2 1 
 3 2 58 
 3 3 
 7 3 5688 
 7 4 
(1) 4 6 
 7 5 24 
 5 5 69 
 3 6 2 
 2 6 55 
 
 
a. A partir del diagrama de tallos y hojas calcule e interprete la media, mediana y 
moda.UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 53 
Práctica Dirigida N° 2 
 
1. El uso de fertilizantes inadecuados conduce a la acumulación de sales en el suelo y 
debe ser evitado, pues estas sales impiden el crecimiento normal de las plantas. Un 
ingeniero agrónomo ha sembrado semillas de frejol en dos áreas de cultivo, cada una 
de las cuales ha recibido un fertilizante diferente a los que llamaremos A y B. Varias 
semanas después toma una muestra aleatoria de plantas de frijol en cada área de 
cultivo y mide la altura (en cm) de las mismas. Algunos datos y resultados se 
muestran a continuación: 
 
Fertilizante A Fertilizante B 
 
Tallos y Hojas de A N = 29 
Leaf Unit = 1.0 
 
 1 3 9 
 12 4 00011111111 
(5) 4 22223 
 12 4 45555 
 7 4 667 
 4 4 889 
 1 5 
 1 5 
 1 5 5 
 
29
1
1261i
i
y

 
 
 
Tabla 2: Alturas de planta de frijol al usar el 
fertilizante B 
 
45 42 39 45 41 
46 42 41 45 45 
48 48 41 45 47 
49 49 42 46 48 
51 51 42 46 49 
52 53 47 47 53 
 
30
1
1385i
i
y

 
 
a. Calcule e interprete las medidas de tendencia central para la altura de las plantas de 
frijol cuando se utiliza el fertilizante A. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b. Calcule la altura más frecuente de las plantas de frijol que reciben el fertilizante B. 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 54 
c. Si en una zona agrícola con mayor pH se espera que la altura de las plantas con el 
fertilizante A tengan un incremento del 12.5% y con el fertilizante B una disminución 
del 2.5%, calcule la altura promedio considerando los dos fertilizante para esta zona 
agrícola. 
 
 
 
 
 
 
 
 
 
 
 
 
 
d. Calcule la altura promedio del 20% de las plantas de frijol más altas y que reciben el 
fertilizante B. 
 
 
 
 
 
 
 
 
 
 
 
e. El 10% de las plantas con menores alturas es catalogado como grupo de “plantas 
enanas”, mientras que el 12% de las mayores alturas como “plantas gigantes” y el 
porcentaje restante como “plantas de altura normal”. Determine los intervalos de altura 
que debe tener una planta que recibe el fertilizante A para ser considerada enana y 
una planta receptora del fertilizante B para ser considerada gigante. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 55 
2. El Instituto Nacional de Innovación Agraria (INIA) reporta que una plaga está afectando 
considerablemente a las plantas de yuca en el distrito de Tocache (selva del Perú), esta 
plaga daña la yuca afectando principalmente a su peso. En el siguiente cuadro se 
muestra la distribución de frecuencia del número de hojas amarillas (afectadas) para 
una muestra de 35 plantas de yuca: 
 
Número de hojas afectas por la plaga 
Número de Hojas fi fri 
0 3 0,09 
1 4 0,11 
2 5 0,14 
3 9 0,26 
4 7 0,20 
5 6 0,17 
6 1 0,03 
 
35 
 
Halle e interprete la media, mediana, moda y el el 40% central del número de hojas 
amarillas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 56 
EJERCICIOS PROPUESTOS 
 
1. En una empresa, el jefe de Recursos Humanos está interesado en analizar el 
impacto en los empleados al suprimir las horas extras de trabajo pagadas. Con este 
fin se extrae una muestra aleatoria de 60 empleados tomando los datos de un día al 
azar. A continuación se muestran las horas de trabajo por día de cada empleado. 
 
Horas diarias trabajadas 
7.6 7.7 8.0 8.0 8.0 8.1 8.1 8.2 8.2 8.2 8.2 8.2 8.2 8.3 8.3 
8.3 8.4 8.4 8.4 8.4 8.5 8.5 8.5 8.6 8.6 8.7 8.7 8.7 8.8 8.8 
8.9 8.9 8.9 9.0 9.1 9.1 9.3 9.4 9.6 9.7 9.7 9.8 9.9 9.9 10.0 
10.0 10.3 10.5 10.5 10.6 10.8 11.0 11.2 11.6 11.7 12.2 12.5 12.9 13.3 14.5 
 
a) Construya el diagrama de tallos y hojas, considere como unidad de hoja 0.10 
b) Calcule e interprete la media mediana y moda 
c) Calcule el número mínimo de horas trabajadas para que un empleado se 
encuentre en el 17% de los empleados que más horas trabajan. 
 
2. El banco “Nuevo Continente” cuenta con sucursales en La Molina y Los Olivos. El 
gerente de crédito selecciona al azar algunas solicitudes de préstamo que han sido 
aceptadas en cada una de las sucursales y resume de manera independiente la 
información correspondiente al monto de préstamo otorgado (en miles de nuevos 
soles) en los siguientes diagramas de tallos y hojas: 
 
Tallo y Hojas de La Molina N = 13 
Unidad de Hoja = 0.10 
 
 1 4 3 
 4 4 678 
(4) 5 2244 
 5 5 5 
 4 6 4 
 3 6 99 
 1 7 4 
 
Tallo y Hojas de Los Olivos N = 14 
Unidad de Hoja = 0.10 
 
 1 2 6 
 3 3 01 
 3 4 
 5 5 08 
 5 6 
 7 7 14 
 7 8 5 
 6 9 069 
 3 10 1 
 2 11 45 
 
a) Calcule e interprete las medidas de tendencia centra para la sucursal de La 
Molina. 
b) ¿Entre qué valores se encuentra el 60% central de las observaciones 
correspondientes a la sucursal de Los Olivos? 
c) El Interés que cobra el banco corresponde al 5% del monto otorgado como 
préstamos más 20 nuevos soles por gastos administrativos. Halle el interés 
medio que percibirá el banco debido a los préstamos otorgados 
 
3. Si 80 artículos tienen un peso promedio de 2.54 Kg y se sabe que el instrumento de 
medición utilizado no estaba calibrado ocasionando que el peso de los artículos 
tengan un 25% más de su peso verdadero. Halle el verdadero peso promedio. 
(aplique propiedades en la solución) 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 57 
4. Una fábrica tiene una máquina que trabaja las 24 horas del día en tres turnos de 8 
horas (mañana, tarde y noche). Los costos de producción por hora (en soles) y los 
tiempos de producción por artículo que dependen del turno. Los datos se presentan 
a continuación: 
 
Turno Costo de producción 
por hora (S/.) 
Tiempo por hora de 
consumo 
Mañana 40 0.50 
Tarde 50 0.40 
Noche20 0.32 
 
a) Calcule el costo promedio de producción por hora. 
b) Calcule el tiempo promedio de producción por artículo al día 
 
5. Del ejercicio anterior. Suponga que un trabajador que labora con la máquina en la 
mañana cobra 36 soles, un trabajador que labora en la tarde cobra 40 soles, y un 
trabajador que labora en la noche cobra 50 soles diarios. ¿Cuál es el costo promedio 
por hora que tiene la fábrica considerando la labor del trabajador y el costo de 
producción de energía eléctrica? 
 
6. En una fábrica de camisas se estudió la variable definida como el número de 
camisas defectuosas que se produce cada hora. Fue seleccionada una muestra de 80 
horas, encontrándose la siguiente información: 
 
X 0 1 2 3 4 
fi 50 12 8 7 3 
 
Si la producción por hora es de 40 camisas y cada camisa buena genera una 
utilidad de 120 soles además cada camisa defectuosa da lugar a una pérdida de 40 
soles. Calcule la utilidad neta promedio por día (Considere 6 horas de trabajo 
efectivo por día). 
 
7. Una empresa dedicada a la fabricación de electrodomésticos desea evaluar el número 
de un determinado componente eléctrico que sus trabajadores pueden ensamblar en 
un día. Con tal fin se registra el número de componentes eléctricos ensamblados por 
20 trabajadores del turno de la mañana. Los resultados son los siguientes: 
6 7 7 7 7 8 8 8 8 8 
9 9 9 9 9 9 10 10 10 11 
 
 
a) Calcule e intérprete las medidas de tendencia central. 
b) La empresa le paga al trabajador 4 soles por componente si este ensambló 8 o 
menos y 5 soles si ensambló 9 o más. Calcule el ingreso promedio en ese día 
para los dos grupos de trabajadores. Calcule el ingreso promedio en ese día para 
el total de trabajadores. 
8. Suponga que se quiere evaluar el número de insectos encontrados en 40 parcelas, 
en un cultivo de frijol. Los resultados fueron los siguientes: 
2 19 3 3 19 3 9 3 9 9 3 5 2 5 5 1 5 1 1 5 
5 6 6 18 18 6 6 18 6 11 11 11 11 7 7 7 8 12 8 12 
a) Halle e intérprete: Media, Mediana y Moda 
b) Si se considera que el costo por eliminación de un insecto es de 
aproximadamente 2 soles además del alquiler del equipo que es una cantidad 
fija de 50 soles, hallar el costo promedio para la eliminación de los insectos. 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 58 
9. La siguiente información corresponde al número de emergencias que atendió el 
cuerpo de bomberos en los últimos 30 días: 
 
3 5 3 4 1 2 3 2 4 5 7 1 3 4 2 
2 1 5 2 2 4 6 7 4 7 6 4 6 4 3 
 
a) Calcule e intérprete las medidas de tendencia central. 
b) El cuerpo de bomberos gasta en combustible 18 soles por emergencia atendida y 
recibe un presupuesto de 120 soles diarios. ¿Es este presupuesto suficiente? Si 
así fuera, ¿cuánto dinero sobra diariamente en promedio?. En caso contrario, 
¿cuánto dinero falta diariamente en promedio? 
 
10. Parra evaluar la efectividad de sus empleados, una empresa dedicada a la venta de 
teléfonos celulares ha recopilado la siguiente información sobre el número de 
teléfonos vendidos en la última semana por sus 64 empleados: 
Número de empleados 13 15 16 8 5 4 3 
Número de ventas 5 6 7 8 9 10 11 
a) Calcule e intérprete las medidas de tendencia central. 
b) La empresa le paga a sus empleados 100 soles semanales más una comisión de 
40 soles por celular vendido y sobre estos ingresos los empleados deben aportar 
el 15% a su AFP. Calcule el promedio para el ingreso neto promedio semanal por 
empleado. 
11. Se encuestó a 84 congresistas de cierto país para averiguar el número de viajes 
internacionales que realizan por año, obteniéndose los siguientes resultados: 
Tallo y Hojas de Viajes N = 84 
Unidad de Hoja = 1.0 
 (46) 0 6666666666666677777777777777788888889999999999 
 38 1 000000011111112222233344 
 14 1 55566667789 
 3 2 034 
 
Calcule las medidas de tendencia central para estos datos. Interpretar: Media, 
Mediana y Moda. 
 
12. Se realizó un estudio en la provincia de Tambo Grande (Piura), luego de la 
aplicación de un nuevo abono en el cultivo de dos variedades de mango: Kent y 
Haden. Los rendimientos en la producción obtenidos luego de la cosecha en Kg/Ha 
fueron los siguientes: 
Variedades 
Variedad Kent Variedad Haden 
N° de 
Ha 
Rend. 
N° de 
Ha 
Rend. 
 
 Tallo y Hoja de Haden N = 22 
 Unidad de Hoja = 0.10 
 8 10 22388999 
 (6) 11 266888 
 8 12 2233 
 4 13 344 
 1 14 
 1 15 
 1 16 5 
 
1 9.0 12 13.1 
2 11.9 13 13.2 
3 12.6 14 13.5 
4 12.6 15 13.5 
5 12.6 16 13.7 
6 12.8 17 13.8 
7 12.8 18 13.8 
8 12.8 19 14.1 
9 12.9 20 14.1 
10 12.9 21 14.3 
 
Calcule e interpretar las medidas de tendencia central para estos datos. 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 59 
i. Se desea analizar la cantidad de hormona llamada ecdisona que se obtiene a partir 
de una conversión química del colesterol que presentan los crustáceos. Esta 
hormona es la encargada de llevar a cabo el proceso de muda en los crustáceos. 
Para el estudio se utiliza 20 individuos de la especie Cyclograpsus cinereus. Los 
resultados del nivel de ecdisoma (en ml) son los siguientes: 
 
Nivel de ecdisona (ml) 
31.4 56.7 77.73 89.8 95.8 
39.4 58.2 85.5 93.6 97.4 
47.6 65.3 68.8 94.7 99.3 
50.5 66.5 88.2 95.5 99.5 
 
a. Calcule e interprete la media, mediana y moda del nivel de ecdisona. 
b. Se desea clasificar a los individuos tres grupos según sus niveles de ecdisona 
(Bajo, Medio y Alto), de tal manera que contengan al 40%, 50% y 10% de 
individuos respectivamente. Calcule los niveles de ecdisoma que permitan 
identificar los límites de cada grupo. 
c. A fin de mejorar el proceso de muda de los crustáceos, se han ensayado dos 
tipos de dosis (A y B). Con el tipo A, se espera que el nivel de ecdisoma se 
incremente en un 12.5% pero con un reducción de 5.6 ml por cada individuo, 
mientras que con la dosis B, los niveles de ecdisoma disminuirán en un 4.5% 
pero más 8.5 ml por cada individuo. ¿Cuál de las dos dosis proporcionaría los 
mayores niveles promedios de ecdisoma en los crustáceos?. Justifique su 
respuesta. 
 
ii. En un reservorio en la zona agrícola de Huachipa se realiza la crianza de peces 
Tilapia, los cuales son vendidas diariamente a los pobladores de alrededor. Se 
muestra a continuación en un diagrama de tallos y hojas el peso en Kg. de venta de 
esta especie de pez durante un mes. 
 
Tallo y hoja de Concentracion N = 31 
Unidad de hoja = 0.10 
 
 1 4 2 
 1 4 
 7 5 223344 
 10 5 5566 
(12) 6 112233444444 
 8 6 8999 
 4 7 344 
 1 7 9 
 
Halle e interprete la media, mediana, moda y el percentil 32.5 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 60 
Preguntas de Autoevaluación 
 
1. Las medidas de tendencia central que no están influenciadas por valores atípicos 
son _______________________________________. 
2. ___________________ es una medida de tendencia central que está afectada por 
los valores extremos. 
3. __________________ es una medida de tendencia central utilizada para resumir 
datos provenientes de un variable tipo cualitativa. 
4. En una muestra de 80 estudiantes, el 60% ha perdido un celular, el 20% dos 
celulares, el 15% tres celulares y el resto ningún celular en los últimos dos años. 
Entonces el percentil 56 es igual a ____________________________. 
5. La suma de las desviaciones de las observaciones respecto a la media aritmética, es 
igual a _____________________. 
6. La suma de las desviaciones absolutas de las observaciones con respecto a la 
________________________ es un valor mínimo. 
7. Los resultados de una encuesta sobre el porcentaje de satisfacción de sus clientes 
para dos empresas de seguro (A y B) se muestran en el siguiente cuadro: 
 
Satisfacción Empresa A Empresa B 
Alta 30% 40% 
Media 40% 35%Baja 20% 15% 
Muy baja 10% 10% 
 
Para comparar donde hay mayor satisfacción de los clientes en las empresas A y B, 
la medida de tendencia central usada es ____________________ y cuyos valores 
usados son __________________________ respectivamente. 
8. Una empresa aseguradora de autos ofrece a sus clientes cuatro planes de seguros 
(A, B, C y D), siendo el costo anual de 650, 520, 450 y 380 (nuevos soles) 
respectivamente. Si el 45% de sus clientes tienen el plan de seguro A, el 35% el B, 
el 15% el C y el resto el plan D. El costo promedio de los cuatro planes de seguro 
para la empresa aseguradora es igual a _____________________________ 
 
9. Si _______________________. 
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados: 
 
Item Enunciado V/F 
a. Las medidas de tendencia central, asumen como unidad de medida la 
misma que la variable en estudio. 
 
b. Los percentiles están afectados por valores extremos 
c. La mediana y el percentil 50 no siempre son iguales 
d. La media puede tomar un valor negativo 
e. Las medidas de tendencia central son calculadas sólo con los datos de 
una muestra. 
 
 
 
valorunesXentoncesX
n
i
i ,)5.10(:,5.10
1
2


UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 61 
CAPÍTULO IV 
 
MEDIDAS DE VARIABILIDAD O DE DISPERSIÓN 
 
Son medidas estadísticas que permiten conocer el grado de dispersión o variabilidad 
(homogeneidad o heterogeneidad) dentro de un conjunto de datos. Se usan para 
comparar la variabilidad entre dos o más conjuntos de datos. Cuando los datos 
presentan baja variabilidad, se dice que son homogéneos y cuando presentan alta 
variabilidad se dice que son heterogéneos. 
 
Objetivos. Calcular e interpretar las principales medidas de variabilidad para describir 
las características (variables) cuantitativas de las unidades elementales en términos de 
su dispersión. 
 
Las principales medidas de variabilidad son las siguientes: 
 
1. La amplitud o rango 
2. El rango intercuartil 
3. La variancia y la desviación estándar 
4. El coeficiente de variabilidad 
 
Ejemplo 1 
Suponga que las notas de la primera práctica de tres grupos del curso de Estadística 
General fueron: 
Grupo Notas x 
A 14 14 14 14 14 14 14 14 14 14 14 
B 14 13 15 14 12 15 16 13 12 16 14 
C 19 8 19 11 16 18 6 13 10 20 14 
 
Analice las notas promedios de los tres grupos de Estadística general. 
 
Solución 
Del cuadro se observa que: 
a. Los grupos A, B y C tienen la misma media pero diferente dispersión en torno a la 
media. 
b. Respecto a la variabilidad o dispersión: A < B < C 
c. Respecto a la homogeneidad : A > B > C 
d. Respecto a la confiabilidad de la media: A > B > C 
 
4.1 Principales medidas de variabilidad 
 
El rango 
 
El rango o amplitud de un conjunto de observaciones es igual a la diferencia entre el 
valor máximo y el valor mínimo. 
 
R = Xmax - Xmin 
Desventajas: 
a. Queda afectada por valores extremos 
b. No mide la variabilidad de los datos intermedios 
 
Ejemplo 2 
El rango de la nota para el grupo B es: RB = 16 – 12 = 4 puntos. 
 
Indica que la amplitud de la nota de la primera práctica del grupo B fue de 4 puntos. 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 62 
El rango intercuartil 
 
El rango intercuartil, se define como la diferencia entre el percentil 75 (P75 = Q3) y el 
percentil 25 (P25 = Q1). 
RI = P75 - P25 
 El RI excluye el 25% más alto y el 25% más bajo, dando un rango dentro del cual 
se encuentra el 50% central de los datos. 
 Un RI pequeño indica alta homogeneidad o pequeña variabilidad dentro del 50% 
central de los datos. 
 
Ejemplo 3 
Para el grupo C: P75 = 19 y P25 = 9.5, entonces: RI = 19 – 9.5 = 9.5 puntos. 
 
Esto indica que la amplitud del 50% central de las notas de la primera práctica para el 
grupo C fue 9.5. 
 
La variancia y la desviación estándar 
Variancia poblacional:  
2
2 2 2
1 1
1 1N N
j j
j j
X X N
N N
  
 
 
    
 
  
Variancia muestral:  
2 2
2 2
1 1
1 1
1 1
n n
j j
j j
S X X X n X
n n 
 
    
   
  
Desviación estándar muestral: 
2SS  
Para una tabla de frecuencias: 
2
2 2 2
1 1
1 1
( ) ( )
1 1
k k
i i i i
i i
S f X X f X nX
n n 
   
 
  
 
Se observa que la variancia está dada en las mismas unidades que la variable en 
estudio al cuadrado. Por ejemplo si las unidades de las observaciones son Kg. entonces 
la variancia se expresa en Kg2. 
 
Ejemplo 4 
Halle la variancia y desviación estándar muestral de las notas para cada uno de los 
grupos. 
Grupo Notas x 

10
1
2
i
ix 
A 14 14 14 14 14 14 14 14 14 14 14 1960 
B 14 13 15 14 12 15 16 13 12 16 14 1980 
C 19 8 19 11 16 18 6 13 10 20 14 2192 
 
Grupo A:   0014101960
110
1
1
1 22
10
1
22 









 

A
i
iA Syxxnx
n
S 
Grupo B:   49.122.222.214101980
110
1
1
1 22
10
1
22 









 

B
i
iB Syxxnx
n
S 
Grupo C:   08.578.2578.2514102192
110
1
1
1 22
10
1
22 









 

C
i
iC Syxxnx
n
S 
 
Se observa que a mayor variabilidad entre las observaciones, la variancia es mayor. 
Esta comparación se cumple siempre cuando los promedios sean similares. 
Se observa que la variabilidad promedio de las notas de la primera práctica del grupo B 
es 1.49 puntos. 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 63 
Coeficiente de variabilidad 
 
El coeficiente de variabilidad es una medida de dispersión relativa (no tiene unidades) y 
se define como la razón entre la desviación estándar y la media aritmética de un 
conjunto de observaciones. 
Coeficiente de variabilidad poblacional: 100


CV 
Coeficiente de variabilidad muestral: 100
x
s
cv 
 
Ejemplo 5 
Halle el coeficiente de variabilidad de las notas de la primera práctica para cada grupo. 
 
Grupo A: 0100
14
0
100  xx
x
S
cv
A
A
A
 
Grupo B: %6.10100
14
49.1
100  xx
x
S
cv
B
B
B
 
Grupo C: %3.36100
14
08.5
100  xx
x
S
cv
C
C
C
 
 
Esto indica, que la variabilidad de la nota de la primera práctica del grupo C es 36.3% y 
por lo tanto es el más heterogéneo por tener mayor cv en comparación con el grupo A y 
B. 
 
Ejemplo 6 
Los siguientes datos corresponden al tiempo (en minutos), al cabo del cual se duermen 
las ratas después de haber recibido un tipo de tranquilizante (A o B). 
 
 Tipo A Tipo B 
n 18 ratas 20 ratas 
x 9.94 min 15.2 min 
s 2.81 min 2.84 min 
 
¿Con qué tranquilizante el tiempo es más homogéneo? 
 
%27.28100
94.9
81.2
Acv %68.18
2.15
84.2
Bcv 
 
Se concluye que con el tranquilizante B se obtienen observaciones más homogéneas 
que con el tranquilizante A. 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 64 
Ejercicio 1. Los siguientes datos corresponden a las mediciones de la emisión diaria 
(en toneladas) de óxido de azufre de una planta industrial. 
 
15.8 26.4 17.3 11.2 23.9 24.5 13.9 9.4 22.7 18.5 
15.2 11.0 7.7 20.0 16.2 
 
Calcule e interprete las medidas de variabilidad (Rango, Rango intercuartil, Varianza, 
Desviación estándar y Coeficiente de variación).Comparación de la variabilidad 
 
Para comparar la variabilidad entre dos o más conjuntos de datos, se debe considerar: 
 
Unidades de medidas 
diferentes 
Unidades de medidas iguales 
Medias similares Medias diferentes 
cv1 con cv2 S1 con S2 cv1 con cv2 
 
El cuadro indica que cuando se compara la variabilidad de dos conjuntos de datos, si las 
variables tienen unidades de medidas diferentes; se debe usar los coeficientes de 
variación; mientras si las variables tienen unidades de medida iguales, se debe 
observar si las medias son similares para usar la desviación estándar y en caso que las 
medias sean diferentes usar el coeficiente de variación. 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 65 
Ejercicio 2. En el siguiente cuadro se muestra las medidas estadísticas de las ventas 
(soles) y tiempo extra (horas) de los vendedores de dos zonas (A y B). 
 
 
Zona 
Promedio 
Desviación 
estándar 
Coeficiente de 
variabilidad 
Ventas Tiempo Ventas Tiempo Ventas Tiempo 
A 236.3 3.5 82.6 1.5 35.0 42.9 
B 450.5 3.6 98.5 2.8 21.9 77.7 
 
a. Las ventas de la zona A son menos variables que las de la zona B. Justifique. 
 
 
 
 
 
 
b. El tiempo extra de la zona B muestra más variabilidad que la zona A. Justifique. 
 
 
 
 
 
 
c. Para la zona A, las ventas son más variables que el tiempo extra. Justifique. 
 
 
 
 
 
 
Transformación de datos 
 
Sea la variable Y, entonces para bXaY  , se cumple: 




XY
XY
bSS
SbS 222
 
 
Ejemplo 7 
En una empresa industrial desea mejorar la productividad de los obreros, para tal 
efecto se escogió uno de los productos de la empresa para hacer el análisis, y se tomó 
el tiempo que demoran 20 trabajadores del primer turno en ensamblar el producto, 
obteniéndose los tiempos siguientes (en minutos): 
 
Variable Media StDev Varianza CoefVar Q1 Mediana Q3 
C1 3.525 1.723 2.967 48.87 1.975 3.250 5.125 
 
 
a. El Gerente de Producción, considera que la muestra de obreros es muy pequeña, 
por lo tanto dispone se incremente con 5 trabajadores más, los cuales demoran 
2.5, 2.8, 4.3, 5.1, 5.5 (en minutos) para ensamblar el producto, encuentre e 
interprete la media, la mediana y la moda de los tiempos de los 25 trabajadores 
juntos. 
 
Media con 20 trabajadores : 3.525 
Media de 5 trabajadores : (2.5+2.8+4.3+5.1+5.5)/5= 4.04 
Media con 25 trabajadores : (20*3.525+5*4.04)/25= 3.628 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 66 
b. Inspeccionando el cronómetro con que se registró los tiempos se encontró que éste 
estaba excediendo la medición en 0.1 minutos. ¿Cuáles serían entonces las reales 
medidas halladas en a)? 
 
Media = 3.525-0.1=3.425 
Mediana = 3.25-0.1=3.15 
S= 1.723 
CV = 1.723/3.425*100 = 50.3% 
 
Ejercicio 3. Considere los datos del ejercicio 2. Suponga que la empresa decide hacer 
un pago adicional por las horas extras. A los vendedores de la zona A, se les pagará S/ 
10.0 por cada hora extra más S/. 50 por movilidad. A los de la zona B, se les pagará S/ 
15.0 por cada hora extra. 
Calcule la desviación estándar y coeficiente de variabilidad para estos pagos adicionales 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Ejercicio 4. Los sueldos de 100 empleados de una empresa tienen una media de $300 
y una desviación estándar de $50. Se proponen dos alternativas de aumento A: $75 a 
cada uno B: 15% del sueldo más $20 a cada uno. ¿Cuál alternativa es la más 
conveniente?. Justifique su respuesta. 
 
a. Si la empresa dispone sólo de $37000 para pagar el aumento de sueldos 
 
 
 
 
 
 
 
 
 
 
 
 
b. Si la empresa quiere tener los aumentos de sueldos más homogéneos 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 67 
EJERCICIOS PROPUESTOS 
 
1. En el mes de Julio el sueldo promedio de los trabajadores del Sector Educación fue 
de $200 dólares. Para el mes de Agosto se considera un aumento del 37% con 
respecto al sueldo del mes anterior más un adicional de $35 dólares. Si se obtuvo 
una desviación estándar igual a $ 3.15 en el mes de Julio. ¿Se puede afirmar que la 
distribución de sueldos en Julio fue más homogénea? 
 
2. En una industria el jornal diario de sus obreros tiene una media de $10 y una 
desviación estándar de $2. Si se hace un incremento del 20% en cada jornal y una 
bonificación adicional de $3. ¿En qué porcentaje cambio el coeficiente de variación 
de los jornales? 
 
3. Los sueldos de 100 empleados de una empresa tienen una media de $300 y una 
desviación estándar de $50. Se proponen dos alternativas de aumento i) $75 a cada 
uno ii) 15% del sueldo más $20 a cada uno ¿Cuál alternativa es la más 
conveniente? 
a) Si la empresa dispone solo de $37000 para pagar sueldos. 
b) S la empresa quiere homogeneizar los sueldos 
 
4. Si 80 artículos tienen un variancia de 4.2 Kg2 y un P40 = 43.4 Kg y se sabe que el 
instrumento de medición utilizado no estaba calibrado y pesó a los artículos con un 
25% más de su peso. Halle la verdadera variancia y el verdadero P40. 
 
5. En un estudio sobre garbanzo se consideró la variable altura de planta y en una 
muestra de 14 plantas se tiene: 55.7, 57.6, 58.5, 58.7, 58.8, 59.3, 59.4, 59.6, 
60.0, 59.8, 60.1, 60.2, 60.3, 63.1. Calcule e interprete la variancia muestral y P75. 
Si a cada observación se le multiplica por 1.8 y a cada resultado se le resta 3 halle 
la nueva variancia muestral y el nuevo P75. 
 
6. Se tiene una muestra aleatoria de tamaño 20 con media 5 y variancia igual a 
0.36, si a cada observación se le incrementa un 20% de su valor más una cantidad 
de 4 unidades: 
 
1. Calcule el coeficiente de variación de los datos transformados. 
2. De la pregunta anterior, ¿qué conjunto de datos presenta mayor variabilidad, los 
datos transformados o los datos iniciales? 
 
7. El sueldo promedio de los empleados de una empresa para el mes de Julio fue de 
S/. 1500 y un coeficiente de variabilidad de 30%. Si la gerencia decide dar un 
aumento del 8% más un monto por viáticos de S/. 200 cada mes. Calcular el 
coeficiente de variabilidad para el nuevo sueldo. 
8. Para evaluar la efectividad de sus empleados, una empresa dedicada a la venta de 
teléfonos celulares ha recopilado la siguiente información sobre el número de 
teléfonos vendidos en la última semana por sus 64 empleados: 
Número de empleados 13 15 16 8 5 4 3 
Número de ventas 5 6 7 8 9 10 11 
a. Calcule e intérprete las medidas de variabilidad. 
b. La empresa le paga a sus empleados 100 soles semanales más una comisión de 
40 soles por celular vendido y sobre estos ingresos los empleados deben aportar 
el 15% a su AFP. Calcule el promedio y la desviación estándar para el ingreso 
neto promedio semanal por empleado. 
9. Lossueldos de 150 trabajadores de una empresa tienen un coeficiente de variación 
del 5% en el mes de agosto. Para el mes de septiembre hay un aumento a cada 
trabajador del 20% de sus sueldos más una bonificación de $60 y el coeficiente de 
variación baja a 4%. 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 68 
a) Calcule la media y la desviación estándar de los sueldos del mes de agosto. 
b) ¿Cuánto dinero adicional necesita la empresa para pagar todos los sueldos del 
mes de septiembre? 
. 
10. El banco “Nuevo Continente” cuenta con sucursales en LA Molina y Los Olivos. El 
gerente de crédito selecciona al azar algunas solicitudes de préstamo que han sido 
aceptadas en cada una de las sucursales y resume de manera independiente la 
información correspondiente al monto de préstamo otorgado (en miles de nuevos 
soles) en los siguientes diagramas de tallos y hojas: 
 
Tallo y Hojas de La Molina N = 13 
Unidad de la Hoja = 0.10 
 
 1 4 3 
 4 4 678 
(4) 5 2244 
 5 5 5 
 4 6 4 
 3 6 99 
 1 7 4 
 
Tallo y Hojas de Los Olivos N = 14 
Unidad de la Hoja = 0.10 
 
 1 2 6 
 3 3 01 
 3 4 
 5 5 08 
 5 6 
 7 7 14 
 7 8 5 
 6 9 069 
 3 10 1 
 2 11 45 
a) Calcule e interprete las medidas de variabilidad para la sucursal de La Molina. 
b) ¿Qué conjunto de datos presenta mayor variabilidad? 
c) Para la sucursal de los Olivos el interés que cobra el banco corresponde al 5% 
del monto otorgado como préstamos más 20 nuevos soles por gastos 
administrativos. Mientras que para la sucursal de la Molina, se cobra 4.5% del 
monto otorgado. Se puede decir que el interés que cobra la sucursal La Molina es 
menos variables que el que cobra los Olivos. 
 
11. En el mes de Marzo el sueldo promedio de los trabajadores del Sector Educación 
fue de $180 dólares. Para el mes de Abril se considera un aumento del 25% con 
respecto al sueldo del mes anterior más un adicional de $40 dólares. Si el 
coeficiente de variación del mes de Marzo fue de 0.15. ¿Se puede afirmar que la 
distribución de sueldos en Marzo fue más homogénea? 
 
12. Los sueldos de 150 trabajadores de una empresa tienen un coeficiente de variación 
del 5% en el mes de agosto. Para el mes de septiembre hay un aumento a cada 
trabajador del 20% de su sueldo más una bonificación de $60 y el coeficiente de 
variación baja a 4%. 
a) Calcule la media y la desviación estándar de los sueldos del mes de agosto. 
b) ¿Cuánto dinero adicional necesita la empresa para pagar todos los sueldos del 
mes de septiembre? 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 69 
Preguntas de Autoevaluación 
 
1. La medida de variabilidad que mide la amplitud del 50% central de los datos, se 
denomina ___________________________________________. 
2. La medida de variabilidad para medir el grado de homogeneidad del peso y talla de 
una muestra de 100 estudiantes es _____________________________ 
3. ________________ es una medida de variabilidad que es afectada por valores 
extremos. 
4. Si el cv=30% y el promedio es 2, entonces para Y=5-2X, su cv es igual a 
________________________ 
5. Se sabe que en una muestra de 50 familias de una zona rural, 25 tienen 6 hijos, 15 
tienen 5 hijos, 8 tienen 4 hijos y el resto 3 hijos. Entonces el coeficiente de variación 
del número de hijos es igual a ___________________________. 
6. Se tiene que el sueldo de los 120 trabajadores de una empresa tiene un coeficiente 
de variabilidad del 8% en el mes de julio. Para el mes de agosto hay un aumento 
para cada trabajador del 25% de su sueldo más una bonificación de $40, lo cual 
hace que el coeficiente de variabilidad sea del 4%. La media y la desviación 
estándar de los sueldos del mes de agosto son ____________ y ______________. 
7. Si las variables X e Y son independientes y para a y b constantes, entonces la 
Var(aX + bY) es igual a __________________________ 
8. En una distribución simétrica la mediana es 4 y el coeficiente de variabilidad es 
20%. El valor de la desviación estándar es ______________________. 
9. Si se sabe que en una plantación foresta, el 25% de los árboles tienen un diámetro 
menor a 0.85 cm y el 25% mayores a 0.92 cm. Entonces, la amplitud del 50% 
central de los diámetros es igual a _________________________. 
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados: 
 
Item Enunciado V/F 
a. Si a cada valor de una variable se le multiplica por una constante (k), 
entonces el coeficiente de variación resulta multiplicado por k. 
 
b. El coeficiente de variabilidad es una medida de dispersión relativa y 
siempre es positivo. 
 
c. La desviación estándar es una medida que permite comparar dos 
conjuntos de datos que presentan diferentes unidades. 
 
d. La unidad de medida de la variancia siempre está al cuadrado. 
e. La desviación estándar está afectada por las unidades de medida. 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 70 
CAPÍTULO V 
 
MEDIDAS DE ASIMETRÍA 
 
Las medidas de asimetría permiten determinar la forma de una distribución para un 
conjunto de datos en lo que se refiere a su simetría o asimetría. 
 
Objetivo. Al finalizar este capítulo el lector debe ser capaz de cuantificar e interpretar 
la simetría o asimetría de una distribución. 
 
5.1 Formas de una Distribución 
 
 Distribución simétrica. Un conjunto de datos muestra una distribución simétrica, 
si su curva guarda simetría con respecto al centro de los datos. Si la distribución es 
simétrica entonces Me  . 
 Distribución asimétrica positiva. Si un conjunto de datos muestra una 
distribución asimétrica positiva o con cola a la derecha, entonces: Me  . 
 Distribución asimétrica negativa. Si un conjunto de datos muestra una 
distribución asimétrica negativa o con cola a la izquierda, entonces: Me  . 
 
Ejemplo 1 
Los siguientes gráficos corresponden a la distribución de los ingresos mensuales (miles 
S/.) de muestras al azar de los clientes de tres sucursales (A,B y C) de una caja rural. 
 
Sucursal A Sucursal B Sucursal C 
 
X me X me X me 
 
 
 
 
 Las relaciones entre la media y la mediana descritas anteriormente, se cumplen con 
distribuciones unimodales (una sola moda). 
 
5.2 Coeficiente de asimetría de Pearson 
Poblacional: 
 

 Me
As


3
 Muestral: 
 3 X me
as
s

 
Propiedades 
 
1. Si as = 0 entonces la distribución es simétrica. 
2. Si as < 0 entonces la distribución es asimétrica negativa o a la izquierda. 
3. Si as > 0 entonces la distribución es asimétrica positiva o a la derecha. 
 
Un mayor (menor) valor del coeficiente de asimetría de Pearson indica un mayor 
(menor) grado de asimetría de la distribución de los datos. 
 
Distribución simétrica Distribución asimétrica positiva 
o hacía la derecha 
Distribución asimétrica negativa 
o hacía la izquierda 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 71 
Ejemplo 2 
Recordemos los datos de los ingresos mensuales del Banco Comercial que se trabajaron 
en la parte de organización de datos. Con esa información se tienen los siguientes 
valores: 5.350 , 4.700 , 2.181x me s   . 
Por lo tanto 
 3 5.350 4.700
0.8941 0
2.181
as

   , entonces la distribución de los ingresos 
mensuales tiene una asimétrica positiva. 
 
Ejercicio 1. Se desea realizar un estudio sobre la utilización del agua en tres zonas 
rurales (A, B y C). Con esta finalidad se ha seleccionado al azar 8 casas de la zona A, 6 
de la zona B y 10 de la zona C. Luego se registró el número de litros de agua 
consumidos por un día, los cuales se presenta en el siguiente cuadro: 
 
Zonas Número de litros de agua consumidos por día 
A 
B 
C 
150 135120 110 160 180 155 165 
135 110 105 125 750 140 
100 110 115 280 130 140 175 120 130 145 
 
 
Cálculo de medidas estadísticas con el MINITAB 
 
Estadísticas Descriptivas 
 
Variable N Media Mediana StDev 
Zona A 8 146.88 152.50 23.59 
Zona B 6 228 130 256 
Zona C 10 144.5 130.0 52.0 
 
Variable Minimo Maximo Q1 Q3 
Zona A 110.00 180.00 123.75 163.75 
Zona B 105 750 109 293 
Zona C 100.0 280.0 113.8 152.5 
 
Calcule e interprete el coeficiente de asimetría de Pearson para el número de litros de 
agua consumidas para cada zona 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 72 
5.3 Diagrama de cajas (Box plot) 
 
El diagrama de cajas (Box plot) es una técnica gráfica que nos permite determinar: 
1. Los valores extremos (outliers), valores atípicos o datos discordantes. 
2. La asimetría de la distribución que corresponde al 50% central de los datos. 
3. La variabilidad del 50% central de dos o más conjuntos de datos. 
 
*
Valor Outlier
Tercer 
Cuartil (Q3)
El bigote superior
se extiende al valor
más alto que
pertenece al
intervalo de
seguridad superior
Mediana
Primer
Cuartil (Q1)
El bigote inferior se
extiende al valor ás
bajo que pertenece
al intervalo de
seguridad inferior 
 
 La caja contiene información del 50% de los datos ya que la línea inferior de la caja 
es el primer cuartil (Q1 = P25), y la línea superior de la caja es el tercer cuartil (Q3 = 
P75). 
 La línea que divide a la caja es la mediana y su posición dentro de ella nos brindará 
información sobre la asimetría de la distribución del 50% central de datos. 
 Los bigotes son las líneas que se extienden de la parte inferior y superior de la caja 
hasta la observación más alta o más baja dentro de los intervalos de seguridad. 
 
Interpretación del diagrama de cajas: 
 
1. Respecto a la Simetría o Asimetría. Para evaluar la asimetría en el 50% central 
de los datos se observa la posición de Q2 = P50 
 
 Si Q2 está próximo a Q1, entonces la distribución de los datos presentan una 
asimetría positiva o hacía la derecha. 
 Si Q2 está próximo a Q3, entonces la distribución de los datos presentan una 
asimetría negativa o hacía la izquierda. 
 Si Q2 está en medio de Q1 y Q3, entonces la distribución de los datos 
presentan una simetría. 
 
2. Respecto a la variabilidad. En el punto referido a la variabilidad sólo es aplicable 
al caso cuando se comparan dos o más distribuciones a través de la longitud (largo) 
de sus respectivas cajas. Presenta mayor variabilidad la distribución que tenga 
mayor longitud de caja, sin embargo, se debe advertir que este criterio para 
evaluar la variabilidad alcanza únicamente a la distribución del 50% central de 
datos. 
 
3. Respecto a datos outliers. Son observaciones fuera de los límites inferior y/o 
superior y que se representan con asteriscos (*). 
 
Intervalo de seguridad inferior ISI = Q1 – 1.5 (Q3 - Q1) = Q1 – 1.5 RIC 
Intervalo de seguridad superior ISS = Q3 + 1.5 (Q3 - Q1) = Q3 + 1.5 RIC 
 
Si Xi < ISI, entonces Xi es un dato atípico pequeño u outliers pequeño. 
Si Xi > ISS, entonces Xi es un dato atípico alto u outliers alto. 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 73 
Ejemplo 3 
Se tienen los pesos de 10 personas del aula A: 50, 52, 53, 54, 63, 64, 75, 76, 85, 120. 
Con estos datos se obtiene P25 = 52.75, P50 = me = 63.5, P75 = 78.25, RI = Q3-Q1 = 
25.5 
Luego se calculan los intervalos de seguridad inferior y superior. 
ISI = P25 – 1.5 RI = 52.75 – 1.5 (25.5) = 14.5 
ISS= P75 + 1.5 RI = 78.25 + 1.5 (25.5) = 116.5 
 
Un valor es extremo si es menor que 14.5 o mayor que 116.5 
120
110
100
90
80
70
60
50
Pe
so
 A
 
 
Se aprecia que hay un outlier o valor extremo superior (120 Kg.  116.5) que se 
representa con un asterisco (*). En el caso inferior no existe ningún valor menor al 
límite inferior (14.5). 
 
El límite superior es 116.5. El bigote superior llega hasta el valor adyacente más alto 
dentro del límite superior (78.25 a 116.5). En nuestro ejemplo el bigote superior llega 
hasta 85. 
 
El límite inferior es 14.5. El bigote inferior llega hasta el valor adyacente más bajo 
dentro del límite inferior (14.5 a 52.75). En nuestro ejemplo el bigote inferior llega 
hasta 50. 
 
La asimetría del 50% central de los datos es positiva. 
 
Ejemplo 4 
Si se tienen los pesos de 10 personas del aula B: 54, 54, 54, 55, 55, 55, 55, 56, 56, 56. 
Entonces P25 = 54, P50 = 55, P75 = 56, RI = 2, ISI = 51, ISS = 59. 
Peso BPeso A
120
110
100
90
80
70
60
50
 
 
Peso A representa la caja del ejemplo anterior y Peso B la caja del ejemplo que se 
está presentando. Se observa que en Peso B no hay valores extremos y que una caja 
más grande representa a datos más variables (Peso A es más variable que Peso B). 
Peso B es simétrica (se verifica que Kgxme 55 ) 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 74 
Ejercicio 2. Se sabe que un determinado contaminante industrial vertido sobre un 
ecosistema fluvial genera en las truchas anticuerpos. Se cree que el número de 
anticuerpos por cada unidad de sangre, puede ser distinta entre truchas hembras y 
machos, por lo que se ha seleccionado de un criadero de truchas, ubicado cerca de una 
industria que vierte el contaminante, una muestra de 70 truchas de las cuales 40 son 
hembras y 30 machos. Los datos obtenidos se resumen a continuación, según el grupo 
de hembras o machos. 
 
Gráfico de tallo y hojas para: Estadísticas descriptivas para: 
Hembras N = 40 
 
Machos 
 
 
Unidad de hoja: 10 
 
 
 
 
3 2 223 
 
Mean SE Mean StDev Minimo 
6 3 568 
 
673.0 45.2 247.8 290.4 
12 4 236899 
 
 
 
 
19 5 0112249 
 
Q1 Median Q3 Maximo N 
(10) 6 0034456788 
 
476.6 689.2 833.3 1200 30 
11 7 33779 
 
 
 
 
6 8 9 
 
 
 
 
5 9 08 
 
 
 
 
3 10 00 
 
 
 
 
1 11 
 
 
 
 
1 12 
 
 
 
 
1 13 4 
 
a. Complete el siguiente diagrama de cajas. 
 
Cálculos: 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 75 
b. Realice una comparación acerca de la posición, variabilidad, simetría para el 50% 
central y outliers de ambos sexos. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Ejercicio 3. Se ha desarrollado un experimento para evaluar el efecto de alimentos 
balanceados en la ganancia de pesos de pollos. Una muestra de 30 recibió el alimento A 
y otra muestra de 60 pollos el alimento B. Al cabo de 10 días se registraron la ganancia 
de pesos (en gr) 
 
Alimento A 
 
 
 
Alimento B 
Talloy Hojas de Alimento B N = 60 
Unidad de Hoja = 1,0 
 2 12 34 
 11 12 566788999 
 24 13 0000000011133 
(12) 13 566678889999 
 24 14 001123 
 18 14 5669 
 14 15 0122 
 10 15 788899 
 4 16 0123 
 
Variable N Media StDev CoefVar Minimo Q1 Mediana Q3 Maximo 
A 30 117,40 11,57 9,85 93,00 110,00 118,00 125,75 181,00 
B 60 139,60 11,46 8,21 123,00 130,00 138,00 148,25 163,00 
 
a. ¿Cuál de los dos tipos de alimentos es menos variable? (Considerando el 100% de 
los datos) 
 
 
 
 
 
 
 
 
93 98 100 102 107 109 110 110 111 111 113 114 115 116 118 
118 119 119 120 120 120 124 125 128 129 129 130 135 138 181 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 76 
b. Calcule e interprete el coeficiente de asimetría de Pearson para las ganancias de 
peso de los pollos alimentados con A y B. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
c. Construya un diagrama de cajas para las ganancias de peso de los pollos 
alimentados con A y B. Interprete y compare los diagramas de cajas. (respecto a la 
simetría en el 50% central de los datos, la variabilidad en el 50% de los datos y la 
presencia de datos outliers). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 77 
Práctica Dirigida N° 3 
 
1. Un ingeniero zootecnista está interesado en analizar algunas variables obtenidas de 
su criadero de patos para optimizar su producción en los próximos meses. Por este 
motivo, el ingeniero le solicita a usted su colaboración para apoyar en dicho estudio. 
 
Usted para realizar el estudio sugiere tomar muestras aleatorias e independientes de 
las razas de patos con las que se cuenta en la granja. Algunas variables a analizar 
son las siguientes: 
 
 Raza de pato: Muscovy (M), Pekín (P). 
 Peso vivo antes del sacrificio (en Kg.). 
 Presencia de enfermedad (Si, No) 
 
Algunos resultados obtenidos son: 
 
Tabla N°1. Peso (en Kg.) de los patos según raza. 
 
 
 Muscovy 
2.12 4.13 
2.2 4.19 
2.26 4.23 
2.29 4.31 
2.92 4.5 
3.06 4.51 
3.38 4.7 
3.76 4.74 
3.83 5 
3.95 5.01 
Diseño de tallo y hoja: Pekín 
Unidad de hoja = 0.010 
 
 2 21 37 
 3 22 0 
 3 23 
 5 24 99 
 6 25 0 
 7 26 6 
 14 27 0024559 
 24 28 0133457779 
(5) 29 04677 
 21 30 0134699 
 14 31 1238 
 10 32 38 
 8 33 4 
 7 34 27 
 5 35 6 
 4 36 118 
 1 37 5 
 
 
Tabla N°2. Medidas resumen para el peso (en Kg.) de los patos según raza 
 
Raza ix 
2
ix Q2 
Muscovy 75.09 299.7393 4.04 
Pekín 147.8 443.3536 2.92 
 
a. ¿Cuál debe ser el peso mínimo para que un pato de la raza Pekín sea 
considerado dentro del 30% de los patos con mayor peso? 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 78 
b. ¿Cuál es la raza que presenta la mayor variabilidad?. Justifique su respuesta. 
 
 
 
 
 
 
 
 
 
 
 
 
c. Si se sabe que el peso después del sacrificio en la raza Muscovy disminuye en un 
15.5% y en la raza Pekín se resta 0.85 kgs.. Se puede afirmar que el peso 
después del sacrificio de la raza Muscovy es más homogéneo que el de la raza 
Pekín. Justifique su respuesta. 
 
 
 
 
 
 
 
 
 
 
 
 
 
d. ¿Cuál es la forma de la distribución de los pesos para cada una de las razas? 
Justifique su respuesta. 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 79 
e. Complete el siguiente diagrama de cajas para el peso (en Kg.) según tipo de 
raza. Indique sus valores. 
 
 
 
Cálculos: 
 
 
 
 
 
 
 
 
 
f. Utilice el gráfico anterior para realizar un análisis comparativo de las 2 razas, de 
sus conclusiones acerca de la asimetría, variabilidad y valores atípicos. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
PekínMuscovy
5.5
5.0
4.5
4.0
3.5
3.0
2.5
2.0
1.5
D
at
o
s
Gráfica de caja de Muscovy, Pekín
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 80 
EJERCICIOS PROPUESTOS 
 
1. El siguiente gráfico (BoxPlot) muestra la información sobre el nivel de ventas 
durante el último mes (en cientos de dólares) del detergente “Blanquito” en 18 
tiendas seleccionadas al azar. Las tiendas fueron clasificadas de acuerdo a los 
niveles socioeconómicos Medio-Alto y Medio-Bajo a la cual pertenece. 
Medio-BajoMedio-Alto
7000
6000
5000
4000
3000
2000
1000
0
 
a) Señale en cuál de los dos estratos socioeconómicos se presenta una mayor 
variabilidad. 
b) Señale el tipo de asimetría que presentan las tiendas de cada uno de los estratos 
socioeconómicos. 
 
 
2. Una empresa que posee tres fábricas, ha observado el número de piezas diarias 
producidas por cada una de ellas durante diez días elegidos al azar, obteniéndose 
los siguientes resultados: 
 
 10
2
1
i
i
x

 
Fabrica A 103 106 105 102 108 109 101 110 105 107 111590 
Fabrica B 115 112 99 98 107 113 108 114 96 94 112100 
Fabrica C 92 97 103 89 106 108 116 87 128 130 113610 
 
a) Calcule e interprete la media y la mediana para el número de piezas diarias 
producidas por las fábricas A y C. 
b) La empresa recibe un pedidode 2111 piezas que debe ser entregado en un plazo 
de 20 días. ¿A cuál de las tres fábricas es más aconsejable encargarle el pedido? 
c) ¿Qué se puede afirmar acerca de la simetría de las piezas diarias producidas por 
la fábrica B? 
d) Elabore e interprete el diagrama de cajas para el número de piezas diarias 
producidas por las tres fábricas. 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 81 
3. En la granja de la UNALM, se realizó un estudio con la finalidad de comparar el peso 
en Kg. (a los dos meses de nacido), de dos razas de cuyes: Inti y Andina. Para 
llevarlo a cabo, se seleccionaron al azar muestras de cada una de las razas, 
obteniéndose los siguientes resultados: 
 
ANDINA INTI 
Tallo y Hojas de Andina 
Unidad de Hoja = 0.010 
 
 1 8 3 
 3 8 58 
 7 9 1234 
(5) 9 56679 
 3 10 1 
 2 10 5 
 1 11 
 1 11 5 
0.68 0.94 
0.89 0.95 
0.89 0.99 
0.89 0.99 
0.89 1.04 
0.89 1.09 
0.89 1.11 
0.90 1.11 
 
a) Halle e interprete la media y la moda para la raza Andina 
b) Construya el Diagrama de Cajas para la raza Andina, calcule sus componentes e 
indíquelo en el gráfico. 
 
 
c) Utilice el gráfico anterior para comparar la variabilidad y asimetría de las dos 
razas en estudio. 
 
4. Para determinar la efectividad de un programa de seguridad industrial se 
recogieron los siguientes datos (horas hombres - perdidas por mes) empleando dos 
programas distintos (A y B) durante 12 meses tomados al azar. 
 
Tallo y Hojas de Prog A N = 12 
Unidad de Hoja = 1.0 
 
 2 0 68 
 (6) 1 022223 
 4 1 569 
 1 2 
 1 2 6 
 
 
 Variable N Media StDev Minimo Q1 Mediana Q3 Maximo 
 Prog B 12 7.750 2.491 2.000 6.000 9.000 9.750 10.000 
 
a) ¿Cuál es la pérdida mínima de horas–hombres que debe tener el programa A 
para estar incluido en el 15% de lo que más horas-hombre pierden? 
b) Encontrar el rango intercuartílico del programa A. 
 
Pe
so
 (e
n 
kg
.)
IntiAndina
1.2
1.1
1.0
0.9
0.8
0.7
Diagrama de Cajas del Peso
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 82 
5. Se realizó un estudio en la provincia de Tambo Grande (Piura), luego de la 
aplicación de un nuevo abono en el cultivo de dos variedades de mango: Kent y 
Haden. Los rendimientos en la producción obtenidos luego de la cosecha en Kg/Ha 
fueron los siguientes: 
Variedades 
Variedad Kent Variedad Haden 
N° de 
Ha 
Rend. 
N° de 
Ha 
Rend. 
 
 Tallo y Hojas de Haden N = 22 
 Unidad de Hoja = 0.10 
 
 8 10 22388999 
 (6) 11 266888 
 8 12 2233 
 4 13 344 
 1 14 
 1 15 
 1 16 5 
 
1 9.0 12 13.1 
2 11.9 13 13.2 
3 12.6 14 13.5 
4 12.6 15 13.5 
5 12.6 16 13.7 
6 12.8 17 13.8 
7 12.8 18 13.8 
8 12.8 19 14.1 
9 12.9 20 14.1 
10 12.9 21 14.3 
11 13.1 22 15.1 
 
Variable N Mediana StDev Minimo Maximo 
Kent 22 13.100 1.164 9.00 15.10 
 
Variable N Media StDev Minimo Maximo 
Haden 22 11.836 1.422 10.20 16.50 
 
Elabore un diagrama de cajas múltiple y presente sus conclusiones. 
 
6. Lidercom es una institución dedicada a otorgar certificaciones de calidad ISO 9001 
a empresas de bienes y servicios. La Firme está en proceso de evaluación por esta 
institución y una de las tareas es medir la satisfacción del personal de la empresa 
mediante una prueba con escala de 0 a 100 puntos. 
De una muestra de 40 trabajadores que laboran en la sede principal se 
obtuvieron las siguientes puntuaciones: 
74 89 82 83 67 81 68 85 81 72 
71 74 50 64 72 44 66 84 69 81 
69 66 93 53 98 70 95 82 81 80 
88 80 85 85 72 81 90 89 80 97 
a) Halle el rango intercuartíl (RI) de la distribución de la puntuación de los 
trabajadores de la sede principal. 
b) Usando el RI hallado en b, calcule el límite inferior y superior e indique si un 
valor es atípico (outlier) o no. 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 83 
7. Un ingeniero zootecnista está interesado en analizar algunas variables obtenidas de 
su criadero de patos para optimizar su producción en los próximos meses. Por este 
motivo, el ingeniero le solicita a usted su colaboración para apoyar en dicho 
estudio. 
 
Usted para realizar el estudio sugiere tomar muestras aleatorias e independientes de 
las razas de patos con las que se cuenta en la granja. Algunas variables a analizar 
son las siguientes: 
 
 Raza de pato: Muscovy (M), Pekín (P). 
 Peso vivo antes del sacrificio (en Kg.). 
 Presencia de enfermedad (Si, No) 
 
Algunos resultados obtenidos son: 
 
Tabla N°1. Peso (en Kg.) de los patos según raza. 
 
 
 Muscovy 
2.12 4.13 
2.2 4.19 
2.26 4.23 
2.29 4.31 
2.92 4.5 
3.06 4.51 
3.38 4.7 
3.76 4.74 
3.83 5 
3.95 5.01 
Diseño de tallo y hoja: Pekín 
Unidad de hoja = 0.010 
 
 2 21 37 
 3 22 0 
 3 23 
 5 24 99 
 6 25 0 
 7 26 6 
 14 27 0024559 
 24 28 0133457779 
(5) 29 04677 
 21 30 0134699 
 14 31 1238 
 10 32 38 
 8 33 4 
 7 34 27 
 5 35 6 
 4 36 118 
 1 37 5 
 
 
Tabla N°2. Medidas resumen para el peso (en Kg.) de los patos según raza 
 
Raza ix 
2
ix Q2 
Muscovy 75.09 299.7393 4.04 
Pekín 147.8 443.3536 2.92 
 
g. ¿Cuál debe ser el peso mínimo para que un pato de la raza Pekín sea 
considerado dentro del 30% de los patos con mayor peso? 
 
h. ¿Cuál es la raza que presenta la mayor variabilidad?. Justifique su respuesta. 
 
 
i. Si se sabe que el peso después del sacrificio en la raza Muscovy disminuye en un 
15.5% y en la raza Pekín se resta 0.85 kgs.. Se puede afirmar que el peso 
después del sacrificio de la raza Muscovy es más homogéneo que el de la raza 
Pekín. Justifique su respuesta. 
 
j. ¿Cuál es la forma de la distribución de los pesos para cada una de las razas? 
Justifique su respuesta. 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 84 
k. Complete el siguiente diagrama de cajas para el peso (en Kg.) según tipo de 
raza. Indique sus valores. 
 
 
 
 
l. Utilice el gráfico anterior para realizar un análisis comparativo de las 2 razas, de 
sus conclusiones acerca de la asimetría, variabilidad y valores atípicos. 
 
 
 
 
 
PekínMuscovy
5.5
5.0
4.5
4.0
3.5
3.0
2.5
2.0
1.5
D
at
o
s
Gráfica de caja de Muscovy, Pekín
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 85 
Preguntas de Autoevaluación 
 
1. Si el coeficiente de asimetría de Pearson es 0.00001, se dice que los datos 
presentan una distribución _______________________________. 
2. Si en un conjunto de datos la mediana es mayor que la media, entonces el 
coeficiente de asimetría de Pearson es ________________ y el conjunto de datos 
tiene una asimetría __________________________. 
3. La diferencia de RI y el coeficiente de asimetría de Pearson, es que el RI mide la 
asimetría considerando __________________________ mientras que el As 
considera el _____________________ de los datos. 
4. Si los cuartiles de los pesos (en kgrs.) de una muestra de 50 pollos son 1.9, 2.2 y 
3.4 respectivamente, entonces se puede afirmar que la distribución del 50% central 
de los pesos tiene ____________________________________. 
5. En un diagrama de cajas, para afirmar que la distribución del 50% central de los 
datos tiene una distribución asimétrica negativa, entonces se debe de cumplir que 
______________________________. 
6. Si en un diagrama de cajas no existen datos atípicos, entonces el bigote inferior y 
superior son ____________________________________ respectivamente. 
 
7. Si en un conjunto de datos, la mediana es 34.5% mayor que la media y elcoeficiente de variación es 45%, entonces el coeficiente de asimetría de Pearson es 
igual a _____________________________ 
8. Para mejorar los tiempos de atención en un Centro Comercial, sea determinado que 
los percentiles 25 y 75 de los tiempos de atención en el área de ropa femenina fue 
de 14.5 y 18.5 minutos y en área de ropa masculina fue de 6.5 y 12.5 minutos, 
entonces se puede decir que hay mayor variabilidad en el tiempo de atención en el 
área de ropa ____________________ porque _________________________. 
9. En una distribución simétrica, la mediana es igual a 6 y la desviación estándar es 
1.8, entonces el coeficiente de variación es igual a ________________________. 
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados: 
 
Item Enunciado V/F 
a. Los límites de seguridad son dibujados en el diagrama de cajas 
b. Si en un diagrama de cajas, Q2 está próximo a Q3, entonces la 
distribución de los datos presenta una asimetría negativa. 
 
c. Es similar usar el diagrama de cajas y el coeficiente de Pearson para 
medir la asimetría en un conjunto de datos. 
 
d. Cuando un conjunto de datos presenta una asimetría positiva, indica 
que los datos están concentrados en la parte izquierda. 
 
e. A partir de un diagrama de tallos y hojas se puede elaborar su 
diagrama de cajas. 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 86 
CAPÍTULO VI 
 
PROBABILIDAD 
 
La probabilidad se refiere al estudio de la aleatoriedad y la incertidumbre. En el mundo 
cotidiano las personas continuamente van tomando decisiones desde las más simples 
hasta las más complejas, generalmente en condiciones de incertidumbre. La teoría de 
probabilidad nos proporciona métodos y técnicas adecuadas para cuantificar la 
incertidumbre por lo que es una herramienta importante en la toma de decisiones. 
 
Es común escuchar o leer expresiones como: 
 
a. Es probable que el índice inflacionario se mantenga durante los próximos dos 
meses. 
b. Hay un 50% de posibilidades de que el alcalde del distrito “X” busque 
reelegirse. 
c. Probablemente el próximo ciclo se ofrecerá por lo menos 7 grupos de ese curso. 
d. Se espera que por lo menos se vendan 15000 boletos para el partido de fútbol. 
 
Objetivo. Conocer los conceptos básicos de las probabilidades; las reglas o axiomas 
que la sustentan, así como, sus aplicaciones como medida de cuantificación de la 
incertidumbre. 
 
6.1 Revisión de técnicas de conteo 
 
La regla del producto para n-uplas 
 
Supóngase que un conjunto está formado por grupos ordenados de n elementos (n-
upla) y que hay n1 posibles opciones para el primer elemento; por cada opción del 
primer elemento hay n2 posibles opciones del segundo elemento;...; por cada posible 
opción de los primeros n – 1 elementos hay nk opciones del elemento n. 
 
Entonces hay: n1 x n2 x ... x nk posibles n – uplas. 
 
Ejemplo 1 
El propietario de una casa desea efectuar algunas remodelaciones y requiere los 
servicios de un distribuidor de utensilios de cocina, de un contratista plomero y de un 
contratista electricista. Si, en la zona, hay 8 distribuidores de utensilios de cocina, 10 
contratistas plomeros y 5 contratistas electricistas. ¿De cuántas formas se pueden 
seleccionar estos tres servicios? 
 
Sea el evento A = {seleccionar los tres servicios} 
n(A) = n1 n2 n3 = (8)(10)(5) = 400 3-uplas de la forma (Ui, Pj, Ek), así que hay 400 
formas de seleccionar primero un distribuidor de utensilios de cocina, luego un plomero 
y, finalmente un electricista. 
 
Ejercicio 1. Un menú consta de tres platos; una entrada, un segundo y un postre. Si 
en la lista figuran 2 clases de entrada, 3 clases de segundo y 2 tipos de postre. ¿De 
cuántas formas se puede seleccionar los tres platos del menú? 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 87 
La regla de la adición 
Si un experimento 1 ocurre de n1 formas, 2 de n2, ….., k de nk formas; entonces el 
experimento  que consiste en realizar 1 ó 2 ó ….. k (los experimentos no pueden 
realizarse juntos) ocurre de n1 + n2 + … + nk formas. 
 
Ejercicio 2. Un producto se vende en 3 mercados. En el primer mercado se tienen 
disponibles 5 tiendas, en el segundo 4 y en el tercer mercado, 6 tiendas. ¿De cuántas 
maneras puede venderse el producto? 
 
 
 
 
 
Permutaciones 
 
Cualquier secuencia ordenada de n objetos tomados de un conjunto de N objetos 
distintos se llama permutación de tamaño n de los objetos. El número de 
permutaciones de tamaño n que puede construirse con los N objetos (donde sí 
importa el orden) se obtiene por la regla del producto de la siguiente manera: 
 
     1221  nNnNNNNPNn  
Utilizando factoriales se obtiene: 
  !
!
nN
N
PNn

 
 
Ejemplo 2 
En un campeonato de fútbol participan 12 equipos ¿De cuántas maneras se pueden 
ocupar los tres primeros puestos? 
 
Sea el evento A = {Número de maneras que puede ocupar los 3 primeros puestos} 
Total de equipos : N = 12 
Seleccionar 3 equipos: n= 3 
 
N (A) = 1320101112
12
3 P 
 
Ejercicio 3. Un club social está formado por 10 personas. ¿De cuántas maneras se 
puede formar una comisión integrada por un presidente, un secretario y un vocal? 
 
 
 
 
 
 
 
Casos especiales: 
 
a) Permutaciones de N en N ! ( 1)( 2)...1
N
NP N N N N    
 
Ejemplo 3 
Se tiene un grupo de 5 caballos para alquiler. Si llegan 5 personas para alquilar un 
caballo cada una de ellas ¿De cuántas maneras se puede hacer el alquiler? 
 
5
5 5! 5(5 1)(5 2)...1 120 manerasP      
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 88 
b) Permutaciones con repetición. El número de permutaciones de N elementos, de 
los cuales son iguales entre si N1, N2, N3,..., Nk y donde N = N1+ N2 + N3 +...+ Nk, 
está dado por: 
1, 2, ...
1 2
!
! !... !k
N
N N N
k
N
P
N N N
 
 
Ejemplo 4 
En la casa comercial “El Palco” hay 4 sinfonías N° 9 de Beethoven, 5 Sinfonías N° 100 
de Haydn y 6 Sinfonías N° 36 de Mozart. Suponga que se seleccionan con restitución y 
considerando el orden de extracción 8 de estas obras maestras. 
 
a. ¿De cuántas maneras serán seleccionadas 5 sinfonías de Beethoven y 3 de Haydn? 
 
  5 3 8 5 35,3
8!
4 5 4 5 7168000
5! 3!
n A P      

 
b. ¿De cuántas maneras serán seleccionadas 2 sinfonías de Beethoven, 2 de Haydn y 4 
de Mozart? 
  2 2 4 8 2 2 42,2,4
8!
4 5 6 4 5 6 217728000
2! 2! 4!
n A P        
 
 
 
Combinaciones 
 
Dado un conjunto de N objetos distintos, cualquier subconjunto no ordenado de tamaño 
n de los objetos se llama combinación y se denota de la siguiente manera: 
 
  !!
!
nNn
N
n
N







 
 
Cuando haya N objetos distintos, cualquier permutación de tamaño n se obtiene al 
ordenar los n objetos no ordenados de una combinación en una de n! formas (donde 
no importa el orden), así: 
 
 !!
!
!
!
nNn
N
n
P
n
N
n
n
N
P
N
nN
n













 
 
Ejemplo 5 
Al poco tiempo de ser puestos en servicio, algunos autobuses fabricados por cierta 
compañía presentan grietas en la parte inferior del bastidor principal. Suponga que una 
ciudad tiene 18 de estos autobuses, y que han aparecido grietas en 5 de ellos. 
 
a. ¿De cuántas formas se puede seleccionar sin restitución y sin considerar el orden 
una muestra de 7 autobuses de los 18 para una inspección completa? 
Sea el espacio muestral  entonces   31824
!11!7
!18
7
18






n 
 
b.¿En cuántas formas puede una muestra de 7 autobuses contener exactamente 3 
con grietas visibles si la selección es hecha sin restitución y sin considerar el orden 
de extracción? 
Sea el evento A = {una muestra de 7 autobuses contiene exactamente 3 con 
grietas} 
 
   7150
4
13
3
5












An 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 89 
Ejercicio 4. Un club de Karate tiene 10 deportistas de los cuales 4 son cinturones 
negros 
 
a. ¿De cuántas maneras puede escoger sin restitución y sin considerar el orden de 
extracción a cinco karatecas para participar en un torneo? 
 
 
 
 
 
 
 
b. ¿De cuántas maneras puede escoger sin restitución y sin considerar el orden de 
extracción a cinco karatecas de tal manera que hayan 2 cinturones negros? 
 
 
 
 
 
 
 
 
6.2 Conceptos básicos de probabilidad 
 
Experimento aleatorio (E) 
 
Un experimento aleatorio es todo proceso que consiste en la ejecución de un acto (o 
prueba) una o más veces (en las mismas condiciones) y cuyo resultado en cada prueba 
depende del azar (no se pueden predecir con certeza) pero que sin embargo, se pueden 
describir sus posibles resultados. 
 
Ejemplo 6 
Suponga los siguientes experimentos aleatorios: 
E1 : Observar el número de la cara superior cuando se lanza un dado 
E2 : Registrar el sexo del recién nacido 
E3 : Observar el número de artículos defectuosos de un lote de 8. 
E4 : Anotar el número de clientes que llegan a un supermercado en una semana 
E5 : Observar el tiempo de duración de un foco de luz (horas) 
 
Espacio muestral () 
El espacio muestral es el conjunto de todos los posibles resultados (llamados puntos 
muestrales) de un experimento aleatorio. Se considera a  es el conjunto universal. 
Pueden ser Discreto (Finito o Infinito numerables) o Continuo (Infinito No numerables). 
La cardinalidad de  (número de elementos de un conjunto) se denota n(). 
 
Ejemplo 7 
Los espacios muestrales asociados a los anteriores experimentos aleatorios son: 
 
 Cardinalidad Espacio muestral 
E1: 1 = {1,2,3,4,5,6} n(1)=6 Finito 
E2: 2 = {Hombre, Mujer} n(2)=2 Finito 
E3: 3 = {0,1,2,3,4,5,6,7,8} n(3)=9 Finito 
E4: 4 = {0,1,2,. . . .} n(4)= ∞ Infinito numerable 
E5: 5 = {T/ 0 ≤ t < ∞} n(5)= ∞ Infinito no numerable 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 90 
Ejemplo 8 
Si se observan los sexos de tres niños recién nacidos, el espacio muestral asociado 
será: 
 
  = {MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF}, siendo: n(Ω)=8 
 
Ejemplo 9 
Considere dos fábricas tales que en cada una hay 6 máquinas que fabrican un producto. 
Sea el experimento aleatorio que consiste en determinar el número de máquinas que 
están en uso en un día particular. Un resultado experimental indica cuántas máquinas 
están en uso en la primera fábrica y cuantas están en uso en la segunda (asuma que 
los resultados son igualmente posibles). El espacio muestral  será igual a: 
 
 Segunda fábrica 
0 1 2 3 4 5 6 
 
 
Primera 
 fábrica 
0 (0, 0) (0, 1) (0, 2) (0, 3) (0, 4) (0, 5) (0, 6) 
1 (1, 0) (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6) 
2 (2, 0) (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6) 
3 (3, 0) (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6) 
4 (4, 0) (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6) 
5 (5, 0) (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6) 
6 (6, 0) (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6) 
 
 
Eventos 
Un evento es cualquier subconjunto de un espacio muestral. Se dice que un evento es 
simple si está formado exactamente por un resultado y compuesto si consta de más de 
un resultado. La cardinalidad de un evento se denota por: n(A) 
 
Ejemplo 10 
Si se observan los sexos de tres niños recién nacidos, el espacio muestral asociado 
será: 
 
  = {MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF} n() = 8 
 
Hay 8 eventos simples. 
 
 Posibles eventos simples: A={MMF} y B = {FMF}. 
 
 Posibles eventos compuestos: 
 
C = {MFF, FMF, FFM} = {exactamente un bebe es de sexo masculino} 
D = {MMM, FFF} = {los tres bebes son del mismo sexo} 
 
Ejemplo 11 
Con relación al ejemplo 9, hay 49 eventos simples. Ejemplos de eventos compuestos 
son: 
 
E = {(0, 0), (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} = {el número de máquinas en 
uso es el mismo para ambas fábricas} 
 
F = {(0, 3), (3, 0), (1, 2), (2, 1)} = {el número total de máquinas en uso es tres} 
 
G = {(0, 0), (0, 1), (1, 0), (1, 1)} = {a lo sumo una máquina está en uso en cada 
fábrica} 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 91 
Eventos mutuamente excluyentes 
 
Los eventos A y B son mutuamente excluyentes (o disjuntos) si no tienen resultados en 
común. O sea BA . Generalizando: Los eventos A1, A2,..., Ak son mutuamente 
excluyentes si: kjiAA ji ,,2,1   
 
Ejemplo 12 
En el Ejemplo 11 los eventos E y F son mutuamente excluyentes en cambio los eventos 
E y G no son mutuamente excluyentes. 
 
Eventos colectivamente exhaustivos 
Los eventos A1, A2,..., Ak son colectivamente exhaustivos si 

k
k
j
j AAAA  21
1
 
Ejemplo 13 
En el Ejemplo 10 los eventos C y D no son colectivamente exhaustivos. 
 
Evento complementario 
 
Para un evento A definido sobre un espacio muestral , el evento complemento de A, 
denotado por Ac está compuesto por todos los elementos que no pertenecen al evento 
de A. Es decir, todo lo que le falta al evento A para ser el espacio muestral . Se 
cumple:  AAyAA
cc
 
 
Ejemplo 14 
En el ejemplo 5, para el evento C = {MFF, FMF, FFM} su complemento es Cc = {MMM, 
MMF, MFM, FMM, FFF} 
 
Ejercicio 5. Sea el experimento aleatorio observar el número de la cara superior 
cuando se lanza un dado. El espacio muestral:  = {1,2,3,4,5,6} 
 
Sean los siguientes eventos definidos: 
El número observado es impar: A1 = {1,3,5} 
El número observado es par: A2 = {2,4,6} 
El número observado mayor a 4: A3 = {5,6} 
 
a. Defina eventos mutuamente excluyentes y no mutuamente excluyentes 
 
 
 
 
 
b. Defina eventos colectivamente exhaustivos y no colectivamente exhaustivos 
 
 
 
 
 
 
c. Defina eventos complementarios 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 92 
6.3 Definiciones de probabilidad de un evento 
 
Definición clásica de probabilidad (a priori) 
 
Si el experimento aleatorio con espacio muestra  , tiene  n resultados posibles y 
si  An de tales resultados corresponden a un evento A, entonces, siempre que los 
eventos simples de  sean mutuamente excluyentes e igualmente posibles, la 
probabilidad de que ocurra A es: 
 
 
 
 
  posiblescasosdeNúmero
favorablescasosdeNúmero
n
An
AP 

 
 
Se dice que es a priori por que antes de realizarse el experimento se puede determinar 
cuál es la probabilidad de que ocurra A. 
 
Ejemplo 15 
Se tienen 4 cuyes de tipo I, 6 de tipo II y 7 de tipo III. Cinco cuyes son seleccionados al 
azar. 
 
Tipo I: 4 cuyes 
Tipo II: 6 cuyes 
Tipo III: 7 cuyes 
 
1. ¿Cuál es la probabilidad de que 2 de los cuyes seleccionados sean de tipo I y los 
otros 3 de otro tipo si la selección es sin restitucióny sin considerar el orden de 
extracción? 
 
El experimento aleatorio consiste en seleccionar, sin restitución y sin considerar el 
orden de extracción, 5 cuyes de un total de 17. El espacio muestral asociado a este 
experimento tendrá   6188
5
17













n
N
n puntos muestrales. 
Sea el evento R = {obtener 2 de tipo I y 3 de otro tipo} 
  1716
3
13
2
4












Rn entonces:  
 
 
2773.0
6188
1716



n
Rn
RP 
 
2. Calcule la probabilidad de seleccionar 2 cuyes de tipo I, 3 de tipo II y 4 de tipo III si 
la selección es sin restitución y sin considerar el orden de extracción. 
 
Sea el evento R = {obtener 2 de tipo I, 3 de tipo II y 4 de tipo III} 
 
 
 
4 6 7
2 3 4
17
9
n R
P R
n
   
   
    
  
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 93 
Ejercicio 6. Una urna contiene 8 bolas blancas y 6 bolas negras. Si se extraen al azar y 
sin reemplazo 5 bolas de la urna. ¿Cuál es la probabilidad de que dos bolas sea de color 
blanco? 
 
 
 
 
 
 
 
 
Ejercicio 7. Si se considera igualmente probable el nacimiento de un niño o una niña, 
en una familia que tiene tres hijos, ¿Cuál es la probabilidad de que 
 
a. existan dos mujeres y un hombre? 
 
 
 
 
 
 
 
 
b. existan por lo menos dos mujeres? 
 
 
 
 
c. existan al menos un hombre? 
 
 
 
 
 
 
 
 
Ejercicio 8. Se tiene un grupo con 8 ingenieros, 5 economistas y 4 matemáticos ¿Cuál 
es la probabilidad de que al seleccionar sin restitución 7 personas, existan 3 ingenieros, 
2 economistas y 2 matemáticos? 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 94 
Definición frecuencial de probabilidades (a posteriori) 
 
Si un experimento aleatorio se repite n veces, bajo las mismas condiciones, y nA 
resultados corresponden al evento A, la probabilidad estimada de A está dada por la 
frecuencia relativa del evento; es decir,  
n
n
frestimadaAP AA  . Teóricamente la 
probabilidad de A es:  
n
n
frAP A
n
A
n 
 limlim . 
 
Se dice que es a posteriori por que la probabilidad estimada se determina después de 
realizarse el experimento. 
 
Ejemplo 16 
La siguiente tabla de frecuencias corresponde a las temperaturas promedio de 24 horas 
(C) registrados en cierto observatorio, en el mes de enero de cierto año: 
 
Temperatura 20.2-20.9 20.9-21.6 21.6-22.3 22.3-23.0 23.0-23.7 23.7-24.4 
Número días 1 3 12 13 1 1 
 
La probabilidad estimada que en un día del mes de enero, la temperatura promedio sea 
por lo menos 20.9 C pero menor que 23.0 C es  
31
28
31
13123432 




n
fff
AP . 
Note que esta probabilidad se obtiene después de realizarse el experimento. 
 
 
Definición axiomática 
 
Sea  el espacio muestral asociado a un experimento aleatorio. La probabilidad de 
cualquier evento A de , es el número real P(A) que satisface los siguientes axiomas: 
 
1.   10  AP , para todo evento A. 
2.   1P 
3. Si los eventos A1, A2, ..., Ak son mutuamente excluyentes o sea si: 
kjiAA ji ,,2,1   , entonces 
   )(...)()( 21
11
k
k
j
j
k
j
j APAPAPAPAP 









 
 
 
Propiedades de probabilidad 
 
1. Para cualquier evento A, P(Ac) = 1- P(A) , 
 
2. La probabilidad del evento imposible es cero.   0P 
 
3. Para dos eventos A y B cualesquiera      BAPBPBAP c  
 
4. Para dos eventos A y B cualesquiera        BAPBPAPBAP  
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 95 
Usando el Diagrama de Venn se tiene: 
 
Propiedades: 
        BAPBPAPBAP  
      BAPAPBAP c  
      BAPBPBAP c  
    BAPBAP cc  1 
    BAPBAP cc  1 
 
Ejemplo 17 
Los registros de una planta industrial indican que el 12% de todos los obreros 
lesionados ingresan a un hospital para recibir tratamiento, el 16% regresa al trabajo al 
día siguiente y el 2% ingresan a un hospital pero vuelven al trabajo al día siguiente. Si 
un obrero se lesiona: 
 
a. Halle la probabilidad de que ingrese en un hospital para recibir tratamiento o que 
regresará al día siguiente 
 
Sean los eventos: H = {un obrero lesionado ingresa a un hospital para 
tratarse} 
 T = {un obrero lesionado regresa al trabajo al día 
siguiente} 
 
Datos: P(H) = 0.12, P(T) = 0.16, P(HT) = 0.02 
 
Se pide P(HT) y por la propiedad 4: 
 
P(HT) = P(H) + P(T) - P(HT) = 0.12 + 0.16 – 0.02 = 0.26 
 
En un diagrama de Venn también se apreciaría lo anterior. 
 
b. Calcule la probabilidad de que ingrese a un hospital pero no regrese al trabajo al día 
siguiente. 
 
Se pide P(HTc) y por la propiedad 3: 
 
P(HTc) = P(H) - P(HT) = 0.12 – 0.02 = 0.1 
 
c. Determine la probabilidad de que no ingrese a un hospital ni regrese al trabajo al 
día siguiente. 
 
Se pide P(HcTc) entonces por Morgan y por la propiedad 1: 
 
P(HcTc) = P(HT)c = 1 - P(HT) = 1 – 0.26 = 0.74 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
BA cBA BA
c  
cc BA  
A B 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 96 
d. ¿Cuál es la probabilidad de que ingrese a un hospital o no regrese al trabajo al día 
siguiente? 
 
Por las propiedades 3, 2 y 4: 
 
P(HTc) = P(H) + P(Tc) - P(HTc) = P(H) + (1 – P(T)) – ( P(H) – P(HT) ) = 
 = 1 - P(T) + P(HT) = 1 - 0.16 + 0.02 = 0.86 
 
Ejemplo 18 
Se ha realizado una encuesta para determinar la adicción de alguna droga en diferentes 
profesionales. La encuesta se aplicó a 900 profesionales a los que se les preguntó si 
consumen alguna droga, los resultados se muestran en la siguiente tabla: 
 
Profesional Consume alguna droga Total 
 Si (S) No (Sc) 
Abogado (A) 40 210 250 
Contador (C) 60 190 250 
Ingeniero (I) 50 200 250 
Médico (M) 20 130 150 
Total 170 730 900 
 
Si se selecciona al azar a un profesional, halle la probabilidad que el profesional 
seleccionado: 
 
a. Sea un contador o un abogado 
  5556.00
900
250
900
250
)()()(  CAPCPAPCAP 
b. Sea médico y si consuma droga 
  0222.0
900
20
 SMP 
c. No sea ingeniero y si consuma droga 
      1333.0
900
206040
900
50
900
170


 SIPSPSIP c 
d. No consuma droga o sea abogado 
      8556.0
900
210
900
250
900
730
)(  ASPAPSPASP ccc 
 
 
Ejemplo 19 
Se encuestó a 500 alumnos universitarios sobre cultura musical. 474 no identifican el 
Concierto para piano y Orquesta de Grieg, 471 no identifican la Sinfonía N° 7 de 
Beethoven y 450 no identifican ninguna de estas obras. 
 
a. Calcule la probabilidad de que un estudiante universitario identifique las dos obras 
maestras en mención. 
 
Sean los eventos: A = {Un estudiante no identifica la obra de Grieg} 
 B = { Un estudiante no identifica la obra de Beethoven} 
 
Datos: P(A) = 474/500, P(B) = 471/500, P(AB) = 450/500 
 
P(AB) = P(A)+ P(B) - P(AB) = 495/500 
     
495
1 1 0.01
500
c c cP A B P A B P A B         
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 97 
b. ¿Cuál es la probabilidad que un estudiante identifique la obra de Beethoven pero no 
la de Grieg? 
 
     
474 450 24
0.048
500 500 500
cP A B P A P A B        
 
Ejercicio 9. Para un estudio sobre cultura general se encuestó a 500 estudiantes 
encontrándose que: 20 habían leído “Ficciones” de Borges; 24 habían leído “El libro 
de Arena” de Borges y 464 no habían leído estas dos obras geniales. Si se selecciona 
un estudiante al azar: 
 
a. ¿Cuál es la probabilidad que haya leído ambos libros? 
 
 
 
 
 
 
 
 
 
 
 
 
b. ¿Cuál es la probabilidad que haya leído “Ficciones” pero no “El Libro de Arena” 
 
 
 
 
 
 
Ejercicio 10. En una empresa textil se encuentran 60 hombres mayores de 28 años, 
65 hombres menores de 28 años, 45 mujeres mayores de 28 años y 30 mujeres 
menores de 28 años. Si se elige al azar una persona: 
 
a. ¿Cuál es la probabilidad de que sea hombre? 
 
 
 
 
 
 
 
 
b. ¿Cuál es la probabilidad de que sea menor de 28 años o sea hombre? 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 98 
c. ¿Cuál es la probabilidad de que no sea mayor de 28 años y sea mujer? 
 
 
 
 
 
 
 
Ejercicio 11. La unidad de rentas de un distrito de Lima, afirma que el 60% de los 
contribuyentes han pagado el predial, el 20% arbitrios y el 8% ambos impuestos. Si se 
selecciona un contribuyente al azar: 
 
a. ¿Cuál es la probabilidad que haya pagado el impuesto predial o el de arbitrios? 
 
 
 
 
 
 
 
 
 
 
 
b. ¿Cuál es la probabilidad que haya pagado el impuesto predial y el de arbitrios? 
 
 
 
 
 
 
c. ¿Cuál es la probabilidad que no haya pagado el impuesto predial y ni el de 
arbitrios? 
 
 
 
 
 
d. ¿Cuál es la probabilidad que haya pagado el impuesto predial y no el de arbitrios? 
 
 
 
 
 
e. ¿Cuál es la probabilidad que no haya pagado el impuesto predial o ni el de 
arbitrios? 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 99 
6.4 Probabilidad condicional 
 
Para dos eventos A y B de un espacio muestral, con P(B)  0, la probabilidad condicional 
de ocurrencia del evento A dado que el evento B ha ocurrido, está definida por: 
 
 
 
 BP
BAP
BAP

 
 
Ejemplo 20 
¿Qué es más probable? Que una persona cualquiera tenga cáncer pulmonar o que una 
persona que fuma tenga cáncer pulmonar. Según los especialistas la probabilidad de 
que tenga cáncer pulmonar una persona que fuma es mayor. 
 
Tenemos los eventos: A = {una persona tiene cáncer pulmonar} 
 B = {una persona fuma} 
 
De acuerdo a los especialistas    P A B P A 
 
 
Ejemplo 21 
La probabilidad que la construcción de un edificio termine a tiempo es 17/20, la 
probabilidad que no haya huelga es 3/4 y la probabilidad que la construcción se 
termine a tiempo dado que no hubo huelga es 14/15; la probabilidad que haya huelga y 
no se termine la construcción a tiempo es 1/10. ¿Cuál es la probabilidad que 
 
a) la construcción se termine a tiempo y no haya huelga? 
b) no haya huelga dado que la construcción se terminó a tiempo? 
c) la construcción no se termine a tiempo si hubo huelga? 
d) la construcción no se termine a tiempo si no hubo huelga? 
 
Solución: 
Definimos los eventos: 
A = La construcción se termina a tiempo. 
B = No haya huelga. 
 
 
Tenemos: 
10
1
)(
15
14
)/(
4
3
)(
20
17
)(  cc BAPBAPBPAP  
a) 7.0
4
3
*
15
14
)(*)/()(  BPBAPBAP  
b) 8235.0
20
17
10
7
)(
)(
)/( 
AP
BAP
ABP

 
c) 4.0
10
4
4
3
1
10
1
)(
)(
)( 


c
cc
c
c
BP
BAP
B
AP

 
d) 
0667.0
15
14
1)/(1
)(
)(
1
)(
)()(
)(
)(
)( 

 BAP
BP
BAP
BP
BAPBP
BP
BAP
B
AP
c
c 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 100 
Ejemplo 22 
En una universidad el 70% de los estudiantes, son de Ciencias y el 30% de Letras; de 
los estudiantes de Ciencias, el 60% son varones y los de Letras son varones el 40%. Si 
se elige aleatoriamente un estudiante. 
 
 Varones Mujeres Total 
Ciencias 42% 28% 70% 
Letras 12% 18% 30% 
Total 54% 46% 100% 
 
A = El estudiante elegido es de Ciencias. 
B = El estudiante elegido es varón. 
 
Calcular la probabilidad que: 
 
a) Sea un estudiante varón. P (B) = 0.54 
b) Sea un estudiante varón, si es de Ciencias. 
6.0
70.0
42.0
)(
)(
)/( 
AP
BAP
ABP

 
c) Sea un estudiante de Ciencias, si es varón. 
 
778.0
54.0
42.0
)(
)(
)/( 
BP
BAP
BAP

 
 
Propiedades de probabilidad condicional 
 
1.   1/0  BAP , para todo evento A y B 
2.   1/  BP 
3. Si los eventos A1, A2, ... , Ak son mutuamente excluyentes o sea si: 
kjiAA ji ,,2,1   , entonces  









 k
j
j
k
j
j BAPBAP
11
/ 
4. P(A/B) = 1- P(Ac /B) 
5.   0/ BP  
6.        CBAPCBPCBAP c ///  
7.          CBAPCBPCAPCBAP ////  
 
 
Ejercicio 12. Una empresa de turismo vende tres planes de viajes para la ciudad del 
Cusco y para la ciudad de Arequipa. En una encuesta realizada por internet, resultó la 
siguiente tabla de los porcentajes de clientes con las preferencias de los planes y las 
ciudades. 
 
Ciudad Plan 1 (P1) Plan 2 (P2) Plan 3 (P3) Total 
Cusco (C) 0.05 0.10 0.05 0.20 
Arequipa (A) 0.15 0.40 0.25 0.80 
Total 0.20 0.50 0.30 1.00 
 
Si se selecciona al azar a un cliente que ha sido encuestado por internet: 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 101 
a. ¿Cuál es la probabilidad de que desee viajar al Cusco y que no tenga preferencia por 
el Plan 1? 
 
 
 
 
 
 
b. Si el cliente no prefiere el Plan 2, ¿cuál es la probabilidad de que prefiera el Plan 3? 
 
 
 
 
 
 
 
c. Si el cliente no prefiere el Plan 1, ¿cuál es la probabilidad de que desee viajar a la 
ciudad de Arequipa? 
 
 
 
 
 
 
Ejercicio 13. Durante el mes de diciembre del año pasado, el50% de los clientes del 
centro comercial PLAZUELA compraron el producto “W”, el 40% compraron el producto 
“V”, y de los que compraron el producto “V”, el 20 % compraron el producto “W”. 
 
a. Si se elige un cliente al azar, encuentre la probabilidad de que no haya comprado 
estos productos. 
 
 
 
 
 
 
 
 
 
 
 
b. Si del grupo de clientes que no compraron el producto “W” se selecciona al azar un 
cliente, hallar la probabilidad de que haya comprado el producto “V”. 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 102 
Ejercicio 14. En la Facultad de Agronomía se ha determinado que el 10% de 
estudiantes son aficionados al tenis y el 20% son aficionados al fútbol. Se sabe que, 
entre los aficionados al fútbol el 75% no son aficionados el tenis. Si se selecciona un 
estudiante al azar, hallar la probabilidad: 
 
a. No sea aficionado al fútbol, pero le guste el tenis. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b. Que le guste sólo un deporte 
 
 
 
 
 
 
 
 
c. Le guste el tenis si se sabe que no es aficionado al fútbol. 
 
 
 
 
 
 
 
 
 
6.5 La regla de la multiplicación 
 
Se sabe que:  
 
 BP
BAP
BAP

 y  
 
 AP
BAP
ABP

 , de estas expresiones se 
 
establece que: 
     
   ABPAP
BAPBPBAP


 
 
Generalizando: Sean los eventos A1, A2, ... , Ak entonces: 
         121213121321  kkk AAAAPAAAPAAPAPAAAAP  
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 103 
Ejemplo 23 
Si se eligen al azar 2 artículos de un cargamento de 250, de los cuales, 20 están 
defectuosos. Halle la probabilidad de que ambos estén defectuosos si: 
 
a. La selección es sin reemplazo 
 
Sean los eventos: Di = {el artículo seleccionado en el lugar i está defectuoso} 
 
c
iD = {el artículo seleccionado en el lugar i no está defectuoso} 
      0061.0
249
19
250
20
12121 











 DDPDPDDP 
 
Otra manera de resolver este problema es con la definición clásica de probabilidad y 
utilizando las técnicas de conteo 
 
b. La selección es con reemplazo.(queda como ejercicio) 
 
Ejemplo 24 
Si se eligen al azar 3 artículos de un cargamento de 250, de los cuales, 20 están 
defectuosos. 
 
1. Halle la probabilidad de que los 3 estén defectuosos si: 
 
a. La selección es hecha sin reemplazo. 
        0004.0
248
18
249
19
250
20
213121321 

















 DDDPDDPDPDDDP 
b. La selección es con reemplazo.(queda como ejercicio) 
 
 
6.6 La ley de probabilidad total 
 
Sean los eventos A1,A2,...,Ak mutuamente excluyentes del espacio muestral Ω, esto es; 
kjiAA ji ,,2,1   , y colectivamente exhaustivos 

k
k
j
j AAAA  21
1
, 
entonces:  









 k
j
j
k
j
j APAP
11
 . Luego, para cualquier otro evento B definido: 
 
 
 
Entonces, la probabilidad del evento B, se calcula por: 
   


k
j
jk BAPBAPBAPBAPBP
1
21 )(...)()( . 
   


k
j
jjkk ABPAPABPAPABPAPABPAP
1
2211 )/()(...)/()()/()( 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 104 
6.7 Teorema de Bayes 
 
Sean los eventos A1, A2,..., Ak mutuamente excluyentes y colectivamente exhaustivos 
con   0jAP para j = 1, 2,..., k. Entonces para cualquier otro evento B para el que 
P(B)  0 : 
 
 
 
   
   




k
j
jj
hhh
h
ABPAP
ABPAP
BP
BAP
BAP
1
 
Como puede notarse en la igualdad anterior, se usa en el numerador la regla de la 
multiplicación y en el denominador la ley de probabilidad total. 
 
 
Ejemplo 25 
Suponga que una caja C1 contiene 4 esferas blancas y 2 azules y que otra caja C2 
contiene 4 esferas blancas y 6 azules. La probabilidad de elegir la caja C1 es el doble de 
probabilidad de elegir la caja C2. Si se elige al azar una caja y de ella se elige al azar 
una esfera, halle la probabilidad que: 
 
a) se elija una esfera azul si se sabe que esta proviene de la caja C2. 
b) se elija la caja C2 y la esfera es azul. 
c) se elija una esfera azul. 
d) se haya elegido la caja C2 si la esfera elegida fue azul. 
 
Solución 
2/3=P(C1)
1/3 =P(C2)
El
eg
ir 
la
 C
aj
a 
1
Elegir la Caja 2
Az
ul
Az
ul
Blanca
Blanca
2/6 = P(A/C1)
4/6 = P(B/C1) 
6/10 = P(A/C2)
4/10 = P(B/C2)
 
 
a) Se elija una esfera azul si se sabe que esta proviene de la caja C2 
 
 P(A/C2) =6/10 
 
 
b) Se elija la caja C2 y la esfera es azul 
 
 P(C2  A) = P(C2)*P(A/C2)=1/3 * 6/10 = 6/30 
 
c) Se elija una esfera azul 
 
 P(A)=P(C1  A)+P(C2  A)= 2/3 *2/6+1/3*6/10=8/15 
 
d) Se haya elegido la caja C2 si la esfera elegida fue azul 
 
8/3
15/8
30/6
)(
)(
)/( 22 


AP
ACP
ACP
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 105 
Ejemplo 26 
Los ingenieros de ventas 1, 2 y 3 estiman los costos de 30%, 20% y 50%, 
respectivamente, de todos los trabajos licitados por una compañía. Las probabilidades 
de cometer error grave, al estimar el costo, de los ingenieros son 0.01, 0.03 y 0.02 
respectivamente. 
 
a. Halle la probabilidad de que se cometa error grave al estimar el costo en una 
licitación. 
 
Sean los eventos: Ai = {el ing. “i” estima los costos de una licitación}, i = 1, 2, 3 
 E = {Se comete error grave al estimar el costo} 
 
Según los datos se tiene: 
 
     
      02.003.001.0
5.02.03.0
321
321


AEPAEPAEP
APAPAP
 
 
Aplicando la ley de probabilidad total: 
 
              019.001.0006.0003.0332211  AEPAPAEPAPAEPAPEP 
 
b. Si en una licitación en particular se incurre en un error grave al estimar los costos 
del trabajo. ¿Cuál es la probabilidad de que el ingeniero 2 haya cometido el error? 
 
Aplicando el teorema de Bayes y usando el resultado de la subpregunta a: 
 
 
   
 
3157.0
019.0
03.02.022
2 


EP
AEPAP
EAP 
 
c. Si en una licitación en particular no se incurre en un error grave al estimar los 
costos del trabajo. ¿Cuál es la probabilidad de que el ingeniero 3 haya hecho el 
trabajo? (se deja como ejercicio) 
 
Ejercicio 15. Una empresa manufacturera tiene dos máquinas (M1 y M2) para producir 
un producto. El área de control de calidad a determinado que la máquina M1 produce el 
60% de la producción total y la máquina M2 el restante. El 2% de las unidades 
producidas por la máquina M1 son defectuosos, mientras que la máquina M2 tiene una 
tasa de defectuosos del 4%. Si se selecciona un producto al azar: 
 
a. ¿Cuál es la probabilidad de que sea defectuoso?UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 106 
b. ¿Cuál es la probabilidad de que haya sido producido por la máquina M1, si se sabe 
que es defectuoso? 
 
 
 
 
 
 
c. ¿Cuál es la probabilidad de que no sea defectuoso? 
 
 
 
 
 
 
Ejercicio 16. En un vivero se tiene plantas de dos variedades (A y B) en un 35% y 
65% respectivamente. Se sabe que cierta plaga ataca al 1% de las plantas de la 
variedad A y al 3% de las plantas de la variedad B. 
 
a. ¿Cuál es la probabilidad de seleccionar una planta con plaga? 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b. Si se elige al azar una planta y se encuentra afectada por la plaga ¿Cuál es la 
probabilidad de que sea de la variedad B? 
 
 
 
 
 
 
 
c. Si se elige al azar una planta y no se encuentra afectada por la plaga ¿Cuál es la 
probabilidad de que sea de la variedad B? 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 107 
Ejercicio 17. El área financiera de una distribuidora de productos agrícolas ha 
observado que el 25% de las compras son pagadas en efectivo, el 30% son pagadas al 
crédito y el resto son pagadas con cheque. Se sabe que el 20% de las compras pagadas 
en efectivo, 60% de las compras a crédito y 90% de las compras pagadas con cheque; 
se hacen por un monto mínimo de $ 150. 
 
Si el agricultor Juan Pérez acaba de realizar una compra por un monto de $180, ¿cuál 
es lo más probable: qué haya pagado la compra, en efectivo, al crédito o con cheque? 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
6.8 Independencia de eventos 
 
Los eventos A y B son independientes si cuando ocurre uno de ellos esto no afecta la 
probabilidad de ocurrencia del otro, o sea: 
 
   
   BPABP
APBAP


 
 
En otras palabras, las probabilidades condicionales son iguales a las probabilidades 
incondicionales. 
 
Consecuencia: A y B son independientes si      BPAPBAP  . Lo anterior es un 
resultado de la definición de independencia y de la regla de la multiplicación. 
 
Teorema Si los eventos A y B son independientes entonces, también lo serán: 
1. A y Bc 
2. Ac y B 
3. Ac y Bc 
 
Entonces se cumple: 
   
   
   
      )()(
)(
)(
)(
BPAPBPAPBAP
BPAPBAP
BPAPBAP
BPAPBAP
cccc
cc
cc




 
 
Nota: Los eventos A1 y A2 son condicionalmente independientes si: 
     1 2 1 2P A A B P A B P A B  
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 108 
Ejercicio 18. En cierta ciudad la probabilidad de que llueva en un día cualquiera es 0.3 
y de que ocurra un temblor en un día cualquiera es 0.4. Si estos eventos son 
independientes. Calcule la probabilidad de que en un día cualquiera: 
 
a. Llueva y haya un temblor 
 
 
 
 
 
 
 
 
 
b. Llueva pero no haya un temblor 
 
 
 
 
 
 
 
c. Llueva o haya un temblor 
 
 
 
 
 
 
 
d. No llueva ni haya un temblor. 
 
 
 
 
 
 
 
e. Llueva dado que ocurrió un temblor. 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 109 
Ejemplo 27 
La probabilidad de que se presente determinada enfermedad es 1/500 y un test para 
detectarla es 99% confiable (esto quiere decir que si una persona tiene la enfermedad 
la probabilidad de que el test de positivo es 0.99 y si una persona no tiene la 
enfermedad la probabilidad de que el test de negativo es 0.99). 
 
a. Si a Ud. le resulta el test positivo ¿Cuál es la probabilidad de que Ud. tenga la 
enfermedad? 
Solución 
 
Sean los eventos: 
 
   
 
   
       
Ud. tiene la enfermedad , A Ud. le corresponde un test positivo
( / ) 0.99
Confiable en este contexto significa: 
( / ) 0.99
1
0.99
500 0.1655
1 499
0.99 0.01
500 500
c c
c c
B A
P A B
P A B
P B P A B
P B A
P B P A B P B P A B
 




  
   
 
 
b. Si a Ud. le resulta positivo en dos tests independientes ¿Cuál es la probabilidad de 
que Ud. tenga la enfermedad? 
 
Solución 
 
   
 
   
       
1 2
1 2
1 2 1 2
Ud. tiene la enfermedad , A Ud. le corresponde un test positivo en el test i
1
0.99 0.99
500 0.9516
1 499
0.99 0.99 0.01 0.01
500 500
i
c c
B A
P B P A A B
P B A A
P B P A A B P B P A A B
 

  
  
 
 
    
 
Note que aquí se ha trabajado la independencia condicional: 
     1 2 1 2P A A B P A B P A B  
 
 
Independencia de k eventos 
 
Utilizando la regla de la multiplicación generalizada y considerando independencia se 
obtiene la siguiente definición: los eventos A1, A2, ... , Ak son independientes si: 
 
       kk APAPAPAAAP  2121  
 
Cabe mencionar que el teorema anterior también se cumple con k eventos. 
 
Nota: Los eventos 1 2, , , kA A A son condicionalmente independientes si: 
       1 2 1 2k kP A A A B P A B P A B P A B    
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 110 
Ejercicio 19. En la fabricación de cierto artículo se encuentra que se presenta un tipo 
de defecto con una probabilidad de 0.05 y defecto de un segundo tipo con probabilidad 
0.10. Si estos defectos ocurren independientemente ¿Cuál es la probabilidad de que un 
artículo seleccionado al azar 
 
a. tenga ambos defectos? 
 
 
 
 
 
 
 
 
 
b. por lo menos tenga un defecto? 
 
 
 
 
 
 
 
 
c. Si se sabe que el artículo es defectuoso, halle la probabilidad de que este sólo 
tenga un tipo de defecto. 
 
 
 
 
 
 
 
 
Ejemplo 28 
En cierta población la probabilidad de que una chica mida más de 1.75 m es 0.08; de 
quetenga el cabello lacio es 0.22 y de que tenga un buen conocimiento de Estadística 
es 0.18. Si estas cualidades son independientes. 
 
a. Halle la probabilidad de que una chica, que va a ser seleccionada al azar, tenga las 
tres cualidades. 
 
Solución 
Sean los eventos: M = {la chica mide más de 1.75} 
 L = {la chica tiene cabello lacio} 
 E = {la chica tiene un buen conocimiento de estadística} 
 T = {la chica tiene las tres cualidades} 
 
          003168.018.022.008.0  EPLPMPELMPTP 
 
b. Halle la probabilidad de que una chica, que va a ser seleccionada al azar, tenga 
sólo 2 de estas cualidades. (queda como ejercicio) 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 111 
Práctica Dirigida N° 4 
 
1. Un grupo de psicólogos realizan un estudio sobre las redes sociales y su influencia 
en la juventud. Se toma una muestra aleatoria en un distrito de Lima y se analiza el 
tipo de red social y su frecuencia de uso. 
 
Frecuencia 
Red Social 
Total Menos de 3 
horas 
(T1) 
Mayor o igual a 3 horas, pero 
menor o igual a 6 horas 
 (T2) 
Más de 6 
horas 
(T3) 
Twitter (T) 25 20 40 85 
Facebook (F) 30 30 60 120 
WhatsApp(W) 50 35 50 135 
Total 105 85 150 340 
 
Si se selecciona al azar a un joven: 
 
a) Calcule la probabilidad de que utilice Facebook o el tiempo que pasa en las redes 
sociales sea más de 6 horas. 
 
 
 
 
 
 
b) Calcule la probabilidad de que no utilice Twitter y el tiempo que pase en las redes 
sociales de 3 a 6 horas. 
 
 
 
 
 
 
c) Calcule la probabilidad de que no utilice WhatsApp o el tiempo que pase en las 
redes sociales no sea menor a 3 horas. 
 
 
 
 
 
 
 
d) Calcule la probabilidad de que no utilice Facebook y el tiempo que pase en las redes 
sociales no sea menor a 3 horas 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 112 
e) Si se selecciona al azar a 25 jóvenes sin reemplazo y sin considerar el orden, ¿Cuál 
es la probabilidad de que 12 utilicen Twitter, 8 Facebook y el resto WhatsApp? 
 
 
 
 
 
 
 
 
 
f) Si se sabe que el tiempo que pase en las redes sociales es más de 6 horas, calcule 
la probabilidad que utilice Facebook. 
 
 
 
 
 
 
 
 
 
g) Calcule la probabilidad de que el tiempo que pase en las redes sociales sea menos 
de 3 horas o más de 6 horas, si se sabe que utiliza WhatsApp. 
 
 
 
 
 
 
 
 
 
2. Suponga que una pollería tiene solamente dos locales: A y B. En el local A laboran 
20 personas, de las cuales: 10 son meseros, 5 son cocineros, y 5 de limpieza. En el 
local B laboran 16 personas, de las cuales: 9 son meseros, 4 son cocineros, y 3 de 
limpieza. 
 
a. Si se elige al azar a un trabajador ¿Cuál es la probabilidad de que sea mesero o 
el local de donde labora sea B? 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 113 
b. Si se eligen al azar y sin reemplazo dos trabajadores de cada tienda, halle la 
probabilidad de que al menos una de dichas personas sea mesero. 
 
 
 
 
 
 
 
 
 
 
 
 
c. Tomando en consideración al local A, la probabilidad de que un mesero reciba 
durante su atención de todo el día una propina mayor o igual a 30 soles es 0.15, 
la probabilidad de que reciba entre 20 y menos de 30 es 0.45, y la probabilidad 
de que reciba menos de 20 soles es 0.4. En un día cualquiera de atención del 
mesero, ¿cuál es la probabilidad de que reciba menos de 20 soles o mayor a 29 
soles? 
 
 
 
 
 
 
 
 
 
 
 
 
d. Tomando en consideración el local B, un mesero, un cocinero y uno de limpieza 
desean pedir al dueño del local vacaciones. Las probabilidades de que les den 
vacaciones a cada uno de ellos son 0.3, 0.6 y 0.8 respectivamente. Asumiendo 
independencia. ¿Cuál es la probabilidad de que solo a uno de ellos le den 
vacaciones? 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 114 
3. Una empresa dedicada a la venta de artefactos eléctricos tiene tres vendedores, A, 
B, y C. Estos vendedores han realizado, durante el último mes, respectivamente, el 
35 %, 15 %, 50% de las operaciones de ventas de la empresa. Del total de 
operaciones de venta realizadas por el vendedor A, el 5% tiene error en la orden de 
compra para el vendedor B, el 3% tienen error en la orden de compra y para el 
vendedor C, el 96% no tienen error en la orden de compra. 
 
a. Si se selecciona al azar una operación de venta, halle la probabilidad de que ésta 
tenga error en la orden de compra. 
 
 
 
 
 
 
 
 
 
 
 
b. Si se selecciona al azar una operación de venta y ésta tiene error en la orden de 
compra; determine la probabilidad de que la operación de venta no corresponda 
al vendedor B. 
 
 
 
 
 
 
 
 
 
 
c. Se seleccionan, al azar y con reemplazo, 2 operaciones de venta. Calcule la 
probabilidad de que en uno de ellas sólo exista error en la orden de compra. 
Considere independencia en las operaciones.UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 115 
EJERCICIOS PROPUESTOS 
 
1. De un grupo de personas, el 30% practica fútbol y el 40% juega ajedrez. De los 
futbolistas, el 50% juega ajedrez. Si se elige aleatoriamente una persona ¿Cuál es la 
probabilidad de que: 
a) juegue fútbol o ajedrez? 
b) practique sólo uno de estos deportes? 
c) no practique ni fútbol ni ajedrez? 
 
2. De 20 personas que contrajeron cierta enfermedad al mismo tiempo y que fueron 
llevados a una misma sala de un hospital, 15 se recuperan completamente en 3 
días; al cabo del cual, se escogen al azar 5 personas para un chequeo. 
a) ¿Cuál es la probabilidad que los 5 sean dados de alta? 
b) ¿Cuál es la probabilidad de que exactamente 4 sean dados de alta? 
c) ¿Cuál es la probabilidad que ninguno sea dado de alta? 
 
3. De 200 familias, 80 compran el periódico A, 95 el periódico B y 40 no compran A 
pero si B. Si se selecciona una familia al azar, calcule la probabilidad de que: 
a) Compre A o B. 
b) Compre A pero no B. 
 
4. En una ciudad el 60 % son hombres, el 20 % son de raza negra y el 8 % son 
hombres negros. Si se selecciona a una persona al azar de esa ciudad, halle la 
probabilidad de que sea una mujer de raza negra. 
 
5. En una fábrica se seleccionó 200 artículos producidos durante un día y se encontró 
que 9 tienen fallas de tipo I, 10 tienen fallas de tipo II y 2 tienen ambos tipos de 
fallas. Si un artículo es seleccionado al azar, halle la probabilidad de no tenga 
ninguno de estos tipos de fallas. 
 
6. Una enfermedad X se puede presentar en forma maligna o benigna. Si se presenta 
en forma maligna da origen a un tumor cerebral con probabilidad 0.75, mientras 
que la forma benigna produce tumor en un 8 % de los casos. Se sabe además que 
la forma benigna es 7 veces más probable que la maligna. 
a) ¿Cuál es la probabilidad de que a una persona que padece la enfermedad no le 
aparezca el tumor cerebral? 
b) Si alguien que padece esa enfermedad tiene tumor cerebral ¿Cuál es la 
probabilidad de que tenga la forma maligna? 
 
7. La probabilidad de que un turista haga una reservación con más de una semana de 
anticipación es del 10% y la probabilidad de que un turista se inscriba en el tour 
completo ofrecido por el hotel es de 35%. Si la probabilidad de que se inscriba en el 
tour completo ofrecido por el hotel o haga la reservación con más de una semana de 
anticipación es del 40%, ¿Cuál es la probabilidad de que se inscriba en el tour 
completo ofrecido por el hotel si se sabe que hizo la reservación con más de una 
semana de anticipación? 
 
8. En una investigación realizada a los conductores de taxis, se encontraron los 
siguientes resultados: el 20% son mujeres, el 10% de las mujeres tienen estudios 
universitarios; el 60% de los hombres no tienen estudios universitarios. Si se toma 
un conductor de taxi al azar y resulta que tiene estudios universitarios, ¿cuál es la 
probabilidad que sea mujer? 
 
9. Sea A el evento de que un cierto libro de Estadística (primero) se encuentre 
prestado fuera de la biblioteca de la universidad, sea B el evento de que otro libro 
(segundo) sobre el mismo tema también se encuentre prestado. (Nota: los datos de 
la pregunta (a.) difieren de la pregunta (b.)) 
a) Si P(AB)= 0.2 y P(exactamente un libro esté prestado)= 0.5. Calcular P(AB) 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 116 
b) Si P(Ac  Bc) = 0.3, P(Ac  Bc) = 0.9 y P(sólo el primer libro esté prestado)=0.4. 
Calcular P(A) y P(B) 
 
10. Una planta armadora recibe microcircuitos provenientes de tres distintos fabricantes 
(A, B y C). El 52% del total de microcircuitos se compra de A, el 28% de B y el 20% 
de C. El porcentaje de microcircuitos defectuosos para A, B y C son 4%, 8% y 10% 
respectivamente. Si los microcircuitos se almacenan en la planta sin importar quién 
fue el proveedor: 
a) Diga, ¿cuál es la probabilidad que la planta no reciba microcircuitos del 
fabricante B? 
b) Si un circuito no está defectuoso, ¿cuál es la probabilidad de que no haya sido 
vendido por el proveedor C? 
 
11. Suponga que una empresa dedicada a realizar revisiones técnicas tiene dos talleres 
A y B. Cada propietario o conductor elige al azar un taller para pasar por dos 
exámenes 1 y 2. Un vehículo aprueba la revisión técnicas si aprueba los dos 
exámenes. Para un vehículo que pasa por el taller A, la probabilidad que apruebe los 
dos exámenes es 0.85 mientras que para un vehículo que pasa por el taller B la 
probabilidad correspondiente es 0.9. Considerando que la elección del taller A es 
igual de probable que la elección del taller B. 
a) Halle la probabilidad que un vehículo apruebe la revisión técnica 
b) Si se sabe que el vehículo desaprobó la revisión técnica, ¿cuál es la probabilidad 
que haya escogido el taller B? 
 
12. Un investigador afirma que, en cierta población, el 60% son hombres; el 70% de los 
hombres y el 45% de las mujeres tienen un coeficiente intelectual menor que el 
promedio. Si una persona de esa población tiene un coeficiente intelectual de por lo 
menos el promedio ¿Cuál es la probabilidad de que sea hombre? 
 
13. Una fábrica confecciona en un día determinado 400 prendas para varones y 600 
para mujeres. La probabilidad de que una prenda de mujer tenga falla es de 0.01 y 
la probabilidad de que una prenda de varón tenga falla es 0.02. Se elige de la 
producción del día una prenda al azar 
a) ¿Cuál es la probabilidad de que la prenda tenga falla? 
b) Si la prenda elegida no tiene falla, ¿cuál es la probabilidad de que no sea de 
mujer? 
c) Se eligen cuatro prendas, ¿cuál es la probabilidad de que por lo menos una 
prenda tenga fallas? 
 
14. La probabilidad de que la construcción de un edificio se termine a tiempo es 17/20, 
la probabilidad de que no haya huelga es ¾, la probabilidad de que la construcción 
se termine a tiempo dado que no hubo huelga es 14/15, la probabilidad de que haya 
huelga y no se termine la construcción a tiempo es 1/10 
a) Hallar la probabilidad de que la construcción se termine a tiempo y no haya 
huelga 
b) Hallar la probabilidad de que la construcción no se termine a tiempo si hubo 
huelga 
 
15. Un estudio acerca de los trabajadores de dos plantas de una empresa 
manufacturera incluye la pregunta: “¿cuán efectiva es la gerencia para responder a 
las legítimas quejas de los trabajadores?”. En la planta 1, 48 de 192 trabajadores 
contestaron “poco efectiva”, una respuesta desfavorable; en la planta 2, 80 de 248 
trabajadores respondieron “poco efectiva”. Se va a seleccionar aleatoriamente a un 
empleado de la empresa manufacturera. Sea A el evento “el trabajador procede de 
la planta 1” y B el evento “la respuesta es desfavorable”. 
a) Encuentre P(A), P(B) y P(AB) 
b) ¿son independientes los eventos A y B? 
c) Encuentre P(B/A) y P(B/Ac), ¿son iguales? 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 117 
16. Un cazador dispara 7 balas a un león enfurecido. Si la probabilidad de que una bala 
mate es 0.6. ¿Cuál es la probabilidad de que el cazador esté todavía vivo? 
 
17. En cierta población de perros: el 40% son de raza Bóxer, 57% son machos y 32% 
tienen más de dos años. Asuma que estas tres cualidades son independientes. Si 
un perro va a ser seleccionado al azar calcule la probabilidad de que tenga sólo una 
de estas cualidades. 
 
18. En un club hay 10 hombres y 12 mujeres. 4 de los hombres y 5 de las mujeres 
tienen Maestría. Si seleccionan al azar y sin restitución a 3 personas calcule la 
probabilidad de que las tres personas sean hombres o que tengan Maestría. 
 
19. Un dispositivo tiene 3 partes que funcionan independientemente. Sus probabilidades 
de falla son: 0.2, 0.3 y 0.4 para la primera, segunda y tercera partes 
respectivamente. Hallar la probabilidadde que al menos una de la partes falle. 
 
20. Un lote consta de 10 artículos buenos, 4 con pequeños defectos y 2 con defectos 
graves. Se elige un artículo al azar. Encontrar la probabilidad de que: 
a) No tenga defectos. 
b) Tenga un defecto grave. 
c) Que sea bueno o que tenga un defecto grave. 
Si se escogen 2 artículos en vez de uno, calcule la probabilidad de que: 
d) Ambos sean buenos. 
e) A lo menos uno sea bueno. 
f) A lo más uno sea bueno. 
g) Ninguno tenga defectos graves. 
 
21. En una serie de observaciones del tiempo de sobrevivencia de peces de una 
determinada especie en aguas contaminadas, un pesquero ha encontrado que el 
95% sobrevive 20 días, el 78% sobrevive 40 días, el 33% sobrevive 80 días, el 6% 
sobrevive 100 días y ninguno sobrevive después de 120 días. Estime la probabilidad 
de los eventos: 
a) Un pez muere dentro de los primeros 20 días. 
b) Muere entre 40 y 100 días. 
c) Sobrevive a lo más 80 días. 
22. En un salón de clases hay 40 personas. 15 son hombres y 26 están en segundo 
ciclo de los cuales 18 son mujeres. Si se escoge un estudiante al azar: 
a) ¿Cuál es la probabilidad de que sea hombre y no esté en segundo ciclo? 
b) Si se selecciona un estudiante y se observa que está en segundo ciclo, ¿cuál es 
la probabilidad de que sea mujer? 
 
23. Dos máquinas, A y B, producen el 35% y el 65% de las tuercas de una fábrica. Se 
sabe que el 10% y el 15% de las tuercas de cada máquina son defectuosas. 
a) Si en el mercado se encontró una tuerca defectuosa ¿Cuál es la probabilidad de 
que haya sido producida por la máquina A? 
b) Si en el mercado se seleccionaron independientemente dos tuercas y resultaron 
defectuosas ¿Cuál es la probabilidad de que hayan sido producidas por la 
máquina A? 
 
24. Para evaluar el resultado de una capacitación, un participante está rindiendo un 
test de 5 preguntas, donde cada una vale 2 puntos. Ya ha respondido dos 
correctamente y decide elegir al azar las tres respuestas que le faltan. 
a) Defina el espacio muestral. 
b) Si la calificación mínima aprobatoria es 6, ¿Cuál es la probabilidad de que 
apruebe el test? 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 118 
25. En una ciudad se estudia la cantidad de usuarios de Internet de acuerdo a ciertas 
variables. En el siguiente cuadro, se muestra la distribución de acuerdo a la Edad y 
Velocidad de Internet: 
 
 Rango de Edad Total 
Velocidad de 
Internet 
De 6 a 20 años De 21 a 
30 años 
De 31 a 
40 años 
Más de 40 
años 
1 Mbps 150 80 50 50 330 
2 Mbps 55 30 20 20 125 
3 Mbps 25 10 5 5 45 
Total 230 120 75 75 500 
 
a) ¿Cuál es la probabilidad que un usuario seleccionado al azar tenga una velocidad 
de 2 Mbps y tenga como mínimo 21 años? 
b) ¿Cuál es la probabilidad que un usuario seleccionado al azar tenga una velocidad 
de 1 Mbps o tenga a lo más 20 años? 
 
26. En la Gerencia de CRM del Supermercado Desco trabajan diez Analistas. Seis de 
ellos son informáticos y los otros cuatro son Industriales. Para implementar una 
campaña comercial, se debe formar un equipo de cuatro miembros. ¿Cuál es la 
probabilidad que hayan dos informáticos en este equipo de cuatro? 
 
27. Una compañía de desarrollo urbano está considerando la posibilidad de construir 
un centro comercial en un sector del sur de Lima, Perú. Un elemento vital en esta 
consideración es un proyecto de una autopista que una este sector con el centro 
de la ciudad. Si el gobierno municipal aprueba esta autopista, hay una 
probabilidad de 0,90 de que la compañía construya el centro comercial en tanto 
que si la autopista no es aprobada, la probabilidad es solo 0,20. Basándose en la 
información disponible, el gerente de compañía estima que hay una probabilidad 
de 0,60 que la autopista sea aprobada. 
a) ¿Cuál es la probabilidad de que compañía construya el centro comercial? 
b) Dado que el centro comercial fue construido, ¿cuál es la probabilidad de que 
la autopista haya sido aprobada? 
 
28. Un sistema consiste en tres componentes independientes: A, B1 y B2. La 
probabilidad de falla es 0,01 para A, 0,02 para B1 y 0,10 para B2. Si para el 
funcionamiento del sistema son necesarios los componentes A y al menos uno de 
los B, ¿cuál es la probabilidad de que el sistema funcione? 
 
29. Una empresa dedicada a estudios de mercado está interesada en analizar la 
relación entre la importancia que dan a la publicidad los propietarios y el tamaño 
de la tienda que poseen. En el siguiente cuadro se presenta los resultados a una 
muestra de 520 propietarios según cuatro tamaños de tienda. 
 
Importancia en la 
publicidad 
Tamaño de la tienda 
Total Pequeña 
(T1) 
Mediana 
(T2) 
Grande 
(T3) 
Muy grande 
(T4) 
Nada importante (I1) 100 25 10 15 150 
Importante (I2) 30 35 50 55 170 
Muy Importante (I3) 20 40 60 80 200 
Total 150 100 120 150 520 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 119 
Si se elige al azar a un propietario, ¿cuál es la probabilidad?: 
 
a) Que no considere que es importante la publicidad pero tiene una tienda grande 
b) Tenga una tienda mediana o considere nada importante la publicidad. 
c) Que no considere muy importante la publicidad y no tenga una tienda muy grande 
d) Considere muy importante la publicidad, si se sabe que no tiene una tienda muy 
grande. 
 
30. Los resultados de una encuesta sobre inseguridad ciudadana, indican que el 65% 
de las personas han sufrido un robo, el 45% un asalto y el 35% un robo y asalto. 
Si se selecciona a una persona al azar. 
a) ¿Cuál es la probabilidad que haya sufrido un robo y no un asalto? 
b) ¿Cuál es la probabilidad que no haya sufrido un robo o ni un asalto?. 
 
31. Un comerciante adquiere sacos de azúcar de dos azucareras nacionales (A1 y A2). 
Se sabe que el 68% de los sacos proviene de A1 y el resto de A2. Además, el 85% 
de los sacos que recibe de A1 y el 92% que recibe de A2 son de calidad extra. Si un 
saco de arroz se escoge al azar: (defina los respectivos eventos). 
a. ¿Cuál es la probabilidad que sea de calidad extra?. 
b. Sabiendo que es de calidad extra, ¿cuál es la probabilidad de que provenga de la 
azucarera A1?. 
c. Sabiendo que no es de calidad extra, ¿cuál es la probabilidad de que provenga de 
la azucarera A2?. 
 
32. Las personas sospechosas de incurrir en lavado de activos pueden ser investigadas 
por Organismos Gubernamentales responsables. La probabilidad de ser investigada 
por el organismo gubernamental A es 0.009 y la probabilidad de ser investigada por 
el organismo gubernamental B es 0.018. Si estos eventos son independientes: 
a) Calcule la probabilidad de que la persona sospechosa sea investigada por el 
organismo gubernamental A pero no por el B. 
b) Calcule la probabilidad de que un persona sospechosa sea investigada por el 
organismo gubernamental A o por el B. 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 120 
Preguntas de Autoevaluación 
 
1. Determine el espacio muestral para los siguientes experimento aleatorios: 
a) Lanzar una moneda y un dado simultáneamente ________________________ 
b) Anotar el número de artículos defectuosos de un lote de seis ______________ 
c) Lanzar dos monedas a la vez _______________________________________ 
2. Si se define el evento A={Todos los clientes cuyo gasto es menor a $500}, entonces 
el evento Ac se define ______________________________________________ 
3. Si en un grupo de 12 amigos de colegio, 5 desean viajar a la selva, 4 a la sierra y 3 
a la costa por Semana Santa. Si se selecciona a tres personas al azar, la 
probabilidad que haya dos personas que deseen ir a la selva es igual a 
____________________________________. 
4. Sean los eventos A1, A2,...,Ak definidos sobre Ω, las condiciones que se debe cumplir 
para aplicar la ley de la probabilidad total es que los eventossean 
_____________________________________________________________. 
5. Si A y B son dos eventos independientes de Ω, entonces  ccc ABAP /)(  es igual a 
_________________ siendo 0)( 
cAP . 
6. Si los eventos A y B definidos en el espacio muestral Ω son independientes, 
entonces P(Ac/B) es igual a _____________________ 
7. En una encuesta por teléfono aplicada a los egresados de una entidad educativa 
superior, se encontró que el 66% de los encuestados prefieren ahorrar para comprar 
su carro, el 46% para estudiar una maestría y el 16% para ambas cosas. Si se 
seleccionada al azar a un egresado encuestado, la probabilidad de que no ahorre 
para comprar su carro ni para estudiar una maestría es igual a 
______________________________________ . 
8. Si P(T)=0.25 y P(S)=0.75, sabiendo que los eventos T y S son independientes, 
entonces P(T ᴜ Sc) es igual a: ______________________. 
9. En un programa de asistencia técnica han participado 120 agricultores en la 
capacitación de dos técnicas de manejo de cultivo de frijol (A y B). Se sabe que 80 
agricultores han usado la técnica A y el resto la B. De los que usaron la técnica A, el 
65% han conseguido aumentar el rendimiento del cultivo de frijol y de los que 
usaron la técnica B sólo el 35% consiguieron aumentar su rendimiento. Si se 
selecciona al azar a un agricultor que participó el programa, la probabilidad que 
haya aumentado su rendimiento de frijol es igual a : _______________________. 
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados: 
Item Enunciado V/F 
a. Para N objetos tomados de n en n, se pude decir que el número de 
combinaciones es mayor al número de permutaciones. 
 
b. Se dice que la probabilidad clásica que es a priori, porque se pude 
calcular la probabilidad de un evento antes de realizar el experimento. 
 
c. Para dos eventos A y B Ω, los axiomas de la definición clásica 
corresponden a: P(A)≥0, P(B)≥0;P(AᴜB)=1 y A∩B=Φ. 
 
d. Sean los eventos A1, A2, y A3 definidos sobre Ω, entonces si se cumple 
que A1 ᴜ A2 ᴜ Ak = Ω se puede afirmar que los eventos forman una 
partición de Ω. 
 
e. Si los eventos A y B son mutuamente excluyentes, entonces también se 
pude decir que son independientes. 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 121 
CAPÍTULO VII 
 
VARIABLES ALEATORIAS 
 
Se estudia las características y tomando en cuenta los conceptos de probabilidades para 
entender la definición de una variable aleatoria y su distribución de probabilidad 
asociada; así como hallar su media, la variancia y el coeficiente de variación. 
 
Objetivo. Al finalizar este capítulo el estudiante podrá entender el concepto de una 
variable aleatoria y las aplicaciones que tiene en la teoría de probabilidades y en el 
campo de la inferencia estadística. 
 
7.1 Definición de variable aleatoria 
 
Una variable aleatoria es cualquier función que tiene como dominio a los elementos que 
constituyen el espacio muestral de un experimento aleatorio y como rango a un 
subconjunto de los reales. 
 
 
7. 2 Clases de variable aleatoria 
 
Las variables aleatorias pueden ser: 
 Variables aleatorias discretas 
 Variables aleatorias continuas 
 
Variable aleatoria discreta. Si su rango es un conjunto finito o infinito numerable. 
 
Ejemplo 1 
Sea el experimento aleatorio registrar los sexos de los próximos tres niños que van a 
nacer. Si se define la v.a.d. Y como el número de niños de sexo femenino que nacerán. 
Halle el dominio y el rango de Y. 
Solución: 
={ MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF } 
Y(MMM) = 0 
Y(MMF) = Y(MFM) = Y(FMM) = 1 
Y(MFF) = Y(FMF) = Y(FFM) = 2 
Y(FFF) = 3 
 
Entonces RY = {0, 1, 2, 3} 
 
 
Y = número de niños de sexo femenino que nacerán
MMM
MMF
0 RY
Y
FMM
FFM
MFM
FMF
FFF
MFF
1
2
3
DY = ={ MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF }
RY = {0, 1, 2, 3}
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 122 
Ejemplo 2 
Se va a registrar la variable aleatoria X definida como el número de autos que llegan 
por cada hora a una playa de estacionamiento entonces el dominio de X será el 
conjunto de todas las horas en estudio y el rango RX = {0, 1, 2, } 
 
Variable aleatoria continua. Si su rango es un conjunto infinito no numerable. 
 
Ejemplo 3 
Se desea determinar el pH de un compuesto químico seleccionado al azar, entonces la 
variable aleatoria X definida como el pH del compuesto es una variable aleatoria 
continua con rango 0,14 
 
7.3 Función de probabilidad de una variable aleatoria discreta 
 
Sea X una variable aleatoria discreta. Se denomina función (ley, modelo o distribución) 
de probabilidad de X a la función  xf definida por    xXPxf  para todo número 
real x, que satisface las siguientes condiciones: 
 
 
 
) 0
) 0
) 1
i X
x
x
i
x R
i f x para x R
ii f x para x R
iii f x

 
 

 
 
Ejemplo 4 
Con relación al Ejemplo 1, halle la función de probabilidad de la v.a.d Y definida como el 
número de niños de sexo femenino que nacerán, asumiendo que los eventos simples 
son igualmente probables (o que P(M)=P(F)=1/2 y que M y F son eventos 
independientes). 
 
Se tiene el rango: RY = {0, 1, 2, 3} 
 
Cálculo de las probabilidades para cada valor de la variable aleatoria: 
      
      
      
      
8
1
33
8
3
,,22
8
3
,,11
8
1
00




FFFPYPf
FFMFMFMFFPYPf
FMMMFMMMFPYPf
MMMPYPf
 
 
La función de probabilidad también se puede representar de la siguiente manera: 
 
Y 0 1 2 3 
   yYPyf  1/8 3/8 3/8 1/8 
Otra forma de representar:    












xdevaloresotros
x
x
xXPxf
,0
2,1,
8
3
3,0
8
1
 
Se cumple que:           1
8
1
8
3
8
3
8
1
3210 

ffffxf
XRx
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 123 
Ejemplo 5 
El número de unidades vendidas por día del artículo Z es una variable aleatoria tiene la 
siguiente función de probabilidad: 
   












xdevaloresotros
xc
x
xc
xXPxf
,0
6,5,2
4,3,
8
1
2,1,
 
Determine el valor de c. 
 
Solución 
Por propiedad: 
              122
8
1
8
1
6543211 

ccccffffffxf
XRx
 
resolviendo la ecuación resulta 
8
1
c . 
 
Ejemplo 6 
Se tienen 6 impresoras, de las cuales 2 están defectuosas. Si se seleccionan 3 de ellas, 
sin reemplazo, determine la función de probabilidad de la variable aleatoria definida 
como el número de impresoras defectuosas seleccionadas. 
 
Solución 
Sean los eventos: D0 = {obtener 0 impresoras defectuosas y 3 no defectuosas} 
 D1 = {obtener 1 impresora defectuosa y 2 no defectuosas} 
 D2 = {obtener 2 impresoras defectuosas y 1 no defectuosa} 
 
Sea X = Número de impresoras defectuosas seleccionadas 
 
El rango es: RX = {0, 1, 2} 
     
 
  20
4
3
6
3
4
0
2
00 00 





















n
Dn
DPXPf 
     
 
  20
12
3
6
2
4
1
2
11 11 





















n
Dn
DPXPf 
     
 
  20
4
3
6
1
4
2
2
22 22 





















n
Dn
DPXPf 
La función de probabilidad queda definida:    
0.2 0,2
0.6 1
0
x
f x P X x x
Otro caso


   


 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 124 
Ejercicio 1. Una muestra aleatoria con reposición de tamaño n=2 se selecciona del 
conjunto {1,2,3} obteniéndose un espacio muestral: 
 
                 1,1 , 1,2 , 1,3 , 2,1 , 2,2 , 2,3 , 3,1 , 3,2 , 3,3
 
Sea X la variable aleatoria la suma de los dos números. Hallar la función de 
probabilidad de la variablealeatoria X. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Ejercicio 2. Un dispositivo está compuesto por tres elementos (A, B y C) que trabajan 
independientemente. La probabilidad de falla de cada elemento en una prueba es 0.1. 
 
a. Halle la función de probabilidad de la variable aleatoria X: número de elementos que 
fallan en una prueba. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b. ¿Cuál es la probabilidad de que falle al menos un elemento en una prueba?. 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 125 
Ejercicio 3. En un distrito de Lima el número de hijos por familia es una variable 
aleatoria con la siguiente función de probabilidad: 
 
 
 
 
 
 
 
 
a. Halle el valor de k para que f(x) sea una función de probabilidad. 
 
 
 
 
 
 
 
b. Si se escoge al azar una familia, ¿cuál es la probabilidad de que tenga por lo menos 
dos hijos? 
 
 
 
 
 
 
 
 
 
 
 
7.4 Función de densidad de una v.a continua X 
 
La función  f x de la v.a. continua X es su función de densidad si cumple con lo 
siguiente: 
 
1.   0 ,f x x  R ,  f x no es una probabilidad por ejemplo  f x =3.9 es 
posible. 
2.   1f x dx


 
3. Si        
b
a
A x a x b P A P a X b f x dx         
4.          
b
a
P a X b P a X b P a X b P a X b f x dx             
 
Usando el operador integral: 11
111






 n
ab
n
X
dxX
nnb
a
nb
a
n
 
 
 
 
0.5 0;1
 2;3
2.0 4
0 
k x
k x
P X x
k x
otra manera



  


UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 126 
Ejemplo 7 
Suponga que el tiempo, en horas, que necesita un técnico para reparar cierta avería de 
un artefacto eléctrico es una variable aleatoria que tiene la siguiente función de 
densidad: 
 
 
 6 , 1 3
0 ,
k x x
f x
para otros valores de x
  
 

 
 
a. Halle el valor de k para que f(x) sea una función de densidad. 
Por propiedad:   1f x dx


 , entonces, 
     
 
     
1 3 3
1 3 16
1
6 8
8
cero cerok x
f x dx f x dx f x dx f x dx k x dx k k
 
  
            
 
Entonces la función de densidad:  
 
1
6 , 1 3
8
0 ,
x x
f x
para otros valores de x

  
 


 
b. Calcule la probabilidad de que un técnico demore por lo menos 1.8 horas pero 
menos de 2 horas en reparar esa avería. 
         
2 2
1.8 1.8
1
1.8 2 1.8 2 6 0.1025
8
A x x P A P X f x dx x dx            
 
c. ¿Cuál es el tiempo máximo que necesita un técnico para reparar cierta avería de 
un artefacto eléctrico para estar dentro del 18% de los que usan menor tiempo? 
 
 
horask
dxxkXP
k
26.1
18.06
8
1
)(
1

 
 
 
 
Ejercicio 4. Sea la V.A. X: Peso de un artículo (Kg), cuya función de densidad está 
dada por: 
 
 
 
 
 
 
 
a. Verifique que f(x) es una función de densidad 
 
 
 
 
 
 
 
 
 
2
, 1 2
( ) 3
0
x x
f x
Otro caso

 
 


UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 127 
b. Halle la probabilidad de que un artículo pese entre 1 y 1.5 kg. 
 
 
 
 
 
 
 
c. Halle la probabilidad de que un artículo pese al menos 1.8 kg. 
 
 
 
 
 
 
 
7.5 Valor esperado, esperanza matemática o media de una variable aleatoria X 
 
La media de una v.a X, que tiene como función de probabilidad  xf , está dada por: 
 
1.    


XRx
X xfxXE si X es una variable aleatoria discreta. 
2.    X E X x f x dx


   si X es una variable aleatoria continua. 
 
Propiedades del valor esperado 
 
1. Si c y d son constantes reales, entonces,     dXEcdXcE  
2. Consecuencias de la propiedad 1: 
a.   ddE  
b.     dXEdXE  
c.    XEcXcE  
3. Si X e Y son v.a. y c, d son constantes reales, entonces: 
     YEdXEcYdXcE  
Casos particulares:      YEXEYXE  
      YEXEYXE  
4. Si 1, , nX X son v.a. entonces  
1 1
n n
i i
i i
E X E X
 
 
 
 
  
 
7.6 La variancia de una variable aleatoria X 
 
La variancia de una v.a X está dada por el valor esperado de la función 
   2XXXh  , es decir: 
     222222 )())(()(   XEXEXEXEXVar XX 
 









continuocasodxxfX
discretocasoxfX
XEdonde
,)(
),(
)(:
2
2
2
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 128 
Propiedades de la variancia 
 
La variancia es un número real positivo que cumple con las siguientes propiedades: 
 
1. Si c y d son constantes reales, entonces,    XVarcdXcVar 2 
2. Consecuencias de la propiedad 2: 
a.   0dVar 
b.    XVardXVar  
c.    XVarcXcVar 2 
 
3. Si X e Y son v.a. independientes y c, d son constantes reales, entonces: 
     YVardXVarcYdXcVar 22  . 
 
Casos particulares:      YVarXVarYXVar  
      YVarXVarYXVar  
4. Si 1, , nX X son v.a. independientes entonces  
1 1
n n
i i
i i
Var X Var X
 
 
 
 
  
 
Ejemplo 8 
Suponga que una librería compra 6 ejemplares de un libro y el número de ejemplares 
vendidos en tres meses, tiene la siguiente función de probabilidad: 
 
X 1 2 3 4 5 6 
 xf 1/8 1/8 1/8 1/8 2/8 2/8 
 
a. Halle el número de ejemplares que se espera vender en tres meses. 
 
    unidadesxfxXE
XRx
X 4
8
2
6
8
2
5
8
1
4
8
1
3
8
1
2
8
1
1  

 
 
b. Halle la variancia del número de ejemplares vendidos en tres meses. 
 Por la propiedad 1 de la variancia:     22 XXEXVar  
     19
8
2
6
8
2
5
8
1
4
8
1
3
8
1
2
8
1
1 222222222  
 XRx
X
xfxXE 
 entonces:     22 XXEXVar  = 19 – 42 = 3 unidades2 
 
c. Calcule el coeficiente de variación del número de ejemplares vendidos en tres 
meses. 
 
 %3.43100
4
3
100 
X
X
XCV


 
d. Suponga que la librería compra 6 ejemplares de un libro a $10.00 cada uno, para 
venderlos a $20.00 teniendo en cuenta que al terminar el periodo de 3 meses, 
cualquier ejemplar no vendido se venderá a $7.00. Calculela media, la variancia y 
el coeficiente de variación de la utilidad neta. 
 
Sean las variables: X = número de ejemplares vendidos 
 6 – X = número de ejemplares no vendidos 
 U = utilidad neta 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 129 
U = 20 X + 7 ( 6 – X ) – 60 = 13 X – 18 , aplicando la propiedad 1 del valor 
esperado y la propiedad 2 de la variancia se tiene lo siguiente: 
 
E (U) = E (13 X – 18) = 13 E (X) – 18 = 13 (4) – 18 = $34 
Var (U) = Var (13 X – 18) = 132 Var (X) = 132 (3) = 507 
 
CVU = %2.66100
34
507
 
 
e. Calcule la probabilidad de que la utilidad neta sea mayor que 34. 
 
          5.0
8
2
8
2
65434181334  XPXPXPXPUP 
 
Ejercicio 5. Sea la variable aleatoria X, definida como el número de artículos 
defectuosos producidos por día, cuya función de probabilidad es: 
 
 
 
 
 
 
 
a. Halle el valor de k para que f(x) sea una función de probabilidad. 
 
 
 
 
 
 
 
 
b. ¿Cuál es la probabilidad de encontrar por lo menos dos artículos defectuosos en un 
día cualquiera? 
 
 
 
 
 
 
c. Halle el valor esperado y el coeficiente de variabilidad. 
 
 
 
 
 
 
 
 
 
 
 











casootro
xxk
xkx
x
xXPxf
0
4,3),5(
2,1,
0,1.0
)()(
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 130 
d. Si la empresa estima que la perdida por cada artículo defectuoso por día es de 
$25.0 y un gasto de reenvió de $4.5. Halle la pérdida media y el coeficiente de 
variabilidad. 
 
 
 
 
 
 
 
 
 
 
 
Ejemplo 9 
La v.a. continua X definida como la proporción de accidentes fatales por mes que 
ocurren en determinada ciudad tiene como función de densidad: 
 
 
2 , 0 1
0 ,
x para x
f x
para otros valores de x
 
 

 
 
a. Calcule la probabilidad de que la proporción de accidentes por mes sea menor que 
0.4 
     
0.40.4 0.4 2
0.4
2
0
0 0 0
0.4 0 0.4 2 2 0.16
2
x
P X P X f x dx x dx x
 
            
 
  
 
Nota: Como X es una v.a. continua se cumple que: 
 
         
0.4
0
0 0.4 0 0.4 0 0.4 0 0.4 0.16P X P X P X P X f x dx             
b. Encuentre la proporción media de accidentes fatales por mes en esa ciudad. 
     
1 1
1
2 3
0
0 0
2 2
2 2
3 3
X E X x f x dx x x dx x dx x


          
 
c. Halle la variancia de X. 
     
1 1
1
2 2 2 3 4
0
0 0
2 1
2 2
4 2
E X x f x dx x x dx x dx x


         
   
2
22 2 1 2 1
2 3 18
X E X E X
 
        
 
 
 
d. Si Y=0.8X-0.02, calcule la media y la variancia de Y. 
 
E(Y)=E(0.8X-0.02)=0.8E(X)-0.02= 0.5133 
Var(Y)=Var(0.8X-0.02)=  2 2
1
0.8 0.8 0.0356
18
Var X
 
  
 
 
e. Halle la  0.3P Y  
 0.3P Y  =    0.8 0.02 0.3 0.4 0.16P X P X     
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 131 
Ejercicio 6. Se sabe que el tiempo (en minutos) que demora un automóvil en pasar la 
revisión técnica, es una variable aleatoria que tiene la siguiente función de densidad. 
 
 
 
 
 
 
a. ¿Cuál es la probabilidad de que un automóvil tarde en pasar la revisión técnica 
menos de 32 minutos?. 
 
 
 
 
 
 
 
b. Halle el porcentaje de automóviles que tardarán en pasar la revisión técnica entre 25 
y 35 minutos. 
 
 
 
 
 
 
 
 
c. Halle la media y el coeficiente de variabilidad del tiempo que se demora en pasar la 
revisión técnica. 
 
 
 
 
 
 
 
 
 
 
 
 
 
d. Si al implementar dos casetas par la revisión se espera disminuir el tiempo en un 
12.5%, halle el nuevo tiempo medio que demora los automóviles en pasar la 
revisión técnica. 
e. 
 
 
 
 
 







casootro
x
x
xf
0
4020
600)(
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 132 
EJERCICIOS PROPUESTOS 
 
1. El gerente de una empresa de transporte sabe que la distribución de la demanda de 
pasajes que diariamente solicitan a su agencia es la que se presenta a continuación. 
Los valores positivos indican que el número de pasajes solicitados exceden la 
capacidad del ómnibus, mientras que los negativos indican que la demanda de 
pasajes es menor a la capacidad del ómnibus. 
 
0.05 15
0.15 10
( ) 0.55 0
0.1 10
0.15 15
X
X
f X X
X
X
 

 

 
 


 
 
a) ¿Cuál es la probabilidad que en un día la demanda de pasaje exceda la 
capacidad del ómnibus? 
b) ¿Cuál es la probabilidad que de tres días seleccionados aleatoriamente dos de 
ellos tengan una demanda de pasajes igual a la capacidad del bus? 
c) El gasto (Y, en dólares) que ocasiona a los operadores logísticos cuando la 
demanda de pasajes no es igual a la capacidad del bus, puede expresarse como: 
Y = 2|X|. Halle el gasto medio esperado. 
 
2. El gerente de la empresa de juguetes plásticos le ha encargado al nuevo asistente 
que investigue sobre los registros de ventas de un tipo de camioncitos y como 
resultado ha calculado la siguiente distribución de probabilidades para sus ventas 
anuales. 
Unidades (ventas) 3000 4000 4500 5000 
Probabilidad 0.2 0.4 0.2 0.2 
¿Cuántos camioncitos se esperaría vender el próximo año? 
 
3. De acuerdo con el ministerio de transporte, se sabe que el número de accidentes por 
semana que ocurren en una empresa es una variable aleatoria X con función de 
distribución de probabilidades dado por: 
 
X 0 1 2 3 Otros valores 
f(x) 0.28 0.35 0.22 0.15 0 
a) Hallar la media, la variancia y coeficiente de variación de X. 
b) Si en una semana se sabe que ocurrió al menos un accidente, ¿cuál es la 
probabilidad de que en dicha semana haya ocurrido exactamente uno? 
c) Si la empresa incurre en una pérdida semanal Y (soles) según el número de 
accidentes dada por: Y = 10 + 8X. Hallar la pérdida esperada semanal. 
 
 
4. Cierta variedad de planta es sembrada en parcelas utilizando determinado 
fertilizante. Suponga que la producción X, en miles de Kilos por parcela es una 
variable aleatoria continua con la siguiente función de densidad: 
 
 
 1 , 1 3
0 ,
k x para x
f x
para otros valores de x
  
 

 
 
a) Halle el valor de k. 
b) Calcule la probabilidad de que una parcela tenga una producción de por lo 
menos 1500 Kilos pero menos de 2000 Kilos. 
UNA La Molina - Dpto. de Estadística e Informática EstadísticaGeneral 
 
 133 
c) Si se eligen independientemente 10 parcelas, halle la probabilidad de que en 5 
de ellas la producción sea mayor que 1000 kilos pero menor que 2000 Kg. 
d) Determine el valor de la media y la variancia de X. 
e) Un especialista ha establecido que debido a un nuevo fertilizante, la producción 
(en miles de kilos) es una v.a. Z=1.2X-0.08. Calcule la media y la variancia de 
Z. 
f) Halle la probabilidad de que la producción con el nuevo fertilizante sea menor 
que 1733.4 kilos. 
 
5. Si el peso X, de un artículo en Kg. tiene como función de densidad: 
 







modo otro de, 0
10x8 para , 
2
8
)(
x
xf 
a) Calcule E(X) y Var(X). 
b) Si el precio de venta es de 2 u.m. y el costo es de 1 u.m, garantizando un 
reintegro cuando el peso es menor de 8.25 Kg. Halle la utilidad esperada por 
artículo. 
 
6. Suponga que el número de accidentes por semana que ocurren en una empresa es 
una variable aleatoria X con función de distribución de probabilidades dada por: 
X 0 1 2 3 Otros valores 
f(x) 0.28 0.35 0.22 0.15 0 
a) Hallar la media y la variancia de X. 
b) La empresa incurre en una pérdida semanal Y según el número de accidentes 
dada por Y = 10 + 8X. Hallar la pérdida esperada semanal. 
c) Determinar la función de distribución acumulada. 
d) Si en una semana se sabe que ocurrió al menos un accidente, ¿cuál es la 
probabilidad de que haya ocurrido exactamente uno? 
 
7. Juan Quispe planea gastar su gratificación en comprar un Blue Ray en Jim´s Video 
Service a un precio de US$300. Ahora tiene la opción de comprar una póliza de 
servicio extendido que ofrece cinco años de cobertura por US$100. Después de 
conversar con sus amigos y leer los informes, Juan cree que puede incurrir en los 
siguientes gastos de mantenimiento durante los próximos cinco años: 
 
GASTO 0 50 100 150 200 250 300
PROBABILIDAD 0,35 0,25 0,15 0,10 0,08 0,05 0,02 
 
a. ¿Cuál es el valor esperado de los costos de mantenimiento pronosticados? 
b. ¿Debe Juan pagar US$100 por la garantía? Fundamente su respuesta 
 
8. Sea la variable aleatoria X con la siguiente distribución: 
xi p(xi) 
0 a/9 
1 2a/9 
2 5a/9 
3 a/9 
a) Hallar a. 
b) Hallar E(x) y V(X). 
c) Hallar: E(Y) y V(Y), donde Y= 3X+4. 
d) Calcular P(Y>1) 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 134 
Preguntas de Autoevaluación 
 
1. El dominio de una variable aleatoria es ________________________ y su rango es 
________________________ 
2. La función f(x) de una variable aleatoria discreta es conocida como 
_________________________________. Dos de sus condiciones 
son:______________________________________________ 
3. El rango de una variable aleatoria discreta es un conjunto _____________________ 
y el rango de una variable aleatoria continua es un conjunto __________________. 
4. Si X es una variable aleatoria, siendo Var(X)=45 y E(X)=5, entonces E(X2) es igual 
a ___________________________ 
5. En las siguientes funciones f(x) indique si son o no funciones de probabilidades 
a) 
 
b) 
 X 2 4 6 8 10 
 
X -1 0 1 2 
f(x) 0.2 0.2 0.2 0.2 0.2 
 
f(x) 0.25 0.25 0.25 0.25 
c) 
 
d) 
 X 10 20 30 40 
 
X 0 1 
 f(x) 0.2 0.2 0.2 0.2 
 
f(x) -0.5 0.5 
 
________________________________________________________________. 
6. Para los siguientes experimentos aleatorios defina el rango de la variable aleatoria: 
a) Lanzamiento de dos monedas, sea X=Número de caras obtenidas ____________ 
b) Observar un lote de 5 artículos, sea X=Número de artículos defectuosos ______ 
c) Lanzar dos dados, sea X=La suma de las caras superiores __________________ 
d) El número de quejas recibidas por una operadora en una semana ____________ 
7. Si X es una variable aleatoria, tal que P(X<12.5)=0.25 y P(X<18.5)=0.75, entonces 
el rango intercuartil será igual a __________________________. 
8. Si f (x)=10 ; 1 ≤ x ≤ a, el valor de “a” es igual a _________________________ 
9. Si f(x)=1/12; 6 ≤ x ≤ 18, verifique que E(X)=(6+18)/2 y Var(X)=(18-6)2/12; 
___________________________________________________ 
 
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados: 
 
Item Enunciado V/F 
a. El valor esperado de una variable aleatoria es un valor que siempre es 
igual a uno de los valores del rango de la variable. 
 
b. f(x) denota la función de probabilidad si X es una V.A. discreta y 
función de densidad si es continua. 
 
c. El valor esperado de una variable aleatoria nunca puede tomar valores 
negativos 
 
d. Sean X e Y variables aleatorias, entonces Var(X-Y)=Var(X)-Var(Y) 
e. Una variable aleatoria discreta y continua nunca puede tomar valores 
negativos 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 135 
CAPÍTULO VIII 
 
PRINCIPALES DISTRIBUCIONES DISCRETAS 
 
Se estudiarán las principales distribuciones que corresponden a las variables aleatorias 
discretas que son utilizadas muchas aplicaciones en el mundo real, conociendo su 
función de probabilidad. 
 
A continuación se presentan las principales distribuciones discretas: 
 
 La distribución de probabilidad binomial 
 La distribución de probabilidad hipergeométrica 
 La distribución de probabilidad Poisson 
 
Objetivo. Identificar y aplicar una variable aleatoria discreta, asociada alguna de las 
principales distribuciones discretas estudiadas. 
 
8.1 La Distribución Binomial 
 
Experimento Binomial 
 
Hay muchos experimentos que se ajustan ya sea exacta o aproximadamente a las 
siguientes propiedades: 
 
1. El experimento consiste en una secuencia de n intentos (experimentos de 
Bernoulli), donde n se fija antes del experimento. 
2. Los intentos son idénticos, y cada uno de ellos puede dar lugar a dos posibles 
resultados, llamados: éxito (E) o fracaso (F). 
3. Los intentos son independientes, por lo que el resultado de cualquier intento 
particular no afecta el resultado de cualquier otro intento. 
4. La probabilidad de éxito es constante de un intento a otro; se denota esta 
probabilidad por   EP . La probabilidad de fracaso es   1P F   
 
Ejemplo 1 
En una tienda la llegada de un cliente y determinar si compra o no es un experimento 
de Bernoulli donde éxito: E = {un cliente compra} y fracaso: F = {un cliente no 
compra}. Se sabe que el 75% de los clientes que llegan hacen una compra, entonces 
  EP = 0.75. 
Si a la tienda llegan 20 clientes, este sería un experimento binomial donde n=20 y  = 
0.75 
 
La Función de Probabilidad Binomial 
 
Dado un experimento binomial entonces la v.a.d. binomial X se define como el número 
de éxitos en n intentos, y su función de probabilidad está dada por: 
 
   
 













ootrode
nx
x
n
xXPxf
xnx
mod0
,,2,1,01 
 
Notación:  ~ Binomial ,X n  
 
La Media y la Variancia de X 
 
Si  ~ Binomial ,X n  entonces:        12 nXVarynXE 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 136 
Ejemplo 2 
Un examen consta de n = 25 preguntas, cada una de las cuales tiene 5 alternativas de 
las cuales sólo una es correcta, si una persona está adivinando al responder y se desea 
saber el número de respuestas correctamente respondidas. 
 
Entonces, este es un experimento Binomial con éxito: E={la respuesta es correcta} y 
fracaso: F={la respuesta no es correcta} y siendo:  
5
1
 EP . 
Sea la v.a. X=El número de respuestas correctas en las 25 preguntas, 
)2.0,25(BinomialX  
 
La distribución de probabilidad Binomial será: 
  52...,,2,1,08.02.0
25
25 





  x
x
xf xx 
 
La probabilidad de que la persona acierte por lo menos 3, pero menos de 5 preguntas 
es: 
 
3225.01358.08.02.08.02.0
)4()3()43()53(
21425
4
22325
3 

CC
XPXPXPXP
 
 
 
Ejemplo 3 
Siguiendo conel Ejemplo 1. 
Éxito: E={un cliente compra} y fracaso: F ={un cliente no compra}. Se sabe que el 
75% de los clientes que llegan hacen una compra, entonces   EP = 0.75. 
Si a la tienda llegan 20 clientes, este sería un experimento Binomial con n=20 y  = 
0.75. 
 
Solución. 
Sea v.a. X=El número de clientes que hacen una compra. La distribución de 
probabilidades se define:   02...,,2,1,025.075.0
20
20 





  x
x
xf xx 
La probabilidad de que el número de clientes que hacen una compra sea mayor que 18 
sería: 
19 1 20 0
20 20
( 18) 0.75 0.25 0.75 0.25 0.0211 0.0032 0.0243
19 20
P X
   
        
   
 
 
Ejemplo 4 
Una compañía vendedora de equipos electrónicos verifica que de todas las máquinas 
por ella instaladas, el 40 % exigen nuevos ajustes después de su instalación. Si 5 
máquinas fueron seleccionadas al azar: 
 
a. ¿Cuál es la probabilidad de que al menos 3 requieran trabajos de ajuste después de 
la instalación? 
 
El experimento aleatorio que consiste en determinar el número de máquinas que 
requieren ajustes, en un grupo de 5, es un experimento Binomial con éxito: 
E={una máquina requiere ajustes} y   4.0 EP . 
 
La v.a.d. X definida como el número de máquinas, que requieren ajustes, en un 
grupo de 5, es una v.a. binomial.    4.0,5~,~ BinnBinX  , entonces: 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 137 
 
  5,4,3,2,1,06.04.0
5
5 





  x
x
xf xx 
        3174.00102.00768.02304.06.04.0
5
5433
5
3
5 





 


x
xx
x
fffXP 
b. La compañía estima que el costo del ajuste después de la instalación es de 100 um 
por máquina y que este costo lo debe pagar la compañía ¿Cuál es el costo esperado 
para la firma? 
 
Solución.- 
Sea la v.a. Y definida como el costo de las máquinas que necesitan ajuste en un 
grupo de 5. 
Y = 100 X y como: 
 ,~ nBinX , entonces   24.05  nXE por lo tanto: 
 
     100 100 100 2 200E Y E X E X um     
 
 
Ejemplo 5 
El gimnasio “El Rápido” ha comprobado que el 20% de sus alumnos se dan de baja 
durante el primer mes y el 80% restante permanecen todo el año. Suponga que este 
año se inscribieron 20 alumnos. 
 
a. ¿Cuál es la probabilidad de que se den de baja más de dos alumnos? 
 
Sea la v.a. X=número de alumnos que se dan de baja en el gimnasio. 
π=0.20 y n=20; entonces: X ~ Binomial (20;0.20) 
 
p(X > 2) =1- p(X ≤ 2) =1-0.20608472 = 0.79391528 
 
b. ¿Cuál es la probabilidad de que permanezcan 12 alumnos todo el año? 
Sea la v.a. Y=número de alumnos que permanecen todo el año en el gimnasio. 
π=0.80 y n=20; entonces: Y~ Binomial (20;0.80) 
 
 P(Y=12) = 0.02216088 
 
c. Al hacer la inscripción se realiza un único pago anual de $ 600. Si cada alumno que 
permanece todo el año genera un gasto anual para el gimnasio de $ 150, ¿cuál es el 
beneficio anual esperado para el gimnasio? 
 
 Ingreso: I = 600*20=12000 Gasto: G= 150*(20-X) 
 Beneficio: B = I – G = 12000 - (3000 – 150X) = 9000+150 X 
 Se tiene: E(X) = 20*0.2=4 
 E(B) = 9000+150*4 = 9600 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 138 
Ejercicio 1. Se conoce por experiencias anteriores que el 20% de las plantas de 
limonero son atacadas por cierta plaga. Si se desea llevar a cabo un experimento con 
10 plantas. 
 
a. Defina la variable aleatoria y su distribución de probabilidades 
 
 
 
 
 
 
 
 
 
 
 
 
b. ¿Cuál será la probabilidad de que 5 plantas sean atacadas? 
 
 
 
 
 
 
 
c. ¿Cuál será la probabilidad de que 3 o más plantas sean atacadas? 
 
 
 
 
 
 
 
d. ¿Cuál será la probabilidad de que más de 1 pero menos de 5 plantas sean 
atacadas? 
 
 
 
 
 
 
 
 
e. ¿Cuál es el número esperado de plantas enfermas en la muestra?. ¿Cuál es la 
desviación estándar? 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 139 
Ejercicio 2. Una institución educativa conmemora sus 100 años de fundación, con tal 
motivo la junta directiva ha invitado a sus 25 profesores fundadores a la ceremonia 
principal. Se cree que la probabilidad de que un profesor fundador asista a la ceremonia 
es de 0.75. 
 
a. ¿Cuál es la probabilidad de que al menos 96% de los profesores fundadores asistan? 
 
 
 
 
 
 
 
 
 
b. Si ya confirmaron su asistencia al menos dos profesores fundadores, ¿cuál es la 
probabilidad de que asistan más de 23 profesores fundadores? 
 
 
 
 
 
 
 
c. La empresa que da servicios de buffet cobra por persona $35, halle el costo 
esperado para la ceremonia. 
 
 
 
 
 
 
 
Ejercicio 3. Un inspector de la SUNAT realiza 12 visitas cada día a las bodegas de Lima 
Metropolitana, aplicando una multa a las bodegas que no entregaron el comprobante de 
venta. Sabiendo que la probabilidad de que una bodega sea multada es igual a 0.15. 
 
a. Halle la probabilidad que el inspector multe a lo más dos bodegas 
 
 
 
 
 
 
b. Halle la probabilidad de que se multen más de tres pero menos de seis bodegas 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 140 
c. Halle la probabilidad que ninguna bodega sea multada 
 
 
 
 
 
 
 
Ejercicio 4. Un estudiante se presenta a un examen de selección múltiple contiene 20 
preguntas cada una con 5 respuestas opcionales (de las cuales sólo una es la correcta). 
El estudiante está adivinando al momento de responder cada pregunta. Si para aprobar 
el curso el estudiante debe responder correctamente más de 17 preguntas 
correctamente. ¿Cuál es la probabilidad de que desapruebe el examen? 
 
 
 
 
 
 
 
 
 
 
 
 
8.2 La Distribución Hipergeométrica 
 
Los supuestos que se consideran para una distribución hipergeométrica son: 
 
1. La población o conjunto donde se hace el muestreo tiene N elementos, individuosu 
objetos (una población finita) 
2. Cada elemento puede ser caracterizado como un éxito (E) o fracaso (F), y hay A 
éxitos en la población entonces son (N-A) fracasos. 
3. Se saca una muestra, sin reemplazo, de n elementos de tal forma que sea 
igualmente probable obtener cada subconjunto de tamaño n. 
 
La Función de Probabilidad Hipergeométrica 
La v.a.d. hipergeométrica X está definida como el número de éxitos en la muestra de 
tamaño n. 
Notación:  ~ Hiper , ,X N n A 
Si  ~ Hiper , ,X N n A entonces su distribución de probabilidad es: 
 
       AnxNAnmáxqtenteroxpara
n
N
xn
AN
x
A
xXPxf ,min,0. 




















 
 
 
La Media y la Variancia de X 
Si  ~ Hiper , ,X N n A entonces:     














1
1, 2
N
nN
N
A
N
A
nXVar
N
A
nXE  
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 141 
Ejemplo 6 
Un embarque de sustancias químicas llega en 15 contenedores, 2 de los cuales no 
cumplen con los requerimientos de pureza. Se eligen 3 contenedores al azar, sin 
reemplazo, para hacer una inspección de la pureza del producto. Calcule la probabilidad 
de que al menos uno de los contenedores que no cumplen los requerimientos esté en la 
muestra. 
 
La v.a.d. hipergeométrica X se define como el número de contenedores que no cumplen 
los requisitos, entonces    ~ Hiper , , ~ Hipe 15,3,2X N n A r por lo tanto: 
        2,1,02,3min2153,0,
3
15
3
132




















 xoxmáx
xx
xXPxf 
      3714.0
3
15
1
13
2
2
3
15
2
13
1
2
211 





































 XPXPXP 
 
Ejemplo 7 
Una estación experimental se compone de 4 ingenieros agrónomos y 9 técnicos 
agrícolas. Si se elige al azar y sin reemplazo a 3 individuos para asignarlos a un trabajo 
de campo, ¿cuál es la probabilidad que el grupo asignado al trabajo de campo incluya al 
menos 2 ingenieros agrónomos? 
 
Sea la v.a. x: Número de ingenieros agrónomos incluidos en el trabajo de campo. 
 
 ~ 13,3,4x H 13N , 3n , 4A , x=0,1,2,3 
      203.0014.0189.0
3
13
3
4
33
413
3
13
2
4
23
413
322 









































 xpxpxp 
 
Ejemplo 8 
Un determinado antibiótico es empacado en cajas de 20 botellas. Suponga que una 
caja, la cual es enviada a una farmacia hay 5 botellas mal envasadas. El dueño de la 
farmacia sospecha que la cantidad de antibiótico en algunos de frascos es insuficiente 
por lo selecciona al azar y sin reemplazo una muestra de tres frascos y decide que si 
encuentra la mitad o más de frascos mal envasados en esa muestra cambiará de 
distribuidor. ¿Cuál es la probabilidad de que el dueño de la farmacia no cambie de 
distribuidor? 
 
Solución.- 
 20N 3n A=5 N-A = 15 3,2,1,0x 
 )1()0()2(  xPxPxP































3
20
2
15
1
5
3
15
0
5
=0.859 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 142 
Ejercicio 5. Un lote contiene 15 semillas de cierto cultivo, de los cuales 8 están 
dañadas. Si del lote se toma una muestra aleatoria sin reemplazo de 5 semillas. 
 
a. Defina la variable aleatoria y su distribución de probabilidades 
 
a. 
 
 
 
 
 
 
 
 
 
b. ¿Cuál es la probabilidad de que en la muestra haya tres semillas dañadas? 
b. 
 
 
 
 
 
 
c. ¿Cuál es la probabilidad de que la muestra no contengan semillas dañadas? 
 
 
 
 
 
 
 
d. Halle la media y variancia del número de semilla dañadas 
 
 
 
 
 
 
 
 
Ejercicio 6. En el almacén de una compañía hay 10 impresoras y 4 de ellas son 
defectuosas. Un usuario selecciona al azar y sin reemplazo 5 de ellas para usarlas. 
 
a. ¿Cuál es la probabilidad de que las cinco impresoras seleccionadas no tengan 
defectos? 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 143 
b. El usuario regresa las defectuosas para su reparación. Se sabe que cuesta 50 u.m. 
reparar cada impresora. Calcule el promedio y la variancia del costo total de 
reparación. 
 
 
 
 
 
 
 
Ejercicio 7. Un ingeniero zootecnista sabe que en cierta región hay 8 individuos de una 
especie de mamífero, de los cuales cinco son machos y el resto son hembras. Si 
selecciona al azar a cuatro individuos y observa el número de machos seleccionados. 
 
a. ¿Qué valores posibles podría tomar la variable mencionada? 
 
 
 
 
 
 
b. ¿Cuál es la probabilidad que haya más de un macho? 
 
 
 
 
 
 
 
 
 
 
c. ¿Cuál es la probabilidad que haya el mismo número de machos y hembras? 
 
 
 
 
 
 
 
d. Halle la media y la varianza 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 144 
8.3 La Distribución de Poisson 
 
Una v.a.d. X tiene distribución Poisson con parámetro 0 si su función de 
probabilidad es: 
    ,2,1,0
!


x
x
e
xXPxf
x
 
 
Propiedades de un Proceso de Poisson 
 
El proceso de Poisson es un experimento aleatorio en el que ocurren sucesos en un 
intervalo dado de longitud t. 
 
1. Los sucesos son de la misma clase u homogéneos. 
2. Los sucesos en un intervalo son independientes de los sucesos en otros 
intervalos no superpuestos. 
3. El promedio de sucesos por unidad de intervalo (t = 1), es conocido e igual a v. 
 
Como ejemplos de variables aleatorias Poisson, se tienen las siguientes: 
 
a. El número de accidentes fatales por semana en una ciudad. 
b. El número de fallas que hay en cada 2.5 m2 de tela. 
c. El número de renacuajos por cada 4 litros de agua, en cierto estanque. 
 
Función de Probabilidad para un Proceso de Poisson 
 
La v.a.d. X definida como el número de sucesos que ocurren en intervalos de tamaño t. 
   
 
,2,1,0
!


x
x
tve
xXPxf
xtv
 
donde:v = promedio de sucesos por unidad de intervalo. 
 t = tamaño del intervalo (ejemplo: t = 2.3, t = 5.8 etc.). 
 vt = promedio de sucesos por intervalo de tamaño tNotación:  vtPoisX ~ 
También se puede expresar:     ,2,1,0
!


x
x
e
xXPxf
x
 
Donde   PoisXvt ~, 
 
La Media y la Variancia de X 
 
Si  PoisX ~ entonces:     vtconXVaryXE   2 
 
Ejemplo 9 
Los mensajes que llegan a una computadora, utilizada como servidor, lo hacen de 
acuerdo con una distribución Poisson con una tasa promedio de 10 mensajes por hora. 
 
a. Calcule la probabilidad de que lleguen 7 mensajes en 2 horas. 
 
Sea la v.a Y = El número de mensajes que llegan al servidor en 2 horas.(t = 2) 
Unidad de intervalo = 1 hora 
v=promedio de sucesos por unidad de intervalo = 10 
 
t=tamaño del intervalo = 2 
vt = promedio de sucesos por intervalo de tamaño t = 10x2 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 145 
Y ~ Pois (vt) ~ Pois (102) ~ Pois (20) , entonces: 
 
   
20 20
0, 1, 2,
!
ye
f y P Y y y
y

    
 
20 720
7 0.00052
7 !
e
P Y

   
 
b. Encuentre el intervalo de tiempo necesario para que la probabilidad de que no 
lleguen mensajes, durante ese lapso, sea 0.9. 
 
Sea la v.a Z = El número de mensajes que llegan al servidor en k horas.(t = k) 
 
Z ~ Pois (vt) ~ Pois (10k) ~ Pois (10k) , entonces: 
 
   
 10 10
0, 1, 2,
!
zke k
f z P Z z z
z

    
 
 
010
10
10
0 0.9 0.0105
0 !
k
k
e k
P Z e k horas

      
Nota: La ecuación anterior se resolvió tomando logaritmos. 
 
Ejemplo 10 
Se cree que el número promedio de individuos por cada 2 km2 de cierta especie de 
mamífero que habita en las alturas de cierta región es de 1.2. 
 
a. En una zona de 2.8 km2, ¿ cuántos individuos esperaríamos en promedio 
encontrar?. 
 
Sea la v.a. X=Número de individuos en 2 km2 
El número de individuos que habitan en promedio será: 2.8(1.2) / 2 1.68   
 
b. Si se observa un área de 3 km2 en dicha región, ¿cuál es la probabilidad que se 
encuentren más de 3 individuos de esta especie? 
 
Sea la v.a. X: Número de individuos en 3km21 
 1.83
0
3(1.2) / 2 1.8
(1.8)
( 3) 1 ( 3) 1 1 0.8912 0.1087
!
x
x
e
p x p x
x


 
        
 
 
c. Si se selecciona dos áreas independientemente de 3 km2 cada una. ¿Cuál es la 
probabilidad que en cada una de estas áreas haya más de 2 individuos? 
 
Probabilidad que haya en un área de 3 km2 más de 2 individuos: 
1.82
0
(1.8)
( 2) 1 ( 2) 1 0.269378
!
x
x
e
p x p x
x
       
 Probabilidad que haya en un área de 3km2 más de dos individuos. 
 
Y: número de áreas con más de dos individuos. Y: 0, 1, 2. 
 
2( 0) (1 0.2694) 0.5338p y     
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 146 
Ejercicio 8. 
Se sabe que el número de encuestas digitadas es una variable aleatoria que sigue un 
proceso de Poisson con una media de 6 encuestas digitadas por hora. 
 
a. Defina la variable aleatoria y su distribución de probabilidad 
 
 
 
 
 
 
 
 
 
 
b. ¿Cuál es la probabilidad que se digite a 4 encuesta en 25 minutos? 
 
 
 
 
 
 
 
c. ¿Cuál es la probabilidad que se digite al menos 2 encuestas en 80 minutos?. 
 
 
 
 
 
 
 
d. ¿Cuál es la probabilidad que se digite exactamente 3 en media hora? 
 
 
 
 
 
 
 
e. ¿Cuál es la probabilidad que se digite al menos 2, si se sabe que ya se digitaron 
menos de 5 encuestas en 45 minutos?. 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 147 
f. Halle el coeficiente de variabilidad del número de encuestas digitadas por hora. 
 
 
 
 
 
 
Ejercicio 9. El número de barcos que llegan a un puerto cada semana es una variable 
aleatoria que tiene distribución de Poisson con media igual a 9 barcos. 
 
a. ¿Cuál es la probabilidad que en una semana lleguen exactamente 5 barcos? 
 
 
 
 
 
 
 
 
b. ¿Cuál es la probabilidad de que en tres días lleguen a lo más 2 barcos? 
 
 
 
 
 
 
 
 
 
c. Un aduanero sabe que el costo de mantenimiento del puerto por semana está en 
función del número de barcos que arriban, si no llegan barcos el costo es de 2 mil 
soles si llega un barco el costo es de 3 mil soles y si llegan dos o más barcos el 
costo es de 5 mil soles. Halle la distribución del costo y el costo esperado por 
mantenimiento del puerto por semana. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 148 
Práctica Dirigida N° 5 
 
1. El siguiente gráfico muestra la distribución de probabilidades de la variable aleatoria 
X, definida como el número de reclamos de los clientes de una compañía de 
seguros. 
 
 
 
a) Halle la probabilidad que la compañía de seguros tenga al menos 6 reclamos. 
 
 
 
 
 
 
 
 
 
 
 
b) Si la empresa estima que por cada reclamo el tiempo perdido es de 10 minutos. 
Calcule el coeficiente de variación del tiempo perdido por los reclamos. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Distribución del número de reclamos
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0 2 4 6 8 10
Número de reclamos
f(x)
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 149 
2. En el día de estreno de la película Star War, se formaron grandes colas para sacar 
una entrada. Se sabe que el tiempo (en minutos) que demoró un espectador en 
comprar una entrada de la película es una variable aleatoria que tiene la siguiente 
función de probabilidad. 
 
 
 
 
 
 
 
a. ¿Cuál es la probabilidad de que un espectadordemore un tiempo menor a 10 
minutos en comprar una entrada a la película de estreno? 
 
 
 
 
 
 
 
 
b. Halle el tiempo esperado y su coeficiente de variación 
 
 
 
 
 
 
 
 
 
 
 
 
 
c. Si se extrae una muestra de 6 espectadores, halle la probabilidad que dos hayan 
demorado más de 10 minutos en comprar una entrada para la película de 
estreno. 
 
 
 
 
 
 
 
 
 
 
 
 
 







casootro
xx
xf
0
128,
40
1
)(
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 150 
3. La Oficina de Fiscalización de una municipalidad ha iniciado una campaña de las 
normas de seguridad de los locales que realizarán la Fiesta de Fin de Año. Con esta 
finalidad se selecciona una muestra con reemplazo de 10 locales del distrito. 
Sabiendo que en campañas pasadas que 24% de los locales no cumplen con las 
normas de seguridad. 
 
a. Defina la variable aleatoria en estudio y su distribución de probabilidad. 
 
 
 
 
 
 
 
 
 
b. Halle la probabilidad que al menos dos locales no cumplan con las normas de 
seguridad. 
 
 
 
 
 
 
 
 
c. Halle la probabilidad de que más de tres pero menos de siete locales no cumplan 
con las normas de seguridad. 
 
 
 
 
 
 
d. Halle la probabilidad que a lo más 8 de los locales cumplan con las normas de 
seguridad. 
 
 
 
 
 
 
 
e. ¿Cuántos locales se esperan que cumplan con las normas de seguridad?. 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 151 
4. En la oficina de recursos hídricos de una entidad estatal, existen 6 ingenieros 
agrícolas y 4 ingenieros civiles. Se sabe que la oficina debe enviar a 5 ingenieros 
para un curso de capacitación en Manejo del Agua. 
 
a. Defina la variable aleatoria en estudio y su distribución de probabilidad, para los 
ingenieros agrícolas. 
 
 
 
 
 
 
 
 
 
 
b. ¿Cuál es la probabilidad que asista al curso al menos dos ingenieros agrícolas?. 
 
 
 
 
 
 
 
 
c. ¿Cuál es la probabilidad que asista ningún ingeniero agrícola? 
 
 
 
 
 
 
 
d. ¿Cuál es la probabilidad que asistan al curso tres ingenieros civiles? 
 
 
 
 
 
 
 
e. Si el costo por persona para asistir al curso es $350 más $50 por movilidad. 
¿Cuál es el costo esperado que pagará la entidad estatal para que asistan al 
curso los ingenieros agrícolas?. 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 152 
5. Una empresa que ofrece los servicios de la tecnología de Computación en la Nube 
(Cloud Computing), desea analizar la capacidad de sus servidores con la finalidad 
de ampliar los servicios a pequeñas empresas del interior del país. Si se sabe que el 
número de mensajes que llegan a su servidor central, lo hacen de acuerdo con una 
distribución de Poisson con una tasa promedio de 1.5 mensajes por minuto. 
 
a. Calcule la probabilidad de que llegue al menos dos mensaje en media hora. 
 
 
 
 
 
 
 
 
b. Calcule la probabilidad de que llegue como máximo tres mensaje en una hora. 
 
 
 
 
 
 
 
 
c. Si se sabe que ya llegaron al menos tres mensajes, calcule la probabilidad que 
lleguen a lo más seis mensajes en 10 minutos 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 153 
EJERCICIOS PROPUESTOS 
 
1. Halle la probabilidad de que exactamente 9 de 10 tubos de vacuna duren como 
mínimo 1000 horas. La probabilidad que estos tubos duren como mínimo 1000 
horas es de 0.80. 
 
2. El número de rayos gamma emitidos por segundo, por cierto sustancia radioactiva 
es una variable aleatoria que tiene una distribución de Poisson con parámetro igual 
a 5.6. Si un instrumento de medida se daña cuando recibe por lo menos 3 
radiaciones por segundo. ¿Cuál es la probabilidad que este instrumento se dañe? 
 
3. La posibilidad de que cada muestra de aire contenga una molécula rara es 10 %. Si 
se van a tomar 18 muestras para analizar y asumiendo que las muestras son 
independientes con respecto a la presencia de la molécula. Halle la probabilidad de 
que exactamente 2 muestras contengan la molécula rara. 
 
4. Juan es un dentista que atiende todos los días a sus clientes de 9:00 am a 4:00pm y 
se ha registrado el número de clientes atendidos cada tres días, en una muestra de 
tamaño 5 obteniéndose: 18, 21, 19, 20 y 17. Se sabe que el número de clientes que 
van a consultar sigue una distribución de Poisson. 
 
a. Si se observa 5 días de atención. ¿Cuál es la probabilidad de que sólo hayan ido 
tres personas a consultar al dentista? 
b. Encuentre el intervalo de tiempo necesario para que la probabilidad de que no 
lleguen clientes sea 0.08. 
 
5. En una población de drosóphila, que ataca a cierta variedad de fruta, se sabe que el 
25% ha desarrollado mutación en las alas. Si se escogen aleatoriamente 6 moscas 
de esta población: 
a. ¿Cuál es la probabilidad de que 2 de estas moscas presenten mutación de alas? 
b. ¿Cuál es la probabilidad que más de tres presenten mutación de alas? 
c. ¿Cuál es la probabilidad que a lo más unamosca presente mutación de alas? 
d. Si se sabe que más de una presenta mutación de alas, ¿Cuál es la probabilidad 
que como máximo 4 presenten mutación de alas? 
 
6. La probabilidad que la llanta trasera derecha de un auto tipo “Tico” reviente al 
entrar a una curva es de 0.05. Encontrar la probabilidad que de 16 autos tipo “Tico” 
que pasan por la curva: 
a. Se revienten la llanta trasera derecha de a lo más 3 autos 
b. Se revienten la llanta trasera derecha de dos o más autos. 
 
7. En una pecera se encuentra 20 pececillos ornamentales, de los cuales cinco son de 
color anaranjado y el resto no. El dueño de esta pecera ha decidido regalar la 
pecera a su mejor amigo si al seleccionar una muestra al azar sin reemplazo de tres 
pececillos la mitad o menos son de color anaranjado. ¿Cuál es la probabilidad que el 
dueño de la pecera regale ésta a su mejor amigo? 
 
8. En un estudio se encontró que el número total de animales muertos cerca de una 
carretera de 30 Km. fue de 18. Si el número de animales muertos cerca de la 
carretera tiene distribución Poisson, calcule la probabilidad de encontrar al menos 2 
animales muertos en 4.5 Km. de carretera. (Sugerencia v = 18/30 = 0.6). 
 
9. Dos cápsulas se seleccionan sin reemplazo de un frasco que contiene tres aspirinas, 
dos sedantes y cuatro cápsulas laxantes. ¿Cuál es la probabilidad de no seleccionar 
aspirinas? 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 154 
10. Se sabe que en el centro de Lima ocurre en promedio un asalto cada dos minutos 
entre las 6:00 p.m. y las 8:00 p.m. María sale de su trabajo a las 6:30 p.m. y debe 
caminar desde la Plaza San Martín hasta la Av. Tacna con dirección hacia el 
paradero. Si el trayecto le toma 4 minutos. ¿Cuál es la probabilidad que María llegue 
a su paradero sin que haya ocurrido algún asalto? 
 
11. Los pasajeros de las aerolíneas llegan al azar e independientemente a la sección de 
documentación de un aeropuerto con una frecuencia promedio de llegadas de 10 
pasajeros por minuto. ¿Cuál es la probabilidad de que a lo más un pasajero llegue 
en 15 segundos? 
 
12. Un determinado antibiótico se envía a las farmacias en cajas de 24 frascos. El 
farmacéutico sospecha que la cantidad de antibiótico en algunos de los frascos es 
insuficiente y decide analizar el contenido de 5 frascos escogidos al azar sin 
reemplazo. Suponga que 14 de los 24 frascos tienen cantidad insuficiente de 
antibióticos. ¿Cuál es la probabilidad de que por lo menos 4 frascos tengan cantidad 
suficiente de antibióticos? 
 
13. Según una encuesta hecha a un grupo de 10 personas, seis de ellas prefieren la 
gaseosa Inca Kola y 4 de ellas Coca Cola. Si se seleccionan a 3 personas de ese 
grupo. ¿Cuál es la probabilidad de que hayan 2 que les guste Inca Kola? 
 
14. Se sabe, por experiencia, que el 42% de todas las personas que reciben un ejemplar 
gratuito de una revista se suscriben a ella, calcule la probabilidad de que, a lo más 3 
de las 6 personas seleccionadas al azar que reciben un ejemplar gratuito de una 
revista se suscriben a la revista. 
 
15. Si el número de solicitudes de información sobre cruceros que recibe una agencia de 
viajes por día es una variable que tiene una distribución de Poisson con variancia 
2.4. Halle la probabilidad de que: 
 
a. Ningún solicitante sea recibido en medio día. 
b. Al menos dos solicitantes sean recibidos en dos días. 
 
16. Se cree que el número promedio de individuos por cada 2 km2 de cierta especie de 
mamífero que habita en las alturas de cierta región es de 1.2. Además se conoce 
que el número de individuos por área de esa región tiene una distribución de 
Poisson. 
a. En una zona de 2.8 km2, cuántos individuos esperaríamos en promedio 
encontrar. 
b. Si se observa un área de 3 km2 en dicha región, ¿cuál es la probabilidad que se 
encuentren más de 3 individuos de esta especie? 
c. Si se selecciona dos áreas independientemente de 3km2 cada una. ¿Cuál es la 
probabilidad que en cada una de estas áreas no haya más de 2 individuos? 
 
17. La empresa FERTISA se dedica a la producción de fertilizantes y tiene ciertos 
problemas en el envasado de sus productos. Un lote de 100 sacos que contienen 8 
defectuosamente envasados ha sido remitido a la firma Agrouna. 
a. Si dicha firma selecciona 10 sacos aleatoriamente, ¿cuál es la probabilidad de 
que encuentre 3 sacos mal envasados? 
b. Dicha firma aceptará el lote si al seleccionar 10 sacos no encuentra defecto en 
ninguno de ellos. Si se remiten 10 lotes con 8 sacos defectuosos cada uno, ¿cuál 
es la probabilidad de que a lo más 1 lote sea rechazado? 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 155 
18. Un biólogo marino ha determinado que el número de avistamientos promedio de 
mamíferos marinos por hora en alta mar es de 3.2. 
a) Si decide contar el número de ejemplares durante 4 horas ¿cuál es la 
probabilidad de que se observe entre 10 y 12 ejemplares (ambos números 
incluidos)? 
b) Si se establecen jornadas de trabajo de 6 horas, ¿cuál será el número promedio 
de avistamientos por jornada? 
c) Se sabe también que el 35% de los avistamientos corresponden a delfines. Si en 
un día se observaron 10 animales, ¿cuál es la probabilidad de que se hayan 
observado por lo menos 2 delfines? 
 
19. Los agricultores de una región están preocupados por la calidad de sus cosechas, 
ya que se ha detectado en ciertas áreas la existencia de sustancias contaminantes 
en el suelo. Para analizarla, se segmenta la tierra en parcelas de 100 m2, y se 
concluye que hay una probabilidad de 0.6 de encontrar estos contaminantes en una 
determinada parcela. Se pide: 
a) Si un agricultor posee 15 de estas parcelas. ¿Qué probabilidad hay de que tenga 
alguna parcela contaminada? 
b) Una comunidad posee 100 parcelas del tipo anterior. ¿Qué probabilidad hay de 
que tenga entre 10 y 15 parcelas contaminadas? 
c) Si por cada parcela contaminada la cooperativa sufre una pérdida de 1000 
nuevos soles, ¿cuál es la pérdida que la comunidad espera tener?. 
 
 
20. El gerente de una empresa dedicada realizar copias de CD sabe por información 
histórica el 93% de los CD que provee la compañía Lotus international son no 
defectuosos. Si selecciona al azar 5 CD, ¿cuál es la probabilidad que 3 sean no 
defectuosos, si se sabe que al menos uno es no defectuoso? 
 
21. Por factores internacionales el precio del petróleo ha sufrido ciertas variaciones en 
los últimos meses. REPLUSA ha determinado que la probabilidad de que varíe el 
precio del petróleo es de 0.60. Si se va a realizar 10 compras de petróleo: 
¿Cuál es la probabilidad que el número compras de petróleo donde el precio tiene 
variación sea menor que su esperado? 
 
22. Los camiones que reparten el combustible a los diferentes grifos de la capital llegan 
a las instalaciones de la refinería a un promedio de tres cada 20 minutos. Si las 
instalaciones sólo tienen capacidad para recibir 10 camiones por hora, ¿cuál es la 
probabilidad de que una hora los camiones tengan que regresar en otro momento?
 
23. El siguiente gráfico muestra la distribución de probabilidades de la variable aleatoria 
X, definida como el número de reclamos de los clientes de una compañía de 
seguros. 
 
 
Distribución del número de reclamos
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0 2 4 6 8 10
Número de reclamos
f(x)
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 156 
c) Halle la probabilidad que la compañía de seguros tenga al menos 6 reclamos. 
d) Si la empresa estima que por cada reclamo el tiempo perdido es de 10 minutos. 
Calcule el coeficiente de variación del tiempo perdido por los reclamos. 
 
24. En el día de estreno de la película Star War, se formaron grandes colas para sacar 
una entrada. Se sabe que el tiempo (en minutos)que demoró un espectador en 
comprar una entrada de la película es una variable aleatoria que tiene la siguiente 
función de probabilidad. 
 
 
 
 
 
a) ¿Cuál es la probabilidad de que un espectador demore un tiempo menor a 
10 minutos en comprar una entrada a la película de estreno? 
b) Halle el tiempo esperado y su coeficiente de variación 
c) Si se extrae una muestra de 6 espectadores, halle la probabilidad que dos 
hayan demorado más de 10 minutos en comprar una entrada para la 
película de estreno. 
 
25. La Oficina de Fiscalización de una municipalidad ha iniciado una campaña de las 
normas de seguridad de los locales que realizarán la Fiesta de Fin de Año. Con esta 
finalidad se selecciona una muestra con reemplazo de 10 locales del distrito. 
Sabiendo que en campañas pasadas que 24% de los locales no cumplen con las 
normas de seguridad. 
 
f. Defina la variable aleatoria en estudio y su distribución de probabilidad. 
g. Halle la probabilidad que al menos dos locales no cumplan con las normas de 
seguridad. 
h. Halle la probabilidad de que más de tres pero menos de siete locales no cumplan 
con las normas de seguridad. 
i. Halle la probabilidad que a lo más 8 de los locales cumplan con las normas de 
seguridad. 
j. ¿Cuántos locales se esperan que cumplan con las normas de seguridad?. 
 
26. En la oficina de recursos hídricos de una entidad estatal, existen 6 ingenieros 
agrícolas y 4 ingenieros civiles. Se sabe que la oficina debe enviar a 5 ingenieros 
para un curso de capacitación en Manejo del Agua. 
 
a. Defina la variable aleatoria en estudio y su distribución de probabilidad, para los 
ingenieros agrícolas. 
b. ¿Cuál es la probabilidad que asista al curso al menos dos ingenieros agrícolas?. 
c. ¿Cuál es la probabilidad que asista ningún ingeniero agrícola? 
d. ¿Cuál es la probabilidad que asistan al curso tres ingenieros civiles? 
e. Si el costo por persona para asistir al curso es $350 más $50 por movilidad. 
¿Cuál es el costo esperado que pagará la entidad estatal para que asistan al 
curso los ingenieros agrícolas?. 
 
27. Una empresa que ofrece los servicios de la tecnología de Computación en la Nube 
(Cloud Computing), desea analizar la capacidad de sus servidores con la finalidad 
de ampliar los servicios a pequeñas empresas del interior del país. Si se sabe que el 
número de mensajes que llegan a su servidor central, lo hacen de acuerdo con una 
distribución de Poisson con una tasa promedio de 1.5 mensajes por minuto. 
a. Calcule la probabilidad de que llegue al menos dos mensaje en media hora. 
b. Calcule la probabilidad de que llegue como máximo tres mensaje en una hora. 
c. Si se sabe que ya llegaron al menos tres mensajes, calcule la probabilidad que 
lleguen a lo más seis mensajes en 10 minutos 
 
 







casootro
xx
xf
0
128,
40
1
)(
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 157 
Preguntas de Autoevaluación 
 
1. Los parámetros de la distribución Binomial son _______________________, de la 
distribución Hipergeométrica son _________________________ y la distribución 
Poisson son ________________________ 
 
2. La distribución Binomial está asociada al muestreo __________________________ 
mientras la distribución Hipergeométrica al muestreo _______________________ . 
3. Si X  Poisson(4) e Y  Bin(10,0.35), entonces el coeficiente de variabilidad de X e Y 
son ______________________________________ respectivamente. 
4. Sea la variable aleatoria: X=Número de autos que vende diariamente una 
distribuidora, con una media igual a 8.5 y una variancia de 6.25, sabiendo que la 
ganancia (en $) de la distribuidora se puede definir por: G=550 X – 200, entonces 
la desviación estándar de la ganancia será ______________________________. 
 
5. Si en una poza de crianza hay 200 truchas, de las cuales el 45% son hembras. Si se 
toma una muestra aleatoria con reemplazo de 20 truchas, la variable aleatoria 
número de truchas hembras tiene una distribución _________________________. 
 
6. Sea la variable aleatoria H~Hip(N=18,n=12,A=8) entonces el rango de H es el 
conjunto ________________________. 
 
7. Si la variable aleatoria X=Número de llamadas que a una central telefónica en una 
hora tiene una distribución Poisson y P(X=2)=2/3P(X=1), entonces el número 
esperado de llamadas que llegan en una hora es igual a ______________________ 
 
8. El rango de una variable aleatoria que se distribuye como una Binomial es un 
conjunto _____________________, para una Hipergeométrica es un conjunto 
_________________________ y para una Poisson ________________________. 
 
9. En un terreno después de rociar con cierto insecticida, se determinó que el número 
promedio de insectos vivos es de 4.5 por cada 2 mt2. Asumiendo que el número de 
insectos vivos tiene distribución Poisson, la probabilidad de que en 1.5 mt2 de 
terreno se encuentren 5 insectos vivos es ________________________________. 
 
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados: 
 
Item Enunciado V/F 
a. En un experimento binomial, la probabilidad de éxito de un intento a 
otro puede variar. 
 
b. Si la variable aleatoria X se distribuye como una Binomial con 
P(Éxito)=0.5, entonces la probabilidad de k éxitos es igual a la 
probabilidad de k fracasos. 
 
c. Si X es una variable aleatoria que se distribuye como una 
Hipergeométrica, entonces el número de éxitos nunca puede ser mayor 
al de fracasos. 
 
d. Para una variable aleatoria que se distribuye como una Poisson, la 
media y desviación estándar son iguales. 
 
e. El rango de una variable aleatoria que se distribuye como una Poisson 
es un conjunto finito. 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 158 
CAPÍTULO IX 
 
DISTRIBUCIONES CONTINUAS 
 
Se estudiarán algunas variables aleatorias continuas particulares cuya distribución de 
probabilidades se conoce. También se conocerán las principales distribuciones continuas 
y las distribuciones muestrales asociadas a ellas, que se utilizarán posteriormente en 
inferencia estadística (intervalos de confianza y para hacer pruebas de hipótesis). 
 
Objetivo. Al finalizar este capítulo el lector conocerá los conceptos y aplicaciones de las 
principales distribuciones continuas. 
 
 
9.1 Distribución Exponencial 
 
La variable aleatoria continua X tiene distribución exponencial con parámetro β con 
media igual a E(X)= β y variancia V(X) = β2, si su función de densidad es: 
 
 








casootrocualquierpara
xparae
xf
x
0
0;0
1
)(
/ 


 
 
Su notación: X ~ E(β) 
 
Gráficamente se representa: 
 
 
Función acumulada (calcular la probabilidad): 
 
 


 


0<0
0;01
)()(
/
xpara
xparae
xXPxF
x 
< 
 
 
Para hallar percentiles: 





)()>(
)1()<(
pLnkpkXP
pLnkpkXP


 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 159 
 
Ejemplo 1 
El tiempo de demora en entregar una pizza tiene distribución exponencial con media 
igual a 25 minutos. Si la pizzería ofrece su producto con la promoción “si recibe su pizza 
después de 30 minutos usted no paga nada”. Calcule: 
 
a) La probabilidad de que una pizza sea entregada de manera gratuita a un cliente. 
b) Si se entregan 12 pizzas, ¿cuál es la probabilidad de que 3 sean gratuitas? 
c) ¿Cuál debe será el tiempo como máximo, para considerar un pedido de pizza dentro 
del 25% de menor tiempo? 
 
Solución: 
a) Sea X: tiempo de demora en entregar una pizza 
X~ E(25) 
P(pizza gratis) = P(X>30) = 1- P(X≤30) = 3012.0)1(1 25
30
25
30


ee 
 
b) Y= Número de pizzas gratuitas entregadas de un total de 12 
Y~ B(12,p) 
p= P(pizza gratis) = 0.3012 
P(Y=3) = 0.2389 
 
c) Se tiene que: utosxLnkkXP min19.7)25.01(2525.0)(  
 
Ejercicio 1. El tiempo para unproceso de congelamiento de hongos comestibles tiene 
una distribución exponencial con promedio de 4.5 minutos. 
a. ¿Cuál es la probabilidad que un proceso de congelamiento dure a lo más 5 minutos? 
 
 
 
 
 
 
 
 
 
 
b. Se sabe que el proceso de congelamiento no debe durar más de 6 minutos, de lo 
contrario el hongo puede malograse. ¿Cuál es la probabilidad que el hongo se 
malogre? 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 160 
c. ¿Cuál debe ser el tiempo como mínimo para ser considerado un proceso de 
congelamiento, dentro del 20% de mayores tiempos? 
 
 
 
 
 
 
 
 
 
d. ¿Cuál es la desviación estándar del tiempo de congelamiento? 
 
 
 
 
 
 
 
 
9.2 Distribución Normal 
 
La Distribución Normal fue hallada por primera vez en 1733, por A. De Moivre. Pero el 
descubrimiento de De Moivre al parecer pasó inadvertido y fue “redescubierta” por C.F 
Gauss en 1809 y P.S Laplace en 1780 hizo trabajos preliminares que profundizó en 
1812. 
 
En Estadística una buena cantidad de variables continuas (peso, longitud, ingresos, 
temperatura etc.) se consideran que tienen Distribución Normal (se dice que es lo 
normal que tenga esa distribución). 
 
La variable aleatoria continua X tiene distribución normal con media  y variancia 2 si 
su función de probabilidad es: 
 
 
2
1
21 , > 0
2 
x
f x e x

  
 
 
  
         
 
Notación: X  N( , 2) 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 161 
Características de la distribución normal 
 
1. Tiene forma acampanada. 
2. Es simétrica respecto a la recta X =  
3. Es asintótica respecto al eje X 
 
En el gráfico anterior se aprecia dos distribuciones normales con igual promedio pero 
diferente desviación estándar (a menor desviación estándar los datos están más cerca 
de la media) 
 
 
9.3 Distribución Normal Estándar 
 
Si X  N( , 2), entonces la v.a.c. Z = (X - ) /  se dice tiene distribución normal 
estándar; su media es 0, su variancia 1 y su función de probabilidad es: 
 
 
21
2
1
,
2
z
f z e z


     
 
 
 
Prueba 
 
 
 
 
  2
2 2
0
1
E XX X
E Z E E
Var XX X
Var Z Var Var
    
      
  
    
   
          
   
   
        
   
 
 
Esta prueba es incompleta porque sólo demuestra que la media y la variancia de Z son 
0 y 1 respectivamente pero no demuestra que Z tiene distribución normal (esto es tema 
de un libro de Estadística Matemática). 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 162 
Uso de la tabla de la distribución Normal Estándar 
 
 
 
 
 
Ejemplo 2 
La estatura de los estudiantes universitarios de cierto país está normalmente distribuida 
con una media de 167.85 cm y desviación estándar 10.37 cm. 
 
a. Si un estudiante es seleccionado al azar ¿Cuál es la probabilidad de que mida menos 
de 179 cm? 
 
Sea la v.a.c. X = Estatura de los estudiantes universitarios de ese país (cm). 
X  N( , 2)  N(167.85, 10.372) 
   
179 167.85
179 1.07522 ( 1.08) 0.8599
10.37
X
P X P P Z P Z


  
        
 
 
Notación:  0.8599 1.08Z  
Se puede afirmar que el percentil 85.99 de las estaturas es igual a 179 cm y que el 
85.99% de los estudiantes mide menos de 179 cm. 
 
b. Halle la probabilidad de que la estatura de un estudiante que va a ser escogido al 
azar mida por lo menos 152 cm. 
 
     
152 167.85
152 1.53 1 1.53 1 0.0630 0.9370
10.37
X
P X P P Z P Z


  
             
 
 
c. Si se está buscando estudiantes universitarios que midan entre 165 y 195 cm para 
un casting de TV ¿Qué porcentaje de estudiantes cumplen con esa condición? 
 
       
 
165 195 0.28 2.62 2.62 0.28
165 195 0.9956 0.3897 0.6059
P X P Z P Z P Z
P X
          
    
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 163 
d. Si se eligen independientemente 9 estudiantes. Encuentre la probabilidad de que 
siete de ellos midan menos de 179 cm. 
 
     179 , 179 0.8599Exito E X P E P X       
Sea la v.a.d. Y = Número de estudiantes con 179X  
 
   Binomial , Binomial 9,0.8599Y n  
     
7 29
7 0.8599 0.1401 0.2457
7
P Y
 
   
 
 
 
e. ¿Cuál es la altura mínima que debe tener un bus de transporte para que el 97.06% 
de los estudiantes viaje de pie sin dificultad? 
 
 
Según el problema si k es esa altura, entonces: 
 
 
 0.9706
167.85 167.85
0.9706
10.37 10.37
167.85
1.89 187.4493 cm.
10.37
X k k
P X k P P Z
k
Z k


     
         
   

   
 
 
 
Ejercicio 2. El tiempo que se demora en entregar una pizza tiene una distribución 
normal con media 25 minutos y una desviación estándar 4.5 minutos. Si la pizzería 
ofrece su producto con la promoción “si recibe su pizza después de 30 minutos usted no 
paga nada”. 
 
a. ¿Qué porcentaje de pizzas se entregan de manera gratuita a un cliente. 
 
 
 
 
 
 
 
b. ¿Cuál será el tiempo como mínimo, para considerar un pedido de pizza dentro del 
25% de mayor tiempo? 
 
 
 
 
 
 
 
c. Halle el percentil 65. 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 164 
d. Si se eligen 8 pedidos de pizzas al azar ¿cuál es la probabilidad que 3 de ellos 
hayan sido entregado en forma gratuita?. 
 
 
 
 
 
 
 
 
 
 
 
Ejercicio 3. El peso de los huevos de gallina producidos por cierta granja sigue una 
distribución normal de media 65 g y desviación estándar 6 g. Si se selecciona al azar un 
huevo: 
 
a. Halle el porcentaje de huevos cuyo peso se al menos de 61 g 
 
 
 
 
 
 
 
b. Halle la probabilidad que el peso de los huevos sea mayor a 60 pero menos a 74 g. 
 
 
 
 
 
 
 
c. Si los huevos se clasifican según peso en tres categorías: pequeños, medianos y 
grandes. Considerando que los pequeños corresponde al 15% de menores peso y 
los grandes al 25% de mayores peso. Halle los pesos que marcan los límites de 
cada categoría.UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 165 
9.4 Distribuciones muestrales asociadas a la Distribución Normal 
 
Definición de Estadístico 
 
Un estadístico es cualquier cantidad cuyo valor se puede calcular a partir de datos de 
una muestra. Por lo tanto, un Estadístico es una variable aleatoria puesto que su valor 
varía de muestra en muestra, se denotada (casi siempre) por una letra mayúscula; una 
minúscula se emplea para representar el valor calculado u observado del Estadístico. 
 
Ejemplo 3 
La media muestral X , es un estadístico (variable aleatoria) y x , es el valor calculado 
del estadístico. La variancia muestral S2, es un estadístico (variable aleatoria) , y s2 es 
el valor calculado del estadístico. La proporción muestral p, es un estadístico (variable 
aleatoria). 
 
Definición de Muestra Aleatoria 
Una muestra aleatoria es un subconjunto de la población obtenida al azar. 
 
Distribución de la Media Muestral ( X ) 
 
Sea 1, , nX X una muestra de una distribución con media  y desviación estándar 
.Entonces: 
 
Si el muestreo es con reemplazo de una población finita o con o sin reemplazo de una 
población infinita: 
 
En este caso la muestra es aleatoria y se cumplen las siguientes igualdades: 
a.   XE X    
b.  
2
2
X X
Var X y
n n
 
    
 
 El caso de una población con distribución normal 
 
Si 1, , nX X es una muestra aleatoria de una distribución normal con media  y 
desviación estándar  . Entonces, para cualquier n, X está normalmente distribuida 
con media  y variancia 
2
n

 
 
 El caso de una población con distribución no normal 
 
Se aplica El teorema del límite central. Este teorema fundamental de la Estadística 
fue enunciado por primera vez por P.S Laplace en 1812 luego en 1901 A. Liapounoff 
hizo una demostración rigurosa en condiciones bastante generales. 
 
Si 1, , nX X es una muestra aleatoria de una distribución con media  y desviación 
estándar  . Entonces, para n suficientemente grande, X está distribuida 
aproximadamente en forma normal con media  y variancia 
2
n

 . 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 166 
Ejemplo 4 
El tiempo que demora una rata de cierta subespecie seleccionada al azar, para que se 
duerma después de aplicársele un somnífero experimental, es una variable aleatoria 
distribuida con 1.5  min y 0.35  min. Suponga que se seleccionan n ratas y 
denote por 1, , nX X sus tiempos hasta dormirse. 
a. Si el tiempo que demora una rata tiene distribución normal y 1 5, ,X X es una 
muestra aleatoria de tamaño 5 de esa población. Calcule la probabilidad de que la 
media de la muestra sea a lo más 2 min. 
 
Solución: 
 
  1.5XE X     
 
 
22
2
0.35
0.0245 0.1565
5X X
Var X y
n n
 
       
   
2 1.5
2 3.19 0.9993
0.1565
X
X
X
P X P P Z


  
      
 
 
 
b. Si el tiempo que demora una rata tiene distribución desconocida y 1 40, ,X X es una 
muestra aleatoria de tamaño 40 de esa población. Calcule la probabilidad 
aproximada de que el tiempo de demora promedio esté entre 1.35 y 1.60 min. 
 
Solución: 
Por el teorema del límite central el tiempo promedio de la muestra tiene, 
aproximadamente, distribución normal con 
   
 
22
2
0.35
1.5 0.0030625
40X X
E X Var X
n

       . 
 
   
1.35 1.5 1.60 1.5
1.35 1.60 2.71 1.81
0.0030625 0.0030625
X
X
X
P T P P Z


  
          
 
 
 
    1.81 2.71 0.9649 0.0034 0.9615P Z P Z       
 
 
Ejercicio 4. Sea la variable aleatoria X la cantidad de radiación que puede ser 
absorbida por un individuo antes que le sobrevenga la muerte. Suponga que X es 
normal con media de 500 roentgen y una desviación estándar de 150 roentgen. 
 
a. ¿Qué porcentaje de individuos podrán absorber entre 350 y 430 roentgen de 
radiación antes que le sobrevenga la muerte? 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 167 
b. Si se extrae una muestra de 20 individuos, ¿cuál es la probabilidad que la cantidad 
media de radiación absorbida por un individuo antes de morir se encuentre entre 450 
y 550 roentgen? 
 
 
 
 
 
 
 
 
 
 
 
 
Ejercicio 5. Se sabe que en una empresa de taxis, la variable aleatoria X=Número de 
servicios no atendidos por día tiene la siguiente distribución de probabilidad: 
 
X 1 2 3 5 6 
P(X=x) 0.31 0.19 0.25 0.125 0.125 
 
Si se toma una muestra de tamaño 36. 
 
a. Halle la probabilidad que el promedio muestral del número de servicios no atendidos 
sea menor a 2.5 
 
 
 
 
 
 
 
 
 
 
 
 
 
b. Si se sabe que el promedio muestral del número de servicio no atendidos fue menor 
a 3.5, ¿cuál es la probabilidad que el promedio muestral sea mayor o igual a 1.5? 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 168 
Distribución de una proporción por muestreo (p) 
 
Para n grande y utilizando el teorema del límite central, se puede asegurar que la 
proporción muestral p, tiene una distribución aproximadamente normal con media: 
= y variancia: 
2 (1 )
n n
  
 . Se estandarizar como: 
(1 )
p
Z
n

 



. 
A continuación se presentan los casos de la distribución p con muestras aleatorias y con 
muestras aleatorias simples. 
 
 
Uso del teorema del límite central 
 
Si n es suficientemente grande (n  30), por el teorema del límite central se puede 
afirmar que: 
 
p p p
p k k
P p k P P Z
  
  
     
          
   
 
 
Ejemplo 5 
En un proceso de producción el porcentaje de unidades defectuosas producidas es 3%. 
Para controlar el proceso, se revisan periódicamente los artículos producidos. 
Si el proceso de producción se para al encontrar al menos 5% de unidades defectuosas 
producidas al revisar una muestra aleatoria de 200 artículos cada vez. Halle la 
probabilidad aproximada de que el proceso continúe. 
 
Solución 
La proporción muestral tiene una distribución aproximadamente normal. Esto se puede 
afirmar por el Teorema del Límite Central (n grande). 
 2
.
1
Normal ,
Aprox
p
n
 
  
 
  
 
 
 
 
 
0.05 0.03
0.05 1.65 0.9505
0.01211
p
P p P P Z
n

 
 
 
       
 
 
 
 
 
Ejemplo 6 
El contenido de sólidos solubles (en grados Brix °B) en muestras de chirimoya tiene 
distribución normal siendo su esperanza matemática es 7.78 °B y su desviación 
estándar 2.54 °B. Un especialista selecciona una muestra aleatoria de 80 muestras de 
chirimoya. Calcule la probabilidad de que la proporción muestral de esas muestras de 
chirimoya con un contenido de sólidos solubles menor de 9.88 °B sea menor de 0.72. 
 
Solución 
Sea X el contenidode sustancias solubles en °B. 
 2 2Normal 7.78, 2.54X    
La probabilidad de que una muestra de chirimoya tenga un contenido menor de 9.88 °B 
es: 
   
9.88 7.78
9.88 0.83 0.7967
2.54
X
P X P P Z



  
       
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 169 
La proporción muestral tiene una distribución aproximadamente normal. Esto se puede 
afirmar por el Teorema del Límite Central (n grande). 
 2
.
1
Normal ,
Aprox
p
n
 
  
 
  
 
 
 
 
 
0.72 0.7967
0.72 1.71 0.0436
0.7967 0.20331
80
p
P p P P Z
n

 
 
 
        
 
 
 
 
 
Ejercicio 6. De una empresa se escoge una muestra aleatoria de 300 empleados para 
una encuesta sobre condiciones laborales. Halle la probabilidad aproximada de que la 
proporción muestral a favor de las condiciones laborales esté comprendido en el 
intervalo 0.76 y 0.84, si se estima en 80% del total de empleados el porcentaje a favor 
de las condiciones laborales. 
 
 
 
 
 
 
 
 
 
 
Ejercicio 7. El diez por ciento de las personas de cierta comunidad tiene sangre tipo B. 
Si se selecciona una muestra aleatoria de 900 personas de esa comunidad. ¿Cuál es la 
probabilidad de que la proporción muestral de personas con sangre tipo B? 
 
a) Sea al menos 7.2% 
 
 
 
 
 
 
 
 
 
b) Sea a lo más 10.5% 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 170 
Distribución de la diferencia de promedios muestrales  1 2X X 
 Si de dos poblaciones independientes distribuidas con medias 1 , 2 y variancias 
2
1 , 
2
2 , se extraen muestras de tamaños 1 2n y n , respectivamente; entonces, la variable 
aleatoria  1 2X X (diferencia de promedios muestrales) tendrá una distribución 
normal con media y variancia: 
 
Si las muestras son aleatorias (con o sin reemplazo) de poblaciones normales o se 
cumple con el teorema del límite central con otro tipo de distribución. 
   1 2 1 2
2 2
2 1 2
1 2
1 2
X X X X
y
n n
 
   
 
    
 
Ejemplo 7 
El tiempo que lleva efectuar un procedimiento de montaje para el método 1 tiene 
distribución con media 35 seg. y variancia 20 seg2 mientras que con un método 2 tiene 
distribución con media 31 seg. y variancia 17 seg2. Si se selecciona una muestra de 40 
empleados entrenados con el método 1 y 50 entrenados con el método 2. 
 
Halle la probabilidad de que el promedio muestral con el método 1 exceda al promedio 
muestral con el método 2 en por lo menos 5 seg. 
 
 
2 2
1 2
1 2 1 2
1 2
20 17
, 35 31, 4,0.84
40 50
X X N N N
n n
 
 
   
       
  
 
   1 2
1 2
1 2
1 2
5 4
5 1.09 0.1379
0.84
X X
X X
X X
P X X P P Z




   
       
 
 
 
 
 
Ejercicio 8. La estatura promedio de un soldado del ejército del país A es de 172.5 cm 
con una desviación estándar de 5 cm. En tanto que para un soldado del ejército del país 
B es de 167.5 cm y 2.5 cm respectivamente. Si se selecciona una muestra aleatoria de 
90 soldados en cada uno de los ejércitos, ¿cuál es la probabilidad de que la estatura 
promedio de la muestra del ejercito B sea inferior al del ejército A en 4.5 cm o menos? 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 171 
Ejercicio 9. En una inspección de control de calidad de focos se encontraron los 
siguientes resultados: 
1. En la empresa A, se obtuvo un promedio de vida útil de 30 meses con una 
desviación estándar de 4 meses. 
2. En la empresa B, se obtuvo un promedio de vida útil de 40 meses con una 
desviación estándar de 6 meses. 
 
Al seleccionar una muestra de 100 focos de A y 80 de B, ¿Cuál es la probabilidad que 
el promedio de vida útil de los focos fabricados por B supere en más de 8 meses del 
promedio de vida útil de los focos fabricados por A? 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Distribución de la diferencia de proporciones muestrales ( 1 2p p ) 
Si 1 2p y p son las proporciones muestrales de dos poblaciones independientes con 
proporciones poblacionales 1 2y  , y de estas poblaciones se extraen muestras de 
tamaños 1 2n y n , respectivamente, entonces, la diferencia de proporciones 
muestrales 1 2p p tiene una distribución con media 1 2 1 2p p     y variancia: 
 
   
1 2
1 1 2 22
1 2
1 1
p p
n n
   
 
 
  
 
 
Uso del teorema del límite central 
Si las muestras son suficientemente grandes entonces: 
 
1 2
2
1 2 1 2 , p pp p aprox N      
La forma de la variancia depende de si la muestra es aleatoria o aleatoria simple. 
 
 
Ejemplo 8 
Si para elaborar un artículo se usan, independientemente, las máquinas I y II, y se 
sabe que la probabilidad de producir un artículo defectuoso con la máquina I es 0.15 y 
0.08 con la máquina II. Si se eligen al azar 80 artículos producidos por I y 100 
producidos por II, halle la probabilidad de que la proporción de defectuosos de la 
muestra de I supere a la de II en más de 0.06, si las muestras son aleatorias. 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 172 
Solución 
 
1 2
2
1 2 1 2
0.15 0.85 0.08 0.92
, 0.15 0.08,
80 100
p pp p aprox N aprox N   
  
    
 
 
  0.07,0.00233aprox N 
   1 2
0.06 0.07
0.06 0.21 0.5832
0.04827
P p p P Z P Z
 
        
 
 
 
 
Ejercicio 10. Se sabe que van a la universidad en movilidad propia el 40% de los 
estudiantes de la Universidad L y el 30% de la Universidad S. Si se toman al azar 
muestras de 80 y 90 estudiantes respectivamente, halle la probabilidad de que la 
proporción de la muestra de la Universidad L supere a la de S en más de 9%. 
 
 
 
 
 
 
 
 
 
 
 
 
Ejercicio 11. Dos máquinas A y B producen el mismo artículo. Se sabe que la 
proporción de artículos defectuosos producidos por A es de 0.06 y por B es de 0.04. Si 
se obtiene una muestra aleatoria de 50 artículos para cada una de las máquinas, halle 
la probabilidad que la proporción de defectuosos de la muestra A sea superior a la 
proporción de defectuosos de la muestra de la máquina B en más de 0.01.UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 173 
Práctica Dirigida N° 6 
 
1. BRT es una empresa dedicada al transporte público de pasajeros en la ciudad. Se 
sabe que el 25% de los pasajeros toman la línea A, el 35% la línea B y el 40% la 
línea C. Cada línea tiene una ruta con distintos paraderos. 
El gerente de la empresa está interesado en analizar el tiempo que espera un 
pasajero hasta que llegue su bus. Esta variable para un pasajero de la línea A tiene 
densidad exponencial con media de 30 min, para un pasajero de la línea B una 
distribución normal con media de 25 min y desviación estándar de 5 min, y para un 
pasajero de la línea C una distribución normal con media de 15 min y varianza de 1 
min2. 
 
a. Calcule la probabilidad de que un pasajero que toma la línea A tenga que esperar 
menos de 15 minutos. 
 
 
 
 
 
 
 
 
b. Calcule la probabilidad de que un pasajero que toma la línea B tenga que esperar 
más de 20 minutos. 
 
 
 
 
 
 
 
 
c. Calcule la probabilidad de que un pasajero que toma la línea C tenga que esperar 
entre 15 a 20 minutos. 
 
 
 
 
 
 
 
 
d. ¿Cuánto tiempo de espera como mínimo debe tener un pasajero de la ruta A para 
ser considerado dentro del 30% de los pasajeros que más esperan?. 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 174 
e. Si se elige al azar un pasajero de la ciudad, calcule la probabilidad de que tenga 
que esperar menos de 15 minutos. 
 
 
 
 
 
 
 
 
f. Si se seleccionan al azar 10 pasajeros que toman la línea B, calcule la probabilidad 
de que el tiempo promedio de espera en la muestra sea mayor a 24 minutos 
 
 
 
 
 
 
 
 
 
g. Si se selecciona al azar 80 pasajeros que toman la línea A, calcule la probabilidad 
de que el tiempo promedio de espera en la muestra sea a lo más 25 minutos 
 
 
 
 
 
 
 
 
 
 
h. Si se seleccionan al azar 10 pasajeros que toman la línea B y 8 pasajeros que 
toman la línea C, calcule la probabilidad de que el tiempo promedio de espera en la 
muestra de la línea B supere al de C en más de 15 minutos. 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 175 
Suponga que otra variable en estudio es el nivel de satisfacción de los pasajeros 
respecto al servicio de transporte. De un censo realizado el año pasado se obtuvo la 
siguiente información: 
 
Ruta N Número de pasajeros que se 
encuentran satisfechos con el servicio 
A 80 60 
B 100 50 
C 120 90 
 
Si para un próximo estudio se extraen muestras aleatorias 40, 50 y 60 pasajeros para 
las rutas A, B y C respectivamente. Use la información anterior para responder las 
siguientes preguntas: 
 
i. Calcule la probabilidad de que la proporción de pasajeros satisfechos de la muestra 
de la ruta A sea menor a 0.7 
 
 
 
 
 
 
 
 
 
 
 
 
 
j. Calcule la probabilidad de que la proporción de pasajeros satisfechos de la muestra 
de la ruta B sea superior a la de la ruta C en menos de 5%. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 176 
EJERCICIOS PROPUESTOS 
 
1. El tiempo, en horas, de reparación de un automóvil es una variable aleatoria X con 
distribución exponencial. En promedio se demora 4.48 horas. 
a. Calcular la probabilidad de que un automóvil este más de 3 horas, si lleva al 
menos media hora siendo reparado. 
b. Hay un 10% de automóviles que son los que requieren de mayor tiempo para 
reparación. ¿Cuántas horas se requiere como mínimo para reparar un 
automóvil de este tipo? 
 
2. Suponga que la duración en minutos de las llamadas telefónicas que llegan en forma 
independiente a una central telefónica es una variable aleatoria con distribución 
exponencial, con media de 2 minutos por llamada. ¿Cuál es la probabilidad que una 
llamada dure entre 1 y 4 minutos? 
 
3. El tiempo de incapacidad por enfermedad de los empleados de una compañía en un 
mes, tiene distribución normal, con media 100 horas y desviación estándar de 20 
horas. 
a) ¿Cuál es la probabilidad de que el tiempo por incapacidad del siguiente mes se 
encuentre entre 50 y 80 horas? 
b) ¿Cuánto tiempo de incapacidad deberá planearse para que la probabilidad de 
excederlo sea sólo 0.1? 
 
4. Suponga que se estima que el 70% de los jóvenes de Lima y el 63% de los jóvenes 
de Arequipa considera que escuchar música clásica es un buen hábito. Si se toman 
muestras de tamaño 50 de jóvenes de Lima y 60 de jóvenes de Arequipa, halle la 
probabilidad de que la proporción de la muestra de Lima supere a la de Arequipa en 
menos de 0.05, si Las muestras son aleatorias simples (sin reemplazo), habiéndose 
elegido la primera muestra de 900 jóvenes limeños y la segunda de 1400 jóvenes 
arequipeños. 
 
5. El promedio y la desviación estándar de las medidas de los diámetros interiores de 
ciertos tubos de desagüe son respectivamente 34.1 cm y 1.5 cm. Si se toma una 
muestra de 100 tubos, ¿Cuál es la probabilidad de que la media de esta muestra 
aleatoria esté entre 34 cm. y 34.5 cm? 
 
6. En una población, el 20% de las familias están suscritas al diario “El Comercio”, 
¿cuál es la probabilidad de que al seleccionar una muestra de 225 familias, la 
proporción de familias suscritas a dicho diario sea menor al 16%? 
 
7. La presión sanguínea sistólica de los hombres de 20 a 24 años se distribuye 
normalmente con media 123 y con una desviación típica de 137. Si se selecciona al 
azar a uno de estos hombres, ¿cuál es la probabilidad que su presión sanguínea sea 
mayora 139.44? 
 
8. El tiempo que necesita un alumno para terminar el examen final de Química General 
se distribuye normalmente con una media de 110 minutos y una desviación 
estándar de 8 minutos; mientras que el tiempo que necesita un alumno para 
terminar el examen final de Física General se distribuye normalmente con una 
media de 115 minutos y una variancia de 49 minutos2. 
a. Si un alumno termina el examen de Física General en menos de una hora y 
media se puede suponer que domina el curso. Si se selecciona un alumno al 
azar, ¿cuál es la probabilidad de que domine el curso? 
b. Si se seleccionan al azar 5 alumnos de Física General, ¿cuál es la probabilidad de 
que al menos dos alumnos dominen el curso? 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 177 
9. El número de clientes que llegan a una agencia bancaria cada 5 minutos tiene una 
distribución Poisson con media 3.2. Se selecciona una muestra aleatoria de tamaño 
40 de esta distribución. Calcule la probabilidad de que la media muestral sea mayor 
que 2.8. 
 
10. Se sabe que el 52% de adolescentes de cierto distrito fuman. Si se selecciona una 
muestra aleatoria de 50 adolescentes de ese distrito, halle la probabilidad de que la 
proporción muestral de fumadores sea mayor que 0.40 pero menor que 0.62 
 
11. Una Empresa Arrocera se tienen dos máquinas agrícolas A y B; las cuales presentan 
tiempos de duración que cumplen la función de cosechar arroz en forma 
independiente tienen una distribución normal con un tiempo de vida medio de 12 y 
15 años y con desviaciones estándar de 1.5 años y 3 años respectivamente. 
 
a) El administrador de la empresa está dispuesto a reemplazar sólo al 3% de las 
maquinas con menor tiempo de duración. ¿Cuál es la duración límite para que la 
máquina A sea considerada para ser reemplazada? 
b) Si se toma una muestra de 50 máquinas agrícolas para cada tipo de máquina (A 
y B) ¿Cuál es la probabilidad de que la duración de la media de la muestra de la 
máquina B sea como máximo 14 ó como mínimo 16 años? 
c) Si se toma una muestra de 50 máquinas agrícolas para cada tipo de máquina (A 
y B) ¿Cuál es la probabilidad de que la media de la muestra de la máquina A 
difiera de la máquina B en más de 1 año? 
 
 
12. La vida útil de una batería se distribuye como una exponencial con una media de 10 
años. El fabricante ofrece una garantía de un año. Si la batería falla en ese período 
se reemplaza por otra, a lo más una vez. ¿Cuál debe ser el tiempo de garantía que 
el fabricante debe ofrecer para que solo se devuelva el 2% de las baterías 
producidas? 
 
 
13. Una máquina fabrica un determinado producto cuya longitud, en centímetros, tiene 
un promedio de 6 cm. y una desviación estándar de 1.2 cm. 
 
a) Si se toma una m.a. de tamaño 25 ¿Cuál será la probabilidad de que se obtenga 
un promedio muestral de a lo más 6.25 cm? 
b) Se sabe que el costo de fabricación, por unidad, está dado por C = 4.5X + 6.5, 
donde C es el costo unitario y está dado en soles. Si se toma una muestra 
aleatoria de tamaño 36 ¿Cuál es la probabilidad de que el costo promedio, en 
esta muestra, supere los 23.5 soles? 
 
14. Un fabricante de electrodomésticos sabe que la vida útil de éstos sigue una 
distribución normal con media de 100 meses y desviación estándar de 20 meses. 
Determine el tamaño mínimo muestral que garantiza, con una probabilidad de 0.98 
que la vida útil media de los electrodomésticos en dicha muestra se encuentra 
entre 90 y 110 meses. 
 
 
15. Se sabe que la vida de bombillas eléctricas es una variable aleatoria distribuida 
normalmente con media desconocida  y  = 200 horas. El precio de un lote de 
bombillas es 
5
1
 dólares. Un posible comprador propone tomar una muestra 
aleatoria de n bombillas y pagar al productor X
5
1
 dólares por el lote de bombillas. 
¿Cuál debe ser el valor de n, para que la probabilidad de que comprador no sobre 
pague ni subpague al productor con más de 20 dólares, sea 0.95? 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 178 
16. El tiempo que tarda un proceso de ensamblaje de un artículo puede modelarse como 
una variable aleatoria exponencial con una media de 5.5 minutos. 
a. ¿Cuál es la probabilidad que el proceso de ensamblaje de un artículo dure entre 
3.8 y 6.8 minutos? 
b. ¿Cuánto tiempo como mínimo debe tener un artículo para ser considerado 
dentro del 28.5% de los mayor tiempo de ensamblaje?. 
c. Halle el RI. 
d. Halle el medio del tiempo de ensamblaje y su coeficiente de variación. 
 
17. La escuale de manejo “El Rápido”, estima que el número de horas de práctica 
necesarias para la obtención del permiso de conducir para una persona sigue una 
distribución normal con media 24 horas y desviación estándar 4 horas. 
a. ¿Cuál es la probabilidad de obtener el permiso de conducir con al menos 20 
horas de prácticas de manejo? 
b. ¿Cuál debe ser el número de horas como máximo, para que una persona sea 
considerada dentro del 22% con menos horas de prácticasde manejo? 
c. Si una escuela de manejo cobra S/ 35 por hora de práctica más S/ 45 por 
gastos de administrativos. Calcule el ingreso esperado por alumno que tendrá 
la escuela. 
d. Si se extrae una muestra aleatoria de 35 personas, ¿cuál es la probabilidad que 
el número promedio de horas de manejo para obtener la licencia de conducir 
sea entre 18 y 26 horas?. 
e. Si se sabe que el 18.5% de las personas desaprueban en la primera vez el 
examen de manejo, entonces para una muestra de 120 personas halle la 
probabilidad que la proporción muestral que desaprueban el examen por 
primera vez sea a lo más el 15.5%. 
f. La escuela desea hacer una evaluación respecto al género. Se tiene que el 
número de horas para obtener la licencia de conducir tiene una distribución 
normal, con media de 22 horas y desviación estándar de 5 horas para los 
hombres, mientras que para las mujeres su media es de 28 horas y desviación 
estándar de 8 horas. Halle la probabilidad que el número de horas promedio 
para tener una licencia de las mujeres sea mayor que el de los hombres en 
más de 3 horas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 179 
9.5 Distribución Ji – Cuadrado 
 
La distribución Ji-cuadrado fue encontrada por primera vez por F.R Helmert en 1876. 
Esta distribución toma el nombre de la letra griega  elevada al cuadrado. Esta letra en 
castellano se llama Ji y en inglés Chi. 
 
Una v.a X tiene distribución Ji-cuadrado con m grados de libertad si su función de 
probabilidad está dada por: 
 
   









00
0
22
1
2
1
2
2
xsi
xsiex
mxf
x
m
m 
 
Se debe aclarar que el operador  2m es una integral definida. 
 
Notación:  
2
m
X  
 
 
 
Características de una distribución Ji-cuadrado típica 
 
Como se aprecia en el gráfico anterior: 
 
1. Presenta un sesgo o asimetría positiva. 
2. Es asintótica con respecto al eje horizontal en el lado positivo. 
3. El rango de la variable considera sólo los valores positivos. 
4. La distribución tiene menor sesgo conforme los grados de libertad son mayores 
(m  30) 
5. Si  
2
m
X  , entonces 
2 2X Xm y m   . 
 
Teorema Si Z  N(0 , 1) entonces  
2 2
1
Z  . 
 
Ejemplo 9 
Si  2,X N   , entonces    
2
2 2
1
0,1
X X
Z N Z
 

 
  
    
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 180 
Distribuciones muestrales asociadas a la distribución Ji-cuadrado 
 
Sea 1, , nX X una muestra aleatoria de una distribución normal con media  y 
desviación estándar  , entonces la V.A.: 
 
 
2
2
21
12 2
( )
1
n
i
i
n
X X
n S

 





. 
 
Ejemplo 10 
Si  
2
19
J  , determine el valor de: 
a.  11.651P J  
 
Solución 
 11.651P J  = 0.1 Notación:  
2
0.1,19
11.651  
b.  15.352P J  
 
Solución 
   15.352 1 15.352 1 0.3 0.7P J P J       
 
c.  15.352 30.144P J  
 
Solución 
     15.352 30.144 30.144 15.352 0.95 0.3 0.65P J P J P J         
 
Ejemplo 11 
Si  
2
25
L  , halle p1 y p2 tales que:  1 2 0.7P p L p   y  2 0.1P L p  . 
Solución 
   
   
2
1 1 0.2,25
2
2 2 0.9,25
0.2 18.940
0.9 34.382
P L p p
P L p p


    
    
 
 
 
9.6 Distribución t de Student 
 
La distribución t fue empleada por primera vez en un problema de Estadística 
importante por W.S Gosset en 1908 (él escribía bajo el seudónimo de Student). 
 
Una v.a X tiene distribución t con m grados de libertad si su función de probabilidad es: 
 
  1
2 2
1
2
,
1
2 2
m
m
f x x
m x
m

 
 
     
  
   
  
 
Notación:  mX t 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 181 
 
 
Características de la distribución t 
 
1. Cada curva  mt tiene forma acampanada con centro en 0. 
2. Cada curva  mt es más dispersa que la curva normal estándar. 
3. Si  mX t , entonces 
20
2
X X
m
y
m
  

 
4. Conforme aumenta m, la dispersión de la curva  mt disminuye. 
5. A medida que m , la curva  mt se aproxima a la curva normal estándar. 
 
 
Teorema 
Si las v.as  0,1Z N y  
2
m
V  son independientes, entonces la v.a  m
Z
X t
V
m
 . 
 
Distribuciones muestrales asociadas a la distribución t 
 
Sea 1, , nX X una muestra de una distribución normal con media  y desviación 
estándar  , entonces la v.a  1n
X
X
t
S



, siendo: 
2
2
X
S
S
n
 , si el muestreo es con reemplazo (muestra aleatoria) 
Teorema 
Si de dos poblaciones normales independientes distribuidas con medias 1 , 2 y 
variancias 
2 2 2
1 2    , se extraen muestras aleatorias de tamaños 1 2n y n , 
respectivamente; entonces, la variable aleatoria 
   
 1 2
1 2 1 2
2
2
1 2
1 1
n n
p
X X
Y t
S
n n
 
 
  

 
 
 
, 
siendo: 
   2 21 1 2 22
1 2
1 1
2
p
n S n S
S
n n
  

 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 182 
 
Ejemplo 12 
 
Si  8R t , calcule: 
 
a.  2.306P R   
 
 2.306 0.025P R    Notación:  0.025,82.306 t  
 
b.  2.896P R  
   2.896 1 2.896 1 0.99 0.01P R P R       
 
c.  3.355 0.889P R    
     3.355 0.889 0.889 3.355 0.200 0.005 0.195P R P R P R             
 
d. El valor de c si   0.3P R c  
   0.3,80.3 0.546P R c c t      
 
9.7 Distribución F 
 
Ronald A. Fisher (nació en Inglaterra el 17 de Febrero de 1890 y falleció el 29 de Julio 
de 1962) fue un gran científico, matemático, estadístico, biólogo evolutivo y genetista. 
Fisher aportó mucho a la estadística, siendo una de sus más importantes 
contribuciones, la Inferencia Estadística creada por él en 1920 (que se estudiará de 
manera introductoria en el capítulo XI de este libro). A la distribución F también se le 
llama distribución F de Snedecor o distribución F de Fisher-Snedecor. 
 
Una v.a. X tiene una distribución F con n y m grados de libertad si su función de 
probabilidad es: 
 
2 1
2
2
2
, 0
1
2 2
n
n
n m
n m n
x
m
f x x
n m n x
m


  
  
  
 
     
       
     
 
Notación:  ,X F n m
 
 
 
 
http://es.wikipedia.org/wiki/Cient%C3%ADfico
http://es.wikipedia.org/wiki/Matem%C3%A1tico
http://es.wikipedia.org/wiki/Estad%C3%ADstica
http://es.wikipedia.org/wiki/Biolog%C3%ADa_evolutiva
http://es.wikipedia.org/wiki/Gen%C3%A9tica
http://es.wikipedia.org/wiki/Inferencia_estad%C3%ADstica
http://es.wikipedia.org/wiki/1920
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 183 
 
Características de la distribución F 
 
1. Está definida solamente para valores positivos de la variable. 
2. Tiene asimetría positiva. 
3. Es asintótica respecto al eje horizontal en su parte positiva. 
4. Las distribuciones  ,F n m tienden a ser simétricas cuando n y m son 
suficientemente grandes (mayores que 30) 
 
Teorema 
Si    
2 2
n m
U y V  , son v.a. independientes, entonces la V.A.: 
 ,
U
U mnX F n m
V V n
m
  
 
Notación Si      , ,, n mX F n m y P X k k F    
Propiedad recíproca  
 
, ,
1 , ,
1
n m
m n
F
F



 
 
Distribución muestral asociada a la distribución F 
Sea 
11
, , nX X una m.a. de una distribución normal con variancia 
2
1 y 21, , nY Y otra 
m.a. (independiente de las Xi) de una distribución normal con variancia 
2
2 , y 
denotemos por 
2 2
1 2S y S las dos variancias muestrales. Entonces la v.a: 
 
2 2
1 1
1 22 2
2 2
1, 1
S
F n n
S


  
Ejemplo 13 
 
Si  8,21W F , halle: 
a.  2.42P W  
   0.95,8,212.42 0.95 2.42P W F    
b.  3.51P W  
   3.51 1 3.51 1 0.99 0.01P W P W       
c.  2.42 3.51P W  
     2.42 3.51 3.51 2.42 0.99 0.95 0.04P W P W P W         
d. El valor de k en  2.42P k W  =0.94 
       
 
 
0.95
0.01,8,21
0.99,21,8
2.42 0.94 2.42 0.94 0.01
1 1
0.1873
5.34
P k W P W P W k P W k
k F
F
          
    
 
Nótese que se utilizó la propiedad recíproca. 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 184 
EJERCICIOS PROPUESTOS 
 
 
1. Una muestra aleatoria de 27 observaciones es tomada de una población normal con 
2 16.8  . Hallar la probabilidad de obtener una desviación estándar muestral 
entre 2.9909 y 5.2045 
 
 
2. Un fabricante de alambres de acero afirma que la fuerza promedio requerida para 
romper los alambres que fabrica es de 500 Kg. Para verificar esta afirmación se 
toma una muestra aleatoria de 25 trozos de este alambre y se somete a prueba 
encontrándose una desviación estándar de 55 Kg. Suponiendo que las fuerzas de 
rompimiento pueden considerarse como valores de una variable aleatoria que se 
distribuye normalmente. ¿Cuál es la probabilidad de obtener un promedio de 
rompimiento entre 481.179 y 518.821 Kg? 
 
 
3. Si Y tiene distribución t de Student con 15 grados de libertad. Halle el valor de la 
constante K tal que: 95.0)753.1()(  YPKYP 
 
 
 
4. Sea 
2
(5)~W  , )20(
~ tZ
, )10,8(
~ FY
. Usando tablas estadísticas hallar las siguientes 
probabilidades: 
 
a) ( 3)P W  
b) )07.11( WP 
c) )860.0( ZP 
d) )325.1( ZP 
 
e) ( 1.325 1.725)P Z   
f) ( 3.07)P Y  
g) ( 5.06)P Y  
h) (3.07 5.06)P Y  
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 185 
Preguntas de Autoevaluación 
 
 
1. Dos características de la distribución Normal son ___________________________ 
__________________________________________________________________ 
2. Dos características de la distribución t de Student son: _______________________ 
___________________________________________________________________ 
3. Dos características de la distribución Chi-cuadrado son: ______________________ 
___________________________________________________________________ 
4. Dos características de la distribución F de Fisher son: _______________________ 
___________________________________________________________________ 
5. Si la variable aleatoria X se distribuye como una exponencial, entonces la 
probabilidad que X sea mayor a su media es igual a _____________________ y su 
coeficiente de variación es igual a ___________________. 
6. Si X tiene una media poblacional igual a 12.5 y una desviación estándar de 2.5, 
entonces para un muestra n de tamaño 50,la distribución de la media según el 
Teorema del Límite Central es ______________________________ 
7. Si la variable aleatoria X~ Bin(10,0.85), entonces para una muestra de tamaño 40 
la probabilidad que la media muestral sea mayor a 6 es igual a ________________ 
8. Si Y ~ Hip(15,8,5), entonces para una muestra de tamaño 35 la media muestral se 
aproxima a la distribución _________________ con media y variancia 
__________________________. 
9. La distribución normal estándar está asociada a la distribución muestral de 
_________, la distribución t con la distribución muestral de _________________, la 
distribución Chi-cuadrado con la distribución muestral de _____________________ 
y la distribución F con la distribución muestra de _________________________ . 
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados: 
Item Enunciado V/F 
a. La mediana en una distribución normal estándar es igual a cero 
b. En la distribución t, a medida que aumenta los grados de libertad la 
distribución se aproxima a una normal estándar. 
 
c. Las variables aleatorias distribuidas como una Chi-cuadrado y F toman 
sólo valores positivos. 
 
d. Las variables aleatorias distribuidas como una Normal y Normal 
estándar toman sólo valores negativos. 
 
e. Conforme aumenta los grados de libertad de la Chi-cuadrado, la 
distribución tiene mayor sesgo . 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 186 
CAPÍTULO X 
 
INFERENCIA ESTADÍSTICA 
 
La inferencia estadística se ocupa de la estimación y prueba de hipótesis de los 
parámetros de una población, en base de una muestra aleatoria extraída de dicha 
población. 
 
Objetivo. Entender el proceso de inferencia estadística para la estimación (estimación 
puntual y por intervalos) y de prueba de hipótesis de los parámetros de una población. 
 
La inferencia estadística comprende: 
 
1. La estimación de parámetros (estimación puntual y por intervalos de confianza). 
2. Las pruebas de hipótesis de parámetros. 
 
10.1 Estimación puntual de parámetros 
 
Sea 1, , nX X una muestra de tamaño n de una población con parámetro  . Se 
denomina estimador puntual de  a cualquier estadístico  1ˆ , , nh X X cuyo valor 
 1ˆ , , nh x x  dará una estimación puntual de  . En este caso ̂ es una variable 
aleatoria y ̂ es un número. Los estimadores puntuales para la media, varianza y 
proporción serán: 
 
 
Para la media poblacional (): 
 
 
 
Para la variancia poblacional (2): 
 
 
 
Para la proporción poblacional (): 
 
Ejemplo 1 
De una población de tallas (mt) en madres adolescentes con media  y varianza , 
se extrae una muestra aleatoria 8 madres adolescentes, cuyos valores observados son: 
1.50, 1.60, 1.58, 1.45, 1.52, 1.68, 1.62, 1.55. Halle un estimador puntual para la 
media, la varianza y la desviación estándar poblacionales. 
Entonces se tiene: .56.1
8
5.12
8
8
1 mt
X
X i
i



, será una estimación puntual de  . 
Cálculo de la suma de cuadrados: 


8
1
2 569.19
i
iX 
Para la varianza, el estimador puntual será: 
 
0053.0
7
56.18569.19
7
)5.12(569.19
11
22
2
2
12
2 















 x
n
XnX
n
n
X
X
S
n
i
i
n
i i
n
i
i
 
Para la desviación estándar: 073.00053.0 S 
n
X
X
n
i
i
 1̂
1
)(
ˆ 1
2
22





n
XX
S
n
i
i

 de éxitos
ˆ
Número
p
n
  
2
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 187 
10.2 Estimación de parámetros por intervalo de confianza 
 
Sea 1, , nX X una muestra aleatoria de tamaño n de una población con parámetro  , 
cuyos valores observados o datos respectivos son 1, , nx x . Sea además, la v.a 
 1ˆ , , nh X X un valor estadístico, con función de probabilidad conocida, que estima 
a  . Si   1P A B     , donde  1 1, , nA h X X y  2 1, , nB h X X son v.a. 
halladas a partir de la distribución de  1ˆ , , nh X X , entonces se dice que el 
intervalo aleatorio  ,A B es el intervalo estimador del parámetro  , o que   ,A B 
con probabilidad 1  . 
 
Si  1 1, , na h x x y  2 1, , nb h x x , son los valores numéricos que resultan al 
reemplazar los valores de la muestra en las v.a. A y B respectivamente, entonces, se 
dice que el intervalo numérico  ,a b es el intervalo de confianza del  1 100  % 
para  , o que   ,a b con un nivel o grado de confianza del  1 100  %. 
 
Interpretación 
 
Si con los datos de una muestra aleatoria de tamaño n se construyó el intervalo 
a b  con nivel de confianza, por ejemplo, 98% para el parámetro  , esto quiere 
decir que existe un 98% de confianza que el intervalo  ,a b contenga al parámetro  . 
 
Intervalo de confianza para una media poblacional  con 2 desconocida 
 
Si 1, , nX X es una muestra aleatoria de una población normal con media  y 
variancia 2 desconocida. Para cualquier tamaño de muestra se tiene que la variable 
aleatoria la v.a. 
1-nt~
n
S
X
t

 , entonces para definir el intervalo de confianza del 
 1 100  % se cumple: 
          

 
















 

1
1;
2
11;
2
11;
2
111;
2
1 nnnnn
t
n
S
X
tPtttP . 
 
Entonces despejando la expresión anterior, el intervalo con un nivel de confianza del 
 1 100  % para la media )( será hallado por: 
 
   














    
b
n
a
n n
S
tX
n
s
tX
1;
2
11;
2
1 
 
 
 
donde a y b son valores numéricos que representan el Límite inferior y Límite 
superior del intervalo. 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 188 
 
 
 
1 ; 1
2
1 ; 1
2
Límite inferior: ( )
Límite superior: ( )
n
n
s
LI X t
n
s
LS X t
n




 
 
 
 
 
 
 
Intervalo de confianza para una proporción 
 
Se usa la v.a. N(0,1)~
)1(
n
p




 y n>30, entonces para determinar el intervalo de 
confianza del  1 100  % para la proporción se cumple: 























































1
)1(
2
1
2
1
2
1
2
1
Z
n
p
ZPZZZP 
 
Entonces despejando la expresión anterior, el intervalo con un nivel de confianza del 
 1 100  % para la proporción )( será hallado por: 
 
 
   
1 1
2 2
1 1
a b
p p p p
p Z p Z
n n
 

   
    
   
 
    
 
donde a y b son valores numéricos que representan el Límite inferior y Límite 
superior del intervalo. 
 
 
Intervalo de confianza para la variancia 
 
Sea 1, , nX X una muestra aleatoria de una población normal con variancia 
2 , 
desconocida. Se usa  
2
1-n2
2
i
2
2
~
)(X
)1(


 


X
Sn
 , entonces para determinar el 
intervalo de confianza del  1 100  % para la varianza se cumple: 
 
      
 
 
 
2, 1 1 1 2, 1
2, 1 1 2, 1
2 2 2
2
2 2
2
1
1
1
n n n
n n
P
n S
P
 
 
   
  

   
  
   
 
    
 
 
 
Entonces despejando la expresión anterior, el intervalo con un nivel de confianza del 
 1 100  % para la varianza ( 2 ) será hallado por: 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 189 
 
 
   2 22
2 2
1 , 1 , 1
2 2
1 1
n n
a b
n s n s
 

 
   
     
   
 
  
 
Si se desea obtener los límites de confianza para la desviación estándar se obtiene la 
raíz cuadrada en la expresión anterior obteniéndose: 
 
 
   2 2
2 2
1 , 1 , 1
2 2
1 1
n n
a b
n s n s
 

 
   
     
   
 
  
 
 
 
Ejemplo 2 
En 2011, se tomó una muestra de 35 casas en la Ciudad 1, y se hizo el estudio de las 
siguientesvariables: X= Peso total de basura producida en una casa durante un día 
(Kg), Y= Peso de residuos orgánicos producidos (Kg) en una casa durante un día y Z= 
Hábito de reciclaje, obteniéndose los siguientes resultados: 
 
 
 
Casa 
Peso 
total de 
basura 
Peso residuos 
orgánicos 
Hábito de 
reciclaje 
1 2.7 1.8 Si 
2 3.0 1.5 No 
3 1.5 0.8 No 
4 1.8 0.8 No 
5 3.0 2.1 Si 
6 2.5 1.5 No 
7 4.0 2.5 No 
8 3.0 1.2 No 
9 3.5 2.0 Si 
10 5.0 3.7 No 
11 1.5 0.8 No 
12 2.5 1.3 No 
13 2.3 1.3 No 
14 3.5 2.8 No 
15 5.0 3.5 No 
16 4.0 2.1 No 
17 4.0 2.6 No 
18 3.0 1.2 No 
19 2.5 1.0 No 
20 2.8 2.0 No 
21 2.8 1.9 Si 
22 3.5 2.6 No 
23 4.0 3.3 No 
24 3.0 2.0 No 
25 1.9 1.0 No 
26 2.7 1.4 No 
27 2.8 1.8 No 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 190 
28 3.7 2.5 No 
29 3.2 2.3 No 
30 2.9 1.9 No 
31 3.5 2.1 Si 
32 3.0 1.3 No 
33 5.0 3.4 No 
34 3.5 2.7 No 
35 4.0 3.2 Si 
Cálculos: 
 
 Peso 
Total 
Peso residual 
Orgánico 
x
 
3.160 1.997 
s 0.884 0.818 
n 35 35 
 
Del total de casas, sólo 6 tienen hábitos de reciclaje 
 
a. Halle e interprete un intervalo de confianza del 95% para el peso total promedio de 
basura producida en una casa durante un día. 
 
Solución: 
1 0.95 0.05 1 0.975
2

        →  0.975,34 2.032t  
0.884 0.884
3.160 2.032 3.160 2.032 2.856 3.464
35 35
        
 
Interpretación: Se tiene un nivel de confianza de 95% que el peso total promedio de 
basura producida en una casa durante un día está en el intervalo  2.856,3.464 Kg. 
 
 
b. Halle un intervalo de confianza de 95% para la verdadera proporción de casas que 
tienen el hábito de reciclaje en esa ciudad. 
 
Solución: 
1 0.95 0.05 1 0.975
2

        .   1714.0
35
6
96.1975.0  pyZ 
2963.00465.0
35
)1714.01(1714.0
96.11714.0
35
)1714.01(1714.0
96.11714.0







xx
 
 
Interpretación: Se tiene una confianza de 95% que la verdadera proporción de 
casas que tienen el hábito de reciclaje, está en el intervalo  2963.0,0465.0 . 
 
c. Halle e interprete un intervalo de confianza del 95% para la varianza y desviación 
estándar del peso de los residuos orgánico. 
 
Solución: 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 191 
    806.19966.51975.0
2
105.095.01 2 34,025.0
2
34,975.0  

 y 
   
2 2 2 2
2 2 2
2 2
1 ; 1 ; 1
2 2
( 1) ( 1) (35 1)0.818 (35 1)0.818
0.438 1.149
51.966 19.806
n n
n S n S
 
  
 
  
   
       
 
Interpretación: Se tiene una confianza de 95% que la verdadera varianza del peso 
de los residuos orgánico se encuentra en el intervalo  0.438,1.149 Kgs2. 
 
Para la desviación estándar: 0.438 1.149 0.662 1.072      
 
Interpretación: Se tiene una confianza de 95% que la verdadera desviación estándar 
del peso de los residuos orgánico se encuentra en el intervalo  616.2,615.1 Kg. 
 
Ejemplo 3 
Los siguientes datos corresponden a los pesos de destete (X1) y peso de nacimiento 
(X2), en gramos, de una muestra aleatoria de 10 cuyes. 
 
X1 210 174 310 127 174 172 296 362 306 352 
X2 140 142 140 90 92 84 156 200 185 180 
 
Asumiendo que ambas variables tienen distribución normal: 
 
a. Halle un intervalo de confianza de 90% para el verdadero peso medio de destete de 
los cuyes. 
Solución: 
 Peso de 
Destete 
Peso al 
Nacer 
x 248.3 140.9 
s 85.7 41.4 
n 10 10 
 
1 0.90 0.10 1 0.95
2

        .   833.19;95.0  t 
 1 2, 1
85.7
248.3 1.833
10
n
s
x t
n
 
   , de donde se obtiene:  198.624,297.976 
 
Interpretación: Se tiene una confianza de 90% que el peso promedio de destete, 
está en el intervalo  198.624,297.976 gr. 
 
One-Sample T: PDestete 
 
Variable N Media StDev SE Media 90.0% CI 
PDestete 10 248.3 85.7 27.1 ( 198.6, 298.0) 
 
 
b. Halle un intervalo de confianza de 98% para la verdadera variancia del peso al nacer 
de los cuyes. 
Solución: 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 192 
    088.2666.2199.0
2
102.095.01 2 9,01.0
2
9,99.0  

 y 
   
759.7387975.711
088.2
4.41)110(
666.21
4.41)110()1()1( 2
2
2
2
2
1;
2
2
2
2
1;
2
1
2












 
xxSnSn
nn
 
Interpretación: Se tiene una confianza de 98% que la verdadera variancia del peso 
al nacer está en el intervalo  711.975,7387.759 gr2. 
Para hallar el intervalo de confianza para  , se sacará la raíz cuadrada en ambos 
límites: obteniéndose:  26.683,85.952 gr. 
 
Ejercicio 1. Un inspector de calidad está evaluando si el contenido de fruta por lata es 
el adecuado. Se supone que el contenido de fruta se distribuye como una normal. El 
inspector escoge al azar 35 latas y encuentra que el peso promedio es de 29.2 onzas, la 
variancia es de 4 onzas2 y que 5 no tienen un peso adecuado. 
 
a. Halle e interprete un intervalo de confianza del 95% para el peso promedio 
poblacional. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b. Halle e interprete un intervalo de confianza del 95% para la variancia y desviación 
estándar poblacional del contenido de fruta en las latas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 193 
c. Halle e interprete un intervalo de confianza del 99% para la proporción poblacional 
de latas que presentan un peso adecuado 
 
 
 
 
 
 
 
 
 
 
 
 
 
Ejercicio 2. Un fabricante de fibras sintéticas diseña un experimento para estimar la 
tensión de ruptura media de una fibra, para lo cual observa las tensiones de ruptura (en 
libras) de una muestra aleatoria de 12 hilos. Los datos obtenidos fueron: 
 
19.3 20.2 21.4 18.3 18.6 19.4 22.5 20.8 19.6 21.3 18.5 22.4 
 
 
a. Con una confianza del 98%, halle el intervalo de confianza para la tensión de 
ruptura media de las fibras sintéticas. Interprete. 
 
b. Halle e interprete un intervalo del 90% de confianza para la variancia de la tensión 
de ruptura de las fibras sintéticas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 194 
10.3 Determinación del Tamaño de Muestra 
 
A continuación se presenta la manera de hallar el tamaño de muestra cuando se estima 
a la media poblacional μ o cuando se estima a la proporciónpoblacional . 
Determinación del tamaño de muestra para estimar a la media poblacional μ 
 
Se sabe que: 
/
x
t
s n

 , despejando se obtiene el tamaño de muestra: 
 
Donde: 
 e es el margen de error que se quiere aceptar. 
 El valor de  1 2
t t

 depende del nivel de confianza requerido y se trabaja con gl 
. 
 La variancia 2s se obtiene de una muestra piloto. 
 
Determinación del tamaño de la muestra para estimar la proporción 
poblacional  
Se sabe que: 
(1 )
p
Z
n

 



, despejando se obtiene el tamaño de muestra: 
 
Donde: 
 e es el margen error permisible. 
 El valor de  
2
1 
 ZZ depende del nivel de confianza requerido 
  es el parámetro que se desea estimar y como es desconocido, entonces se puede 
tomar una muestra piloto para obtener un valor estimado. Se puede utilizar el valor 
conservador igual a 0.5. 
 
Ejemplo 4 
Una famosa cadena de hoteles desea desarrollar un intervalo de confianza del 99% para 
estimar el número promedio de habitaciones ocupadas cada noche en sus sucursales de 
toda la nación. ¿Cuántas noches deben incluirse en la muestra si se puede tolerar un 
error de 10 habitaciones y una muestra piloto revela una desviación estándar de 60 
habitaciones? 
Solución: 
   
2 2 2 2
0.995, 2 21 ,
2
2.58 60
0.01 2.58 239.63 240
10
t s x
t t n
e


 
         noches 
 
 
2 2
2
t s
n
e
 
 2
2
1Z
n
e
 
 

UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 195 
Ejemplo 5 
¿Cuántos estudiantes debe tener una muestra, con el fin de estimar la proporción de 
estudiantes que tienen correo electrónico? En un estudio previo, se halló que de 150 
estudiantes, 120 tenían correo electrónico. Se desea tener un nivel de confianza del 
95% y un error del 3% en las estimaciones. 
Solución: 
120
0.8
150
p   , 0.975 1.96Z  , entonces 
2
0 2
1.96 0.8 0.2
682.95 683
0.03
n
 
   y por lo 
tanto: 
En el siguiente cuadro se presenta las estimaciones de tamaños de muestra para 
diferentes valores de margen de error: 
 
Margen de error n 
0,01 6146,560 
0,02 1536,640 
0,03 682,951 
0,04 384,160 
0,05 245,862 
Se observa un incremento exponencial de tamaño de muestra al disminuir el margen de 
error. 
 
Ejercicio 3. ¿Cuál debe ser el tamaño de muestra para estimar el nivel medio del 
consumo de proteínas de los adultos de una zona minera, si se desea tener un margen 
de error de 0.45 g/dl y un nivel de confianza del 95%?. De una muestra piloto se 
obtuvo que el consumo de proteínas tiene una desviación estándar de 2.5 g/dl. 
 
 
 
 
 
 
 
 
 
Ejercicio 4. El director comercial de cierta compañía que realiza ventas por correo 
electrónico, desea precisar con mucho cuidado su política de crédito. Si el director 
desea tener un intervalo de confianza del 99% para la proporción de clientes que están 
al día en sus pagos. ¿Qué tamaño de muestra debe usar si se desea tener un margen 
de error del 4.5%?. Suponga que en una muestra piloto de 35 clientes se halló que 8 
clientes están al día en sus pagos. 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 196 
Práctica Dirigida N° 7 
 
En la región norte del país, un agricultor ha cultivado dos variedades de maíz, el 
Mochero y el Paro. Se desea realiza un estudio sobre el rendimiento de estas 
variedades. De la variedad Mochero se analizaron 30 parcelas, obteniéndose un 
rendimiento promedio de 1863 Kg con una desviación estándar de 12.5Kg, y de Paro 25 
parcelas, con un promedio de 1750 Kg con una desviación 15.5Kg. Asumiendo que el 
rendimiento del maíz sigue una distribución normal. 
 
a. Calcule e interprete un intervalo de confianza del 98% para el rendimiento promedio 
de maíz de variedad Paro. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b. Calcule e interprete un intervalo de confianza del 90% para la variancia y la 
desviación estándar del rendimiento de la variedad Mochero. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 197 
c. Se ha observado que en la muestra de la variedad de maíz Paro, el 20% de las 
parcelas viene siendo infectadas por una plaga. Construya un intervalo de confianza 
del 90% para el verdadera proporción de parcelas con plagas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
d. Suponga que se desea realizar un estudio en la región sur del país, con la finalidad 
de estimar la proporción de agricultores que prefieren el maíz Paro. Si en un estudio 
previo, se halló que el 40% de pobladores prefiere el maíz Paro. Determine el 
tamaño de muestra, si se desea tener un nivel de confianza del 90% y un error del 
5% en las estimaciones. 
 
 
 
 
 
 
 
 
 
 
 
e. Para el caso de la variedad mochero se desea estimar el rendimiento promedio por 
agricultor. Determine el tamaño de muestra, si se desea tener un nivel de confianza 
del 90% y un error del 80 kg en las estimaciones. Suponga que en una muestra 
piloto se hallo una desviación estándar de 445 g. 
 
 
 
 
 
 
 
 
 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 198 
10.4 Prueba de hipótesis 
 
Una hipótesis estadística, es cualquier afirmación o suposición que se hace acerca del 
tipo de distribución de probabilidad de la población o al valor o valores de uno o más 
parámetros de la población: Media ( ), Variancia (  2 y Proporción (   . 
 
Tipos de hipótesis 
 
Hipótesis nula (H0 o Hp). Es la hipótesis que es aceptada provisionalmente como 
verdadera y cuya validez será sometida a verificación experimental. Los resultados 
experimentales nos permitirán seguir aceptándola como verdadera o si debemos 
rechazarla como tal. 
 
Hipótesis alterna (H1 o Ha). Es la hipótesis que se acepta en caso de que la hipótesis 
nula sea rechazada. H1 es la suposición contrariaa H0. 
 
Prueba de hipótesis estadística es el proceso mediante el cual se toma la decisión de 
aceptar o rechazar la hipótesis nula. 
 
La aceptación de una hipótesis nula, significa que los datos de la muestra no 
proporcionan evidencia suficiente para rebatirla. El rechazo significa que los datos de la 
muestra lo rebaten. 
 
 
 
Se pueden formular hasta tres tipos de prueba, la cual dependerá de la forma de la 
hipótesis alterna que se formule: 
 
Hipótesis unilateral 
con cola a la derecha 
Hipótesis bilateral 
o de dos colas 
Hipótesis unilateral con 
cola a la izquierda 
 
 
 
 
Donde es el parámetro de interés y o el valor o los valores supuesto(s) que puede 
tomar el parámetro. 
 
 
Ejercicio 1. Para los siguientes enunciados formule la hipótesis nula y alterna e indique 
el tipo de prueba. 
 
Enunciado Formulación del 
tipo de hipótesis 
Tipo de 
prueba 
El peso promedio de destete de cierta raza 
de cuyes es 230 gr 
 
 
 
 
La proporción de casas del distrito SUR con 
hábitos de reciclaje es mayor al 25% 
 
 
 
 
La variancia de los diámetros de todos los 
árboles de una zona es al menos 0.95 m2 
 
 
La longitud media de las truchas de una 
piscigranja es a lo más 35.5 cm 
 
 
 
 
 
Tipos de pruebas de hipótesis 
01
00
:
:




H
H
01
00
:
:




H
H
01
00
:
:




H
H
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 199 
Errores tipo I y tipo II 
 
Al tomarse una decisión respecto a una hipótesis nula (H0), se puede presentar cuatro 
posibles casos que determinan si la decisión tomada es correcta o incorrecta, esto se 
presenta en la siguiente tabla: 
 
Decisión H0 verdadera H0 falsa 
Aceptar H0 Decisión correcta 
Probabilidad =1  
Error tipo II 
Probabilidad =  
Rechazar H0 Error tipo I 
Probabilidad = 
Decisión correcta 
Probabilidad =1  
 
Error tipo I, es el error que se comete cuando se rechaza una hipótesis nula que es 
verdadera en la población. 
 
Error tipo II, es el error que se comete cuando se acepta una hipótesis nula que es 
falsa en la población. 
 
Nivel de significación ( ). De una prueba de hipótesis, es la probabilidad de cometer 
error tipo I. 
 
La probabilidad de cometer error tipo I se denota por  , entonces: 
 = P(error tipo I) = P(rechazar una hipótesis nula verdadera) 
 
La probabilidad de cometer error tipo II se denota por  , entonces: 
 = P(error tipo II) = P(aceptar una hipótesis nula falsa) 
 
Potencia de prueba. Es igual a 1 -  , es la probabilidad de rechazar una hipótesis 
nula que es falsa. 
 
Región crítica y regla de decisión. 
 
La regla de decisión involucra la división de la distribución muestral del estadístico 
(como 
2,X S etc.) de la prueba en dos partes mutuamente excluyentes: a región de 
rechazo o región crítica (R.C) de la hipótesis nula, y la región de aceptación ( R.A ) o no 
rechazo de la hipótesis nula. La división depende de la forma de la hipótesis 
alternativa, del nivel de significación  y de la distribución muestral del estadístico. 
 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 200 
Ejemplo 6. Para una prueba de hipótesis de una media (μ), las regiones críticas según 
el tipo de prueba serán: 
 
Hipótesis unilateral con 
cola a la derecha 
Hipótesis bilateral o de 
dos colas 
Hipótesis unilateral 
con cola a la izquierda 
 
 
 
 
 
 
 
 
 
La zona de rechazo está 
al lado derecho. 
La zona de rechazo está 
a ambos lados. 
La zona de rechazo 
está al lado izquierdo. 
 
Supuestos para las pruebas de hipótesis. 
 
1. Prueba de hipótesis para una media poblacional (  ), para la variancia poblacional 
 2
 
y para una proporción   . 
a. La muestra es aleatoria. 
b. La muestra proviene de una distribución normal. 
 
2. Prueba de hipótesis para diferencias de medias poblacionales  1 2  , para la razón 
de variancias poblacionales 
2
2
2
1


 
 
 
 y para la diferencia de proporciones  1 2  . 
 
a. Las muestras son aleatorias. 
b. Las muestras provienen de distribuciones normales. 
c. Las poblaciones son independientes. 
 
Procedimiento general de la prueba de hipótesis de un parámetro  
 
1. Formular la hipótesis nula y la hipótesis alternativa. 
 
2. Elegir el nivel de significación  . 
 
3. Seleccionar la prueba estadística apropiada, E, (cuya distribución depende del valor 
estadístico utilizado) y hallar el valor calculado (Ec) de la prueba estadística. Ver la 
tabla de las pruebas de hipótesis. 
 
4. Determinar la regla de decisión, estableciendo las regiones de rechazo y de 
aceptación de la hipótesis nula (Ho). 
 
5. Decidir el rechazo de la hipótesis nula (Ho), si Ec cae en la región crítica de rechazo. 
En caso contrario, no rechazar la hipótesis nula. 
 
6. Conclusión 
 
01
00
:
:




H
H
01
00
:
:




H
H
01
00
:
:




H
H
1,1  nt 
1, nt1,
2
n
t
1,
2
1  n
t 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 201 
Tabla de las pruebas de hipótesis 
 
Hipótesis 
referida 
a :  
 
Prueba Estadística (E) 
Valores tabulares E1 y E2 
=/2 para pruebas bilaterales 
= para pruebas unilaterales 
 
2 desconocida y población normal 
 tc= 
 0X
s
n

 ~  1nt  
t1= - t(1-,n-1) 
t2= t(1-,n-1) 
 
2 
 
 
2
2 2
12
0
1
c n
n S
 
 

 
 
 
 
  
  
1
2 2
2
2 2
1
1 1
 
  
,
,
n
n
 
 
 
 
 
Zc= 
0
0 0(1 )
p
n

 


 ~ N(0,1) 
 
Z1= Z() 
Z2 = Z(1-) 
 
 2
2
1
2/ 
 
2 2
1 2
1 22 2
2 1
1, 1c
S
F F n n
S


   
 
F1= F(, n1-1, n2-1) 
F1= F(1-, n1-1, n2-1) 
 1 2
 
a.  1
2
2
2y desconocidas pero 
homogéneas y poblaciones normales. 
   
 1 2
1 2 1 2 0
2
2
1 2
1 1
c n n
p
X X
t t
S
n n
 
 
  

 
 
 
 
   
 
 
2 2
1 1 2 22
1 2
1 1 2
2 1 2
1 1
2
1 , 2
1 , 2
p
n S n S
S
n n
t t n n
t t n n


  

 
    
   
 
b.  1
2
2
2y desconocidas pero 
heterogéneas y poblaciones 
normales. 
 
 1 2 1 2 0
2 2
1 2
1 2
c
X X
t t H
s s
n n
   


 
 
 
2
2 2
1 2
1 2
2 2
2 2
1 2
1 2
1 2
1
2
1 1
1 ,
1 ,
s s
n n
H
s s
n n
n n
t t H
t t H


 
 
 

   
   
   
 
  
 
 
 
 
 
 
 
 
1 2  
a. Cuando 1 2  =0 
 
 
 1 2 1 2 0
1 2
0,1
1 1
1
c
p p
Z N
p p
n n
   

 
  
 
 
1 1 2 2
1 2
n p n p
p
n n



 
Z1= Z() 
Z2 = Z(1-) 
b. Cuando 1 2  0 
 
   
 1 2 1 2 0
1 1 2 2
1 2
0,1
1 1
c
p p
Z N
p p p p
n n
   

 

 
Z1= Z() 
Z2 = Z(1-) 
 
 
UNA La Molina - Dpto. de Estadística e Informática Estadística General 
 
 202 
Prueba de hipóteis para una población 
 
Ejemplo 7. La gerencia financiera de una compañía inmobiliaria desea analizar las 
ventas de inmuebles en el último trimestre. Con esta finalidad extrae una muestra 
aleatoria de 10 agentes registrando las ventas realizadas (en miles dólares) en el último 
trimestre. Suponga que las ventas se distribuyen normalmente. 
370 245 545 350 360 480 420 450 310 460 
 
a. El gerente financiero sospecha que las ventas promedios por agente en el último 
trimestre son menores a las ventas programadas que fueron de $ 465 (miles $). 
Usando un nivel de significación del 5%, pruebe la afirmación del gerente financiero 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b. El gerente también cree que es importante analizar la variabilidad de las ventas 
efectuadas por sus agentes. El gerente afirma que la variabilidad de las ventas en 
este último trimestre no han variado con respecto al trimestre anterior que fue de $ 
130 (miles $). Usando