Probabilidad y estadística con Python
Cita con formato IEEE:
E. Bahit, "Probabilidad y estadística con Python", in
Python Aplicado, 4th ed., EBRC Publisher, 2022, pp.
164-182.
Cita con formato APA 7:
Bahit, E. (2022). Probabilidad y estadística con Python. In
Python Aplicado (4th ed., pp. 164-182). EBRC Publisher.
Cita en línea:
(Bahit, 2022)
Funciones estadísticas básicas (len, sum, max, min)
Sobre listas y tuplas pueden efectuarse operaciones estadísticas simples empleando funciones incorporadas del lenguaje:
Contar elementos len(coleccion) Sumar elementos sum(coleccion) Obtener número mayor max(coleccion) Obtener numero menor min(coleccion)
En lo sucesivo se abarcarán operaciones más complejas empleadas para la ciencia de datos.
Probabilidad de sucesos simples y compuestos mutuamente excluyentes
Espacio muestral
Un espacio muestral es un conjunto de sucesos posibles, como los que podrían resultar al lanzar un dado: E=\{1,2,3,4,5,6\}
espacio_muestral = [1, 2, 3, 4, 5, 6]
Se refiere como punto muestral a cada elemento en un espacio muestral. La cantidad de puntos muestrales se denota por n tal que para el espacio muestral E=\{1,2,3,4,5,6\}, \;\;n=6.
n = len(espacio_muestral)
Sucesos simples y compuestos
Un suceso, es un conjunto de resultados dentro de un espacio muestral. Por ejemplo:
- el lanzamiento de un dado es un suceso
- la probabilidad de que en dicho lanzamiento salga el número 5, es un suceso simple y es excluyente: si sale 5, no puede simultáneamente salir ningún otro número.
- la probabilidad de que en el lanzamiento salga un número impar, es el suceso compuesto B=\{1,3,5\} que dependerá a su vez de los sucesos simples excluyentes B_1=\{1\}, B_1=\{3\} y B_1=\{5\}.
Asignación de probabilidades
La asignación de probabilidades es aquella que provee modelos matemáticos para calcular las posibilidades de que sucesos específicos ocurran o no.
La probabilidad de un suceso se denota por P(suceso).
Los sucesos pueden ser:
- simples o compuestos
- mutuamente excluyentes o independientes
Sucesos simples mutuamente excluyentes
Si se considera un espacio muestral A, cada uno de los puntos muestrales k, quedará denotado por Ak y la probabilidad de éstos, designada como P(A_k), quedará determinada por:
P(A_k)={1 \over n}
probabilidad = 1.0 / n
En Python, se requiere que al menos un elemento de la ecuación sea un número real si lo que se requiere como resultado es un número real.
La probabilidad de cada punto muestral, como sucesos excluyentes entre sí, es la misma para cada suceso.
P(6)=P(5)=P(4)=P(3)=P(2)=P(1)={1 \over n}={1 \over 6{
Sucesos compuestos por sucesos simples mutuamente excluyentes
Cuando los sucesos simple que conforma al suceso compuesto A son mutuamente excluyente, la probabilidad del suceso compuesto estará dada por la suma de las probabilidades de cada suceso simple P(A_k), tal que:
P(A)=P(A_1)+P(A_2)+...+P(A_k)
Por ejemplo, para estimar la probabilidad de que en un único lanzamiento de dado, salga un número par, se obtiene el suceso A=\{2,4,6\} dado por la suma de las probabilidades de cada uno de sus sucesos simples P(2)+P(4)+P(6) del espacio muestral E=\{1,2,3,4,5,6\} tal que:
P(A)=P(2)+P(4)+P(6)
P(A)={1 \over 6}+{1 \over 6}+{1 \over 6}={3 \over 6}
P(A)={1 \over 2}
En el primer resultado {3 \over 6} (en el segundo paso, antes de hallar el máximo común divisor [MCD] y reducir la fracción a {1 \over 2}), el numerador es equivalente a la cantidad de sucesos simples dentro del suceso compuesto «números pares» y se denota por h. El denominador, 6, es n, el total de todos los sucesos del espacio muestral. De esta forma, la probabilidad de un suceso A compuesto por sucesos mutuamente excluyentes queda dada por el cociente de h y n tal que:
P(A)={h \over n}
numeros_pares = [i for i in espacio_muestral if i % 2 is 0] h = len(numeros_pares) probabilidad = float(h) / n
Un suceso compuesto se puede denotar por la unión de sus sucesos simples (símbolo {\cup}, leído como "o"), tal que:
P(A_1 {\cup} A_2 {\cup} ... A_k = P(A_1) + P(A_2) + ... + P(A_k)
Por ejemplo, para el caso del suceso «números pares», se obtiene que:
P(2 {\cup} 4 {\cup} 6) = P(2) + P(4) + P(6)
P(2 {\cup} 4 {\cup} 6) = {1 \over 6} + {1 \over 6} + {1 \over 6} = {3 \over 6}
P(2 {\cup} 4 {\cup} 6) = {1 \over 2}
Tal que P(2 {\cup} 4 {\cup} 6) es un suceso y P(2), P(4) y P(6) son las probabilidades de los tres sucesos que lo componen. En un nuevo contexto, P(2 {\cup} 4 {\cup} 6) puede ser tratado como un suceso A.
Funciones
# Probabilidad de sucesos simples mutuamente excluyentes pssme = lambda e: 1.0 / len(e) # Probabilidad de sucesos compuestos mutuamente excluyentes def pscme(e, sc): n = len(e) return len(sc) / float(n)
Probabilidad condicional en Python
Sucesos dependientes
Se refiere a la probabilidad de que dos sucesos ocurran simultáneamente siendo que el segundo suceso depende de la ocurrencia del primero.
La probabilidad de que ocurra B si ocurre A, se denota por P(B|A) y se lee como "la probabilidad de B dado A", tal que:
P(B|A)= {{P(A { \cap } B)} \over {P(A)}}
Donde P(A { \cap } B) es la probabilidad de la intersección de los sucesos de...
espacio_muestral = [1, 2, 3, 4, 5, 6] a = [i for i in espacio_muestral if i % 2 is not 0] b = [i for i in espacio_muestral if i < 4]