Probabilidad, Intuición y una Hoja electrónica

Alan Graham

Centre for Mathematics Education,

The Open University, England[1]

 

Resumen

Simulaciones de probabilidades son una forma útil de ayudar a los estudiantes a cambiar sus intuiciones sobre los eventos de azar. Sin embargo, el lanzamiento de dados y monedas puede resultar algo  lento y desordenado, y puede ocultar los patrones fundamentales que se presentan a la larga. Este artículo proporciona ejemplos de simulaciones de probabilidad en una hoja electrónica, con los que se pueden superar estas dificultades.

 

DETECTANDO PATRONES A LA LARGA

                UN PROFESOR, Geoff, después de una lección en la cual su clase de 12 años de edad había pasado casi una hora lanzando dados y registrando sus resultados, dijo:

"Mi propósito era llevarlos a ver (al realizarlo prácticamente) que las seis caras eran igualmente probables. ¡Desastre! ¡Todos ellos se marcharon convencidos de exactamente lo opuesto!Ninguna de las caras del dado salió el mismo número de veces, así claramente creyeron que ellas NO eran igualmente probables."

                El lanzamiento de monedas y dados realmente puede ser una valiosa forma de desarrollar una buena intuición en ésta área, a condición de que sea hecho en una forma interrogativa e investigadora. Sin embargo, la gran debilidad del uso de estos artefactos es que ellos generan datos muy lentamente como para permitir a los estudiantes ver más allá de las fluctuaciones a corto plazo, de tal forma que puedan darse cuenta de los patrones subyacientes a largo plazo.

                La fuerza de las simulaciones por computadora es que un número muy grande de ensayos puede ser generado extremadamente rápido y los resultados pueden ser directamente organizados en una tabla de frecuencias o en un diagrama de barras. Por ejemplo, uno de los muchos beneficios de usar una hoja electrónica en una lección de estadística es su potencial para llevar a los estudiantes a explorar sus ideas acerca de probabilidad y dirigirlo, directamente, a algunas de sus intuiciones erróneas. Sin embargo, para el estudiante, ésta velocidad y eficiencia trae con ella el peligro de que lo que esté sucediendo sobre la pantalla de la computadora pueden fácilmente llegar a estar totalmente divorciado del evento físico que la computadora está simulando.

                La figura 1 resume este dilema para el profesor. Claramente algunos arreglos son necesarios. El acercamiento propuesto aquí es como sigue:

(1)           Plantear algunas cuestiones acerca de probabilidad, particularmente en áreas donde las intuiciones son frecuentemente erróneas.

(2)           Invitar a los estudiantes a ESTABLECER SUS PROPIAS INTUICIONES acerca de una cuestión particular.

(3)           Empezar ello poniendo a prueba su intuición usando un dado o moneda (para estudiantes mayores o de cursos más sofisticados, el tiempo a pasar en este estado puede ser relativamente corto.)

(4)           Habiendo pasado tiempo (en (3)) clarificando la naturaleza de los experimentos, los estudiantes se trasladarán a usar una hoja electrónica, la cual les permitirá a ellos simular el mismo experimento.

(5)           Analizando e interpretando los datos generados por computadora, los estudiantes pueden intentar confirmar o rechazar sus conjeturas previas hechas en (2). Este estado puede también hacer surgir cuestiones adicionales las cuales ellos pueden explorar.

(6)           Los estudiantes intentan llegar a una explicación "teórica" de lo que ellos piensan que han descubierto en (5).

 

Medio usado

Ventajas

Desventajas

Monedas y dados

Fácil de mantener la pista de lo que es el experimento.

Lento, desordenado y caótico - fluctuaciones en corto plazo ocultan los patrones fundamentales a la larga.

Simulaciones por computadora de monedas y dados

Rápido y eficiente - produce muestras grandes para revelar patrones a la larga.

Desconcertante y puede llegar a estar divorciado de el experimento original que está siendo simulado.

Fig. 1 El dilema de la simulación.

 

 

USANDO LOS COMANDOS `ALEATORIO´ Y `ENTERO´ PARA SIMULAR MONEDAS Y DADOS

                Usando la hoja electrónica Excel, el comando =RAND() genera un número aleatorio en el rango de 0 a 1. El comando =INT() permite la entrada de un número decimal (dentro de los paréntesis) y regresa sólo la parte entera. Por ejemplo, introducir  =INT(3.71) producirá el valor 3. Combinaciones de estos dos comandos permiten generar números enteros aleatorios en un rango de su elección y esto puede ser usado para simular los lanzamientos de dados, monedas etc. Por ejemplo:

 

=INT(RAND()*2) o =INT(RAND()+0.5) ambos generarán números enteros en el rango 0,1 y cualquiera de estos dos comandos es adecuado para la simulación del lanzamiento de una moneda justa (donde el resultado 0 puede representar ‘cara’ y 1 puede representar ‘sol’). Los seis resultados de un dado son simulados por el comado

 

=INT(RAND()*6+1)

 

                Los estudiantes necesitan revisar precisamente lo que ellos entienden acerca de qué rango de valores pueden esperar. Un bosquejo tal como el esquema de la Figura 2 puede ayudarles.

 

Fig. 2. Un proceso de simulación para lanzamientos de dados.

 

ALGUNOS EJEMPLOS DE SIMULACIÓN EN HOJA ELECTRÓNICA

                Abajo están algunos ejemplos de investigaciones donde los estudiantes pueden poner a prueba su intuición por medio de hojas electrónicas de simulación. Estas fueron escritas en Excel, pero ellas pueden ser adaptadas convenientemente a cualesquier otro paquete de hoja electrónica, a condición de que venga equipado con la función `aleatorio´ y con la función `entero´. Los ejemplos están graduados en orden de sofisticación, empezando con los más básicos.

 

Ejemplo (a) Un` seis´ es difícil lanzar.

                Muchos niños pequeños afirmarán que, en juegos que involucran dados, el `seis´ es el puntaje más difícil a obtener o que otra persona usualmente lo obtien antes que ellos. De hecho, en un análisis más cercano a estas afirmaciones pueden no ser tanto una falacia como en principio parecen. Muchos juegos de tableros que practican los niños requieren un `seis´ en el lanzamiento de un dado para que un jugador empiece. Cualquier resultado diferente al `seis´ es simplemente una `falla´. Así, desde el punto de vista del niño practicando el juego, no hay seis resultados producidos por el dado sino solamente dos de alguna significancia, denominados obtención de un `seis´ y un `no seis´. Estos resultados no son igualmente probables y en este contexto es perfectamente sensato afirmar que un `seis´ es difícil de lanzar dado que es cinco veces más difícil que un `no seis´.

                Para un niño que afirmar que "la otra persona usualmente obtiene un `seis´ antes que él" es una afirmación perfectamente válida, a condición de que haya más de una persona adicional jugando (los juegos de tableros normalmente envuelven tres o más jugadores).

                En Excel,  introducir en la celda B1 el comando =INT(RAND()*6+1)

 

Tabla 1. Hoja electrónica mostrando el efecto de `tendencia´ en el lanzamiento de un dado.

 

A

B

C

D

E

F

G

1,00

 

3,00

1,00

3,00

1,00

6,00

2,00

2,00

 

6,00

2,00

4,00

3,00

3,00

5,00

3,00

 

5,00

2,00

3,00

4,00

2,00

3,00

4,00

 

5,00

6,00

5,00

1,00

3,00

6,00

5,00

 

2,00

6,00

3,00

2,00

3,00

2,00

6,00

 

3,00

6,00

3,00

1,00

3,00

6,00

7,00

 

3,00

6,00

1,00

5,00

1,00

5,00

8,00

 

6,00

5,00

6,00

6,00

2,00

5,00

9,00

 

3,00

3,00

3,00

3,00

3,00

1,00

10,00

 

4,00

4,00

5,00

3,00

1,00

5,00

11,00

 

 

 

 

 

 

 

12,00

seises

9,00

9,00

11,00

6,00

11

 

13,00

Prop. Acum.

0.15

0.15

0.16

0.15

0.15

 

14,00

 

 

 

 

 

 

 

 

 

                Este comando puede luego ser aplicado en todas las celdas en los renglones 1 a 10 y columnas de B a G. Simplemente seleccionar `recalculando´ inmediatamente generará una hoja completamente nueva de 60 números aleatorios (en Excel, esto es logrado presionando la tecla del Comando simultáneamente con [=]). Estos números pueden ser analizados un una variedad de diferentes formas. Por ejemplo, el número de `seises´ puede ser anotado y tecleado después de cada recalculación (esto es mostrado en el renglón 12 -así, 9 seises fueron producidos en la primera simulación, 9 en la segunda, 11 en la tercera y así en adelante. El número de seises, 11, para la simulación actual es reportado en la celda F12). Estas frecuencias pueden ser graficadas como una serie de barras, mostrando que algunas veces se puede obtener más que el número esperado de diez seises en 60 lanzamientos y algunas veces menos. Adicionalmente, este renglón de frecuencias puede ser transformado en proporciones acumuladas (mostradas en el renglón 13) y la gráfica de este renglón mostrará el efecto de tendencia hacia la proporción subyacente de 1/6 conforme más y más muestras sean tomadas. Esto es ilustrado en la Tabla 1 de arriba.

 

Ejemplo (b) La falacia del jugador

                Una moneda justa es lanzada repetidamente y los resultados registrados. Se te pide adivinar el resultado del próximo lanzamiento. Te unes al juego exactamente cuando seis `caras´ en una hilera han sido registradas. ¿Qué resultado puedes predecir para el próximo juego y por qué?

                Mucha gente cree que, de acuerdo a algún sentido vago de la mal definida `ley de los grandes números´, una serie inesperadamente larga de caras será necesariamente corregida por un sello en el siguiente lanzamiento. Sí es la moneda misma o Dios quien es responsable de esta bastante manejada equilibración de resultados no es claro. La realidad es que la moneda no tiene memoria de los resultados en el pasado e inicia de nuevo cada lanzamiento. (Este concepto erróneo es algunas veces conocido como la `Falacia del jugador´ cuando lleva a los jugadores a creer que, después de una larga cadena de pérdidas, en su siguiente apuesta es más probable que gane).

                La Falacia del jugador puede ser simulada usando una hoja electrónica y esto es descrito abajo. A fin de hacer la investigación más manejable, consideremos hileras de cuatro `caras´ en una serie y veamos si el quinto lanzamiento es más o menos probable que sea `cara´. En la práctica, lo que esto significa es que necesitamos examinar todas la hileras de cuatro o más `caras´. Una serie de exactamente cuatro `caras´ corresponde a un `sello´ siguiendo a una hilera de cuatro `caras´, mientras que una serie de cinco o más `caras´ corresponde a una cara siguiendo a cuatro `caras´.

                Como fue descrito al principio, el comando =INT(RAND()*2) puede ser usado aquí y reproducido de la celda B1 a lo largo de seis columnas y diez renglones. Podemos poner el resultado `0´ correspondiendo a `cara´ y `1´ correspondiendo a `sello´. Manteniendo una cuenta continua de cualquier hilera de exactamente cuatro `caras´ como también una cuenta de hileras de cinco o más `caras´. Continuar con la generación de números aleatorios mediante `recalcular´ la hoja electrónica y continuar hasta casi 20 corridas hayan sido registradas. ¿Hay una diferencia entre el número de ocurrencias de series de `cuatro caras´ y `cinco o más caras´, y si así es, hay alguna diferencia significante?

                Una variedad de útiles puntos de discusión emergen de ésta simulación. Los estudiantes se dan cuenta, por ejemplo, que rigurosamente hay el mismo número de series de cuatro caras en las hileras como hay de cinco y más caras. ¿Es ésta una chiripa, si no, por qué está emergiendo este patrón? ¿Este patrón puede ser generalizado a n caras -i.e. es verdadero que P(Serie=n) = P(Serie>n)?

 

Ejemplo (c) Dulces en una bolsa

Una bolsa contiene cuatro dulces, dos rojos y dos verdes. La bolsa es agitada y dos dulces  son seleccionados a ciegas, uno después del otro sin reemplazo.

(i) ¿Cuál es la probabilidad de que el segundo dulce sea verde, dado que el primero fue rojo?

(ii) ¿Cuál es la probabilidad de que el primer dulce haya sido verde, dado que el segundo es verde y el color del primero es desconocido?

                La respuesta correcta para la parte (i) (P(G|R)=2/3) usualmente no causa grandes problemas a los estudiantes. Sin embargo, probablemente haya problemas con la parte (ii), no menos debido a que la sucesión de eventos es de adelante hacia atrás. Muchos estudiantes encuentran intuitivamente confuso hacer juicios de un evento anterior en base a información de un evento posterior. Un diagrama de árbol puede ayudar aquí, pero la siguiente simulación en hoja electrónica puede proporcionar una mejor base para la comprensión de lo que está pasando. Primero, sin embargo, puede ser útil para los estudiantes discutir qué clase de respuesta pueden ellos esperar. Ellos pueden llegar a coincidir con la noción general de que el segundo dulce es menos probable de que sea verde si el primer dulce elegido fue verde, así se sigue que si el segundo dulce resultó verde, el primer dulce es más probable que haya sido rojo.

 

Tabla 2. Hoja electrónica simulando `Dulces en una bolsa´

 

A

B

C

D

E

F

G

H

1

Simulación 1

1er dulce

¿Rojos usados?

Rojos que restan

Verdes que restan

Simulación 2

2º dulce

¿mismos colores?

2

1

R

1

1

2

1

R

1

3

3

G

0

2

1

1

R

0

4

0

R

1

1

2

1

R

1

5

0

R

1

1

2

1

G

0

6

2

G

0

2

1

1

R

0

7

1

R

1

1

2

0

R

1

...

...

...

...

...

...

...

...

...

19

2

G

0

2

1

2

G

1

20

1

R

1

1

2

1

F

0

21

0

R

1

1

2

1

G

0

22

 

 

 

 

 

 

Total

7

23

 

 

 

 

 

 

Ensayos

20

 

 

                Es razonable empezar por intentar simular la parte (i). Esta vez la hoja electrónica de simulación  es más complicada, y envuelve un comando lógico =IF(). Esto se propone hacer en la Tabla 2. La columna A puede ser usada para hacer la primera elección, usando el comando =INT(RAND()*4). Esto genera aleatoriamente, con la misma probabilidad, los números 0, 1, 2 y 3. Donde el valor de la celda <2 (i.e. para resultados 0 y 1) es considerado como que un dulce `rojo´ ha sido seleccionado, de otra manera este es un dulce `verde´. La columna F proporciona resultados correspondientes a la segunda elección, esta vez basada en tres dulces únicamente. La hoja electrónica mostrada arriba es bastante amplia pero está diseñada para desplegar la historia de la simulación, columna a columna. Observe que los renglones del 8 al 18 han sido omitidos para ahorrar espacio. Las fórmulas son introducidas en las celdas del renglón 2 y entonces copiadas hacia abajo hasta el renglón 21, dando 20 ensayos en total. Estas fórmulas son listadas y explicadas en la Tabla 3.

                Habiendo corrido exitosamente, digamos, 60 ensayos, el estudiante ahora selecciona solo aquellos ensayos para los cuales el segundo dulce fue verde. Dentro de este subconjunto, los estudiantes observarán la preponderancia de casos donde la primera elección fue roja y por tanto deberían formar una mejor intuición de el problema sobre el cual una más completa comprensión puede ser construida.

 

ANOTACIÓN FINAL

                Las investigaciones anteriores están montadas en ambientes familiares tales como lanzamiento de dados y monedas. La razón que tengo para escoger tales ejemplos es que estos objetos son los modelos mejor conocidos acerca de equiprobabilidad y están basados en probabilidades simples cuyos valores son obvios a partir de la simetría de las figuras. Otros contextos de `libros de texto´ que hacen un trabajo similar son elección de bolas de una urna y tratamiento de cartas de juego de una baraja bien revuelta. Sin embargo, todos estos pueden parecer abstractos, irrelevantes y desalentadores para algunos estudiantes. ¿Puede encontrar un conjunto de contextos de uso más amigable que proporcionen resultados equiprobables con probabilidades simples cuyos valores sean obvios desde el contexto? Si puede, por favor ¡póngame unas líneas¡

 

Tabla 3. Fórmulas en el renglón 2 de la Hoja electrónica de la Tabla 2.

Celda

Fórmula

Explicación

A2

=INT(RAND()*4)

genera números aleatorios enteros en el rango de 0 a 3

B2

=IF(A2<2,"R","G")

si el valor en la celda A2 es 0 o 1, escribe "R", si no escribe "G"

C2

=IF(A2<2,1,0)

si el valor en la celda A2 es 0 o 1, escribe "1", si no escribe "0"

D2

=2-C2

calcula el número de dulces rojos restantes

E2

=3-D2

calcula el número de dulces verdes restantes

F2

=INT(RAND()*3)

genera números aleatorios enteros en el rango de 0 a 2

G2

=IF(F2<D2,"R","G")

si el valor en la celda F2 es menor que el valor en la celda C2, escribe "R", si no escribe "G" †

H2

=IF(B2=G12,1,0)

esta es una instrucción extra y permite una estimación de que tan probable es que el segundo dulce elegido tenga el mismo color que el primero

 

 

 

 

 

          [Este comando requiere un poco de cuidado. En una segunda selección, los tres dulces restantes son denotados por los resultados 0, 1 o 2. Si únicamente resta un dulce rojo, entonces un resultado 0 en la celda F2 significa que un segundo rojo ha sido elegido,de otra forma uno fue verde. Si dos dulces rojos restan, entonces un valor 0 o 1 en la celda F2 significa que un rojo ha sido elegido, de otra forma uno verde.]

 



[1]              El artículo apareció publicado en: Teaching Statistics, Vol. 17, No. 3, Autumm 1995, págs. 84-87. Esta es una traducción realizada por Enrique Hugues Galindo, para uso interno del Seminario Probabilidad y Estadística en Matemática Educativa, CINVESTAV-IPN.