¿Qué significa p <0.001?

¿Qué significa p <0.001? En esta figura, el autor mencionó que había una diferencia significativa en las estimaciones de extensión espacial por tipo de contaminante (p <0.0001, Figura 1), entonces, ¿qué significa p <0.001?

En la siguiente discusión, supongo que sabes (a partir de la lectura del artículo) qué significan los términos “extensión espacial” y “tipo de contaminante”. Y confesaré fácilmente que no sé exactamente qué significan esos términos, más allá de lo que significa Supongo que por el contexto limitado disponible en esta pregunta. Pero eso no importa en cuanto a la interpretación del significado de “[math] p <0.0001 [/ math]".

La afirmación “[math] p <0.0001 [/ math]" es parte de la siguiente línea de razonamiento:

  • Comience con la suposición de que la “extensión espacial” es la misma * para los cuatro tipos de contaminantes. (Esto se llama la “hipótesis nula” [matemáticas] H_0 [/ math]; básicamente significa que si le pregunto “¿Le importaría adivinar la extensión espacial del tipo de contaminante ___?”, Entonces daría la misma respuesta independientemente de cómo llené ese espacio en blanco.)
  • Recoja los datos (las extensiones espaciales de una colección aleatoria de cada tipo de contaminación).
  • Cuando miramos las extensiones espaciales para cada tipo de contaminación, si [matemática] H_0 [/ math] fueron realmente verdaderas (como lo hemos supuesto), entonces los resultados que vemos en nuestros datos casi nunca sucederán. Es decir, esperamos ALGUNA variación (aleatoria) en la extensión espacial de un tipo de contaminante a otro. Sin embargo, la cantidad de variación que vemos es tan grande que raramente surgiría por pura casualidad.
  • Para ser específico: si [math] H_0 [/ math] fuera realmente cierto, y todas las diferencias en extensiones espaciales de un tipo a otro se debieran solo a la variación aleatoria, entonces los tamaños de las diferencias que observamos en nuestros datos pasarían menos de 0.01% del tiempo. (Es decir, la probabilidad de que estas diferencias surjan por casualidad es menor que 0,0001).
  • Debido a que es poco probable que surjan los datos que observamos cuando [math] H_0 [/ math] es verdadero, rechazamos [math] H_0 [/ math] y concluimos que la extensión espacial difiere entre los tipos de contaminantes.

Como analogía, considere este caso más simple (omitiendo algunos detalles de las suposiciones subyacentes para que podamos enfocarnos en el razonamiento):

  • Supongamos que estoy sosteniendo una moneda y afirmo que es justa. En ausencia de cualquier evidencia que indique lo contrario, me creerás. Entonces, [math] H_0 [/ math] es la afirmación, “esta moneda es justa, es decir, aparece cara o cruz con la misma probabilidad”.
  • Lanzamos la moneda 100 veces, y aparece la cabeza 63 veces.
  • Ahora, si [math] H_0 [/ math] fuera cierto, hubiéramos esperado 50 cabezas y 50 colas … pero ciertamente alguna variación no hubiera sido demasiado sorprendente (51/49? Claro, 58/42? Hmm …) ¿Cómo? nos sentimos como 65/35?
  • Usando leyes de probabilidad, puede determinar que resultados como este ocurrirían aproximadamente el 0.35% del tiempo cuando [matemática H_0 [/ math] es verdadero.
  • Entonces rechazamos [math] H_0 [/ math] y concluimos que esta no es una moneda justa.

También preguntaste:

… ¿puedes decirme el fondo alto y bajo también?

No estoy seguro de poder ayudarte aquí, en parte porque no tengo muy claro lo que estás pidiendo. ¿Quieres una interpretación de la trama? Si es así, deberías leer las diagramas de caja. Si está pidiendo algo más, comente esta respuesta y aclare la pregunta.


* Para ser específico, cuando decimos que [matemática] H_0 [/ math] es la suposición ‘esa’ extensión espacial ‘es la misma para los cuatro tipos de contaminantes,’ esto típicamente significa una de dos cosas:

Para cualquier instancia dada de contaminación, la extensión espacial puede variar al azar, pero …

  • … la distribución de la extensión espacial es la misma para todos los tipos de contaminantes.

O:

  • … la extensión espacial media es la misma para todos los tipos de contaminantes.

No anota (en la pregunta o en el comentario) qué prueba hicieron los investigadores (ANOVA parece probable) o qué estadística informaron (podría ser F o t o [matemática] R ^ 2 [/ math] u otra cosa). Entonces, tenemos que confiar en el significado general del valor de p:

Si, en la población a partir de la cual se extrajo aleatoriamente esta muestra, la hipótesis nula era estrictamente cierta, ¿cuáles son las posibilidades de obtener una estadística de prueba al menos tan extrema como la que obtuvimos en una muestra del tamaño de la que tenemos?

Para su caso, el nulo probablemente sea que la extensión espacial es la misma para los cuatro grupos (pero el valor nulo podría ser otra cosa). Entonces, puedes decir que si en la población (de lo que se trata este estudio) realmente no hubiera diferencia, sería muy poco probable que obtengas una (F, t, lo que sea) al menos tan grande como la que tiene.