descripción de la imagen

La importancia del valor p en las evaluaciones de palatabilidad

En la industria de alimentos para mascotas, las decisiones comerciales sobre el avance de productos se basan en evaluaciones comparativas de palatabilidad utilizando datos. Las preferencias de las mascotas suelen determinarse mediante pruebas de dos tazones. Los datos de estas o cualquier comparación deben analizarse cuidadosamente para contar una historia precisa. El primer paso en este análisis es definir qué medida utilizará de preferencia. El siguiente paso es determinar el valor p, una estadística que indica si una situación hipotética parece razonable después de recopilar y analizar los datos.

MÉTODO

En AFB, el método más común para determinar las preferencias de productos alimenticios para mascotas es una prueba de preferencia emparejada. Se presentan simultáneamente a cada gato o perro cantidades iguales de los dos alimentos a comparar. Después de un tiempo preestablecido o de una cantidad ingerida, los alimentos se retiran y se pesan para determinar cuánto queda. Los mismos dos alimentos se presentan al día siguiente de la misma manera, excepto que las posiciones de los alimentos se cambian de izquierda a derecha. Este cambio es importante para evitar lo que se conoce como "sesgo lateral". El sesgo lateral ocurre cuando un animal demuestra una preferencia debido a su posición izquierda/derecha en lugar de su sabor. Es vital, estadísticamente, que los datos de los dos días se combinen y no se traten individualmente. Los dos días deben considerarse como una prueba en el análisis estadístico.

CÓMO ELEGIR UN TAMAÑO DE MUESTRA

El tamaño de la muestra es el número de gatos o perros a los que se les ofrece la opción en el ensayo de preferencia. Este grupo de muestra pretende ser representativo de un grupo más grande. En este ejemplo, la muestra son los perros utilizados para las pruebas de preferencia y representa el grupo más grande de perros en los hogares que pueden estar interesados ​​en este producto. Cuanto mayor sea el tamaño de la muestra, mayor será la confianza en los resultados. Hay varias formas de establecer un tamaño de muestra:

Determinar el nivel de confianza necesario: cuanto mayor sea el tamaño de la muestra, mayor será la confianza en los resultados. Esto depende de qué tan pequeña sea la diferencia que necesite encontrar. Es más fácil encontrar una diferencia entre 2 gramos y 20 gramos de comida consumida que entre 2 gramos y 4 gramos.

A través de la experiencia: en el caso de las pruebas de preferencia de alimentos para mascotas, el estándar de la industria es de 20 a 30 gatos o perros.

Análisis de poder: el análisis de poder es un cálculo que se puede realizar en un experimento propuesto y que ayuda a minimizar las posibilidades de llegar a conclusiones erróneas después de las pruebas estadísticas. Para empezar, el análisis de potencia requiere algunas estimaciones de parámetros y cambiará según los métodos estadísticos.

Medición

El índice de ingesta (IR) es la medida más utilizada en AFB para sacar conclusiones sobre las preferencias alimentarias.

Un IR(A) de 0.5 indica que no hay preferencia, mientras que un IR(A) de 1 indica una preferencia total por la ración A y un IR(A) de 0 indica una preferencia total por la ración B. La mayoría de las pruebas
caen dentro del rango de IR(A) = 0.3 a 0.7. La proporción de ingesta compensa los diferentes tamaños corporales y los diferentes apetitos entre los animales en un ensayo.

Otras medidas

AFB también incluye medidas como el índice de consumo y la primera elección en nuestros informes de palatabilidad. Estas medidas pueden ayudar a proporcionar más información sobre cómo se comportó el gato o el perro durante la comida. No proporcionamos una prueba estadística para estos por varias razones.

Cálculo del índice de ingesta (IR)

(todas las medidas en gramos consumidos)

CÓMO INTERPRETAR UN VALOR P

En la investigación de alimentos para mascotas, al comparar dos raciones con una prueba estadística:

  • Un valor p grande significa que el experimento no proporcionó evidencia convincente de que las dos raciones fueran diferentes en preferencias en la población de mascotas.
  • Un valor p pequeño significa que existe suficiente evidencia que respalda la idea de que las dos raciones son diferentes. De esta manera, un valor p pequeño demuestra que sería poco probable que observáramos una diferencia tan grande entre las dos raciones si, de hecho, fueran igualmente preferidas en la población de mascotas.
  • El “límite” históricamente aceptado de 0.05 significa que los valores de p inferiores a 0.05 se consideran estadísticamente significativos. Este límite se basa en la tradición y originalmente estuvo influenciado por la conveniencia computacional antes de que las computadoras estuvieran ampliamente disponibles.

EJEMPLOS

Diferencia significativa: los resultados de un ensayo nos llevan a concluir que los dos alimentos analizados son significativamente diferentes.

La Figura 1 es un ejemplo de nuestro informe estándar para ensayos de preferencias pareadas.

La Figura 2 muestra los resultados por perro. El IR(A) es 0.62 (Figura 1) y está representado por el cuadrado naranja. Las líneas que se extienden desde el cuadrado naranja son el intervalo de confianza del 95% (0.51-0.73), que es una medida de nuestra confianza en los resultados. El valor p es 0.039, lo que indica que es poco probable que veamos este patrón debido al azar.

Sin diferencia significativa: resultados de un ensayo que no nos permiten concluir que los dos alimentos analizados sean significativamente diferentes.

El IR(A) es 0.50 (Figura 3) y está representado por el cuadrado naranja en la Figura 4. Las líneas que se extienden desde el cuadrado naranja son el Intervalo de Confianza del 95% (0.35-0.65), que es una medida de nuestra confianza en el resultados. El valor p para la prueba t bilateral de una muestra es 0.49, lo que indica que este patrón no se distingue del azar.

ENTENDIENDO LOS VALORES P

El valor p es complicado. Puede surgir confusión (e incluso una conclusión incorrecta) cuando el valor p se simplifica demasiado.

Por ejemplo, una afirmación común es que un valor p que cae por encima del límite de 0.05 indica que las dos raciones tenían la misma preferencia. De hecho, simplemente indica que no había evidencia suficiente en los datos para concluir que las raciones eran diferentes. La situación es similar a la de un grupo de biólogos que están estudiando un lago. Creen que el lago tiene peces, así que arrojan una red al agua. Si pescan, entonces han demostrado que hay peces en el lago. Si no pescan, sería incorrecto concluir que no hay peces en el lago. Sin embargo, un tamaño de muestra más grande (lanzados adicionales de la red) brindaría más oportunidades para capturar peces si existieran en el lago.

Además, el valor p no cuenta toda la historia. Considere el segundo ejemplo (Figura 4): los perros en esta prueba de alimentos para mascotas tienen una gran variación: algunos muestran una alta preferencia por una ración y otros prefieren la otra ración. Esto resultó en un valor p grande, que indica que no hay diferencias significativas entre las raciones.

Sin embargo, en lugar de descartar los resultados, sería prudente investigar más a fondo si existe una característica identificable potencialmente responsable de las preferencias, como que los perros mayores prefieran una ración y los perros más jóvenes prefieran la otra. Encontrar esa característica podría ayudar a los fabricantes de alimentos para mascotas a desarrollar una estrategia para dirigirse a diferentes segmentos de consumidores para esa ración en particular, a pesar de que no hay diferencias estadísticamente significativas entre las raciones. El resultado podría aprovechar al máximo los datos de la investigación y brindar nuevas oportunidades para atender a los dueños de mascotas de manera más efectiva.

Atrás