Archivo de la categoría: Estadística

Indicadores de ajuste

Los indicadores de desviación de un grupo de datos con relación a un modelo se pueden utilizar para valorar la bondad de ajuste entre ambos.

Entre los idncidaores son habituales los siguientes: RMSE, MAE, NRMSE, CV-MRSE, SDR, y R^2.

Sigue leyendo

Anuncios

Deja un comentario

Archivado bajo Estadística

Tamaño del efecto

Tamaño del efecto, Cohen

La pregunta inicial a plantearse es si la diferencia estadísticamente significativa que se registra entre dos grupos es realmente importante o trascendente para la investigación en curso.

El tamaño del efecto es la respuesta de la estadística ante este problema de la trascedencia de los resultados, tanto en comparaciones como en correlaciones de grupos de datos. El tamaño del efecto sirve como indicador de la magnitud de la diferencia o correlación de dichos grupos.

Existen múltiples formas de calcular el tamaño del efecto para distintas pruebas estadísticas. Entre los autores más citados al respecto destaca Jacob Cohen (https://en.wikipedia.org/wiki/Jacob_Cohen_(statician)). La expresión más simple para calcular el tamaño del efecto (ES de sus siglas en inglés) de la comparación de la media de dos grupos es la siguiente*:

daum_equation_1500029196969

ES=\frac { \bar { X } _{ 1 }-\bar { X } _{ 2 } }{ sd }

Donde:

  • ES es el tamaño del efecto.
  • X1 y X2 son las medias de los grupos

Sd es la desviación típica. Se supone que es igual para los dos grupos, aunque, si fuese distinta, la expresión original usaba una de las dos indistintamente.

Para evitar el problema de la sd distinta, se suele utilizar un promedio de las dos desviaciones típicas:

daum_equation_1500029176585

ES=\frac { \bar { X } _{ 1 }-\bar { X } _{ 2 } }{ \sqrt { \frac { { \sigma  }_{ 1 }^{ 2 }-{ \sigma  }_{ 1 }^{ 2 } }{ 2 }  }  }

Donde el denominador es la desviación típica conjunta (pooled standar deviation).

La interpretación, según Cohen, sería la siguiente:

  • 0-0.2 efecto pequeño (small).
  • 0.2-0.5 efecto medio (medium)
  • Más de 0.5 efecto gradne (large).

Existen aplicaciones web que calculan el efecto del tamaño así como en casi todos los paquetes estadísticos. Una calculadora web muy simple se encuentra en este enlace: http://www.uccs.edu/~lbecker/

El libro de Cohen donde se explica todo esto es:

 

* Las expresiones están en LaTex

Deja un comentario

Archivado bajo Estadística

Significación estadística versus trascedencia del resultado

En ocasiones obtenemos diferencias estadísticamente significativas al realizar contrastes de hipótesis, sin embargo, estos resultados no implican siempre que la diferencia sea útil para la investigación.
Por ejemplo, supongamos que tenemos dos grupos de 500 adolescentes cada uno. El peso medio de los dos grupos es igual. Uno de los grupos recibe un programa de cuidado de la salud integral, con seguimiento de la dieta, ejercicio diario y seguimiento médico. El otro grupo sólo tiene un seguimiento médico. Después de un mes el peso medio de los grupos es 70 y 73 respectivamente. Asumiendo que las varianzas son iguales en ambos grupos, la prueba t de student indicará que hay diferencias significativas a un alfa del 0.05.
Aunque existan diferencias, ésta es sólo de 3 kilogramos en una muestra total de 1000 personas, y después de un programa que supone una inversión de tiempo y esfuerzo. ¿merece la pena dicha inversión? ¿El cambio registrado entre los grupos es realmente grande?
Esta es la pregunta que surge a veces cuando se registran diferencias estadísticamente significativas pero puede no ser suficiente para las expectativas de la investigación.
Por tanto, la significación estadística es útil, pero no debería interpretarse al margen del contexto donde se ha desarrollado la investigación. De alguna forma, lo que debe hacerse es interpretar los resultados en términos de “trascendencia” o sentido para la investigación y no sólo en términos de significación estadística.
El cálculo del efecto del tamaño trata de resolver en parte, este problema.

Deja un comentario

Archivado bajo Estadística

Hipótesis de investigación vs hipótesis estadística

Un problema habitual a la hora de aprender metodología es romper la inercia de confundir los siguientes conceptos como el problema de investigación con las dificultades a la hora de hacer la investigación (problemas para hacer la investigación), o la/s hipótesis de investigación con las hipótesis estadísticas.

En este post vamos a centrarnos en el segundo caso con algunos ejemplos. Partimos de dos ideas fundamentales:

  • El planteamiento de investigación se organiza según las siguientes partes: 1º) planteamiento del objetivo de investigación; 2º) planteamiento de los problemas de investigación (esto y lo siguiente se pueden obviar en los diseños exploratorios y descriptivos); 3º) planteamiento de las hipótesis de investigación (una por cada problema de investigación).
  • Una hipótesis es una respuesta a un problema de investigación (dejamos por el momento el concepto de hipótesis de trabajo así como la de hipótesis emergente).

Sigue leyendo

Deja un comentario

Archivado bajo Estadística, Investigación

Clasificación de las variables

Un elemento básico en la formalización de las hipótesis lo componen las variables. Por variable se puede entender todo aquel símbolo que adopta diferentes valores y que está ligado a un fenómeno de la realidad estudiada. Las variables pueden clasificarse de muy diferentes formas en función del criterio que se utilice para ello. Desde un criterio metodológico se suelen clasificar en variables dependientes (VD), variables independientes (VI), variables extrañas (VE), variables control (VC) y variables moderadoras o mediadoras (VM).

Sigue leyendo

Deja un comentario

Archivado bajo Estadística

Gobierno del Big Data

 

La gestión del Big Data está etrechamente vinculada a la gorbernalidad de las tecnologías de la informacion (TI’s). Por gobierno, gobernanza o goberabilidad (depende del autor) de las TI’s se puede entender el sistema organizativo que trata de dirigir, monitorizar, valorar y controlar dichas tecnologías para enfocarlas a una estrategia eficiente de negocio o productividad.

Para normalizar esta gestión de las TI’s han surgido varias iniciativas de estandarización. A continuación se destacan solamente dos:

  • Control Objectives for Information and related Technology (COBIT): se trata de un marco de referencia en el ámbito empresarial para el gobierno de las TI’s desarrollado por ISACA.
  • La ISO_38500 ISO 38500: se trata de un estandar europeo que define los siguientes elementos del buen gobierno: responsabilidad, estrategia, adquisición, rendimiento, conformidad, y comportamiento humano. En la figura siguiente se muestran las tareas principales que deben realizar la dirección institucional para gobernar las TIC (fuente: ISACA).

Modelo de gobierno de las TIC

En el Big Data el gobierno sería el conjunto de políticas que establecen la gestión de los datos. Estas políticas deben diseñarse teniendo en cuenta no solamente la cantidad de datos a gestionar, sino también la corta vida útil que pueden tener muchos de ellos.

Otro elemento importante, quizás más que el anterior, es la confiabilidad de los datos. Para más información sobre este particular puede consultarse el post de Barranco Fragoso.

Deja un comentario

Archivado bajo Big Data, Ciencia, Estadística

Big Data: arquitectura

Con arquitectura se hace referencia a los elementos del Big Data (tanto físicos como de software) y cómo estos se organizan.

image

Sigue leyendo

Deja un comentario

Archivado bajo Big Data, Ciencia, Estadística