E-Book
7 Tage kostenlos im Abo
E-Book
11,99 €

Estadística descriptiva y probabilidad para los Negocios con aplicaciones en excel y jamovi E-Book

Javier B Cadena lozano

0,0

Erhalten Sie Zugang zu diesem und mehr als 300000 Büchern ab EUR 5,99 monatlich.

Herausgeber: CESA
Kategorie: Fachliteratur
Sprache: Spanisch
Veröffentlichungsjahr: 2024

Beschreibung

El libro se distribuye de la siguiente manera: el capítulo 1 introduce los conceptos básicos de estadística, su importancia en los negocios y una guía del uso del software jamovi; el capítulo 2 desarrolla las principales herramientas estadísticas para analizar un conjunto de datos, haciendo énfasis en los cuatros principales momentos de una distribución de probabilidad, la medición de la asociación entre dos variables y la representación gráfica de datos; en el capítulo 3 se explica cómo se organizan los datos mediante un tabulado o distribución de frecuencias y el cálculo de los principales estadísticos cuando se tienen datos agrupados; el capítulo 4 introduce el tema de probabilidad como piedra angular para tomar decisiones bajo escenarios de riesgo e incertidumbre, comenzando con las reglas de probabilidad y terminando con el teorema de Bayes y los diagramas de árbol; para finalizar, en los capítulos 5 y 6 se describen las principales distribuciones de probabilidad discretas y continuas utilizadas en los negocios para modelar eventos y calcular los diferentes momentos. Al final del libro se presentan varios apéndices o anexos con material complementario referente a demostraciones, argumentaciones y tablas para hallar probabilidades.

Details

Sie lesen das E-Book in den Legimi-Apps auf:

Android

iOS

von Legimi
zertifizierten E-Readern

Seitenzahl: 381

Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:

Android

iOS

Bewertungen

0,0

Rezensionen(0 Rezensionen)

Ähnliche

BESTSELLER

Der Horror der frühen Chirurgie (ungekürzt)

Lindsey Fitzharris

Für immer aufgeräumt – auch digital

Jürgen Kurz

Der Weg zum erfolgreichen Unternehmer

Stefan Merath

Der Weg zum erfolgreichen Unternehmer

Stefan Merath

Denke (nach) und werde reich

Napoleon Hill

30 Minuten Resilienz

Ulrich Siegrist

Krebszellen mögen keine Himbeeren - Der große Bestseller - Vollständig überarbeitet und aktualisiert

Richard Béliveau

Der Crash ist die Lösung

Matthias Weik

Die Hormonrevolution

Michael E Platt

Günter, der innere Schweinehund, lernt verkaufen

Stefan Frädrich

Mission erfüllt

Owen Mark

Die Leber wächst mit ihren Aufgaben

Dr. med. Eckart von Hirschhausen

Der größte Raubzug der Geschichte

Matthias Weik

Der Mann und das Holz

Lars Mytting

Kopf schlägt Kapital

Günter Faltin

Unsere Hunde - gesund durch Homöopathie

Hans Günter Wolff

Die Jahrhundertlüge, die nur Insider kennen

Heiko Schrang

Organisation für Komplexität

Niels Pfläging

The Truth About Employee Engagement

Patrick M. Lencioni

BLACKOUT - Morgen ist es zu spät

Marc Elsberg

Leseprobe

DEDICATORIA

JAVIER CADENA LOZANO

Este esfuerzo compartido con los mejores amigos que la vida me ha dado, quiero dedicarlo primero a Dios, por darme todo lo bueno de esta vida, a mi querida madre María Ilma, y a mis dos hijos, Javier Felipe y Andrés Bernardo, porque ellos han sido el motor que cada día me impulsa a seguir con más fuerza y dejar huella en las nuevas generaciones con un legado como es este libro.

MIGUEL ANGEL BELLO

Gracias a todas las personas que han sido mi motor y apoyo en esta bonita experiencia como docente, instructor e investigador, por el momento es mi vocación. A mi familia, amigos, colegas y detractores, estos últimos, que a partir de sus comentarios me motivan a seguir creciendo cada día y hacen que esto se convierta en pasión. Somos fugaces en esta vida y por medio de este libro quiero dejar un mensaje de motivación para seguir creciendo y nunca perder el rumbo cuando nos trazamos un objetivo.

519.53 / C122 2023

Cadena Lozano, Javier Bernardo 1962 ; ORCID: 0000-0001-6991-0668

Estadística descriptiva y probabilidad para los negocios con aplicaciones en Excel y jamovi. / Javier Bernardo Cadena Lozano, Camilo Ernesto Tinoco Bernal y Miguel Ángel Bello Bernal. Bogotá: Colegio de Estudios Superiores de Administración – CESA. Editorial CESA, 2023. 594 páginas.

Otros autores:

Bello Bernal, Miguel Ángel 1988; ORCID: 0000-0002-3429-9923

Tinoco Bernal, Camilo Ernesto 1977; ORCID: 0009-0003-2489-4221

Descriptores:

1. Estadística - Procesamiento de datos

2. Estadística comercial - Software

3. Análisis de datos - Métodos estadísticos

4. Probabilidades - Teorías

5. Jamovi (Programa para computador) - Problemas, ejercicios, etc.

6. R (Lenguaje de programación de computadores) - Problemas, ejercicios, etc.

7. Microsoft Excel (Programa para computador) - Problemas, ejercicios, etc.

ISBN impreso: 978-958-8988-85-6

ISBN digital: 978-958-8988-86-3

Nota: Set de datos disponible en https://doi.org/10.57130/FK2/LXJAJ6 o con el código QR

La Editorial CESA y los autores aclaran que los sets de datos están destinados a respaldar los temas tratados en el libro, por lo tanto, no son responsables de ninguna garantía expresa o implícita. El uso de los datos para un fin diferente al expuesto en el libro, es responsabilidad del lector. Los autores y el editor renuncian a toda responsabilidad por daños directos o consecuentes que resulten en su uso.

Consulte los datos abiertos del CESA en el Repositorio de datos académicos https://opendata.cesa.edu.co/

Editorial CESA

Diagonal 34a # 5a - 23 Barrio la Merced, Bogotá – Colombia

www.editorialcesa.com

Correo: [email protected]

Dirección: Editorial CESA

Diagramación y dieño: Yimmy Alberto Ortiz Arias

Corrección de estilo: José Ignacio Curcio Pennen

Impresión: Imageprinting Ltda.

Diseño epub:Hipertexto – Netizen Digital Solutions

Contenido

Prólogo. Explorando el mundo empresarial impulsado por el análisis de datos

Antes de comenzar a leer

Presentación

1. Concepto de la estadística y sus aplicaciones en los negocios

1.1 Introducción y conceptos básicos

1.2 Clasificación de variables

1.3 Preguntas propuestas (selección múltiple con única respuesta)

1.4 Guía práctica para el uso de jamovi

1.4.1 Guía de instalación de jamovi

1.4.2 Descarga del software

1.4.2.1 Instalación del software

1.4.2.2 Instalación de paquetes

1.4.3 Creación de variables

1.4.4 Generación de grupos

1.4.5 Asignar etiquetas de valor

1.5 Respuestas del capítulo

2. Análisis de datos no agrupados

2.1 Introducción

2.2 Medidas de tendencia central y posición

2.2.1 Media aritmética o promedio

2.2.2 Mediana

2.2.3 Media truncada o acotada

2.2.4 Moda

2.2.5 Media ponderada

2.2.6 Media geométrica

2.2.7 Medidas de posición: cuartiles, deciles y percentiles

2.3 Medidas de dispersión o variabilidad

2.3.1 Rango o recorrido

2.3.2 Rango intercuartílico

2.3.3 Desviación media absoluta

2.3.4 Varianza poblacional y muestral

2.3.5 Propiedades de la varianza

2.3.6 Desviación típica o estándar poblacional y muestral

2.3.7 Regla empírica y Teorema de Chebyshev

2.3.8 Coeficiente de variación

2.3.9 Puntaje típico o estandarizado

2.3.10 Construcción del gráfico de caja y bigotes

2.4 Medidas de forma

2.4.1 Coeficiente de asimetría de Pearson.

2.4.2 Coeficiente de asimetría de Fisher-Pearson

2.4.3 Coeficiente de curtosis

2.4.4 Coeficiente de exceso de curtosis

2.5 Medidas de asociación lineal

2.5.1 Covarianza poblacional y muestral

2.5.2 Coeficiente de correlación de Pearson

2.6 Medida de asociación no lineal

2.6.1 Coeficiente de correlación de Spearman

2.7 Estadística descriptiva con Microsoft Excel

2.7.1 Herramientas básicas

2.7.2 Medidas de tendencia central y posición

2.7.3 Medidas de dispersión o variabilidad

2.7.4 Medidas de forma

2.7.5 Medidas de asociación lineal

2.7.6 Uso del complemento “Análisis de Datos” de Microsoft Excel

2.8 Ejercicio aplicado en la construcción de portafolios de inversión en Microsoft Excel con activos del mercado accionario colombiano

2.9 Estadística descriptiva y representación gráfica con jamovi

2.9.1 Frecuencias

2.9.2 Exploración

2.9.3 Tablas cruzadas/frecuencias

2.9.4 Gráficos para variable cuantitativa

2.9.5 Gráficos para variable categórica

2.9.6 Estadísticos para medir el grado de asociación lineal y gráficos para dos variables cuantitativas

2.10 Ejercicios resueltos

2.11 Ejercicios propuestos

3. Análisis de datos agrupados

3.1 Introducción

3.2 Características de la distribución de frecuencias

3.3 Construcción de la distribución de frecuencias

3.3.1 Variable discreta

3.3.2 Variable continua

3.4 Construcción del histograma, ojiva y polígono de frecuencias

3.5 Medidas de tendencia central y posición

3.5.1 Media

3.5.2 Mediana

3.5.3 Moda

3.5.4 Percentiles

3.6 Medidas de dispersión o variabilidad

3.6.1 Varianza

3.6.2 Desviación estándar

3.6.3 Coeficiente de variación

3.7 Construcción de la distribución e histograma de frecuencias en Microsoft Excel con la base del precio Bitcoin (2018-2019)

3.8 Ejercicios resueltos

3.9 Ejercicios propuestos

4. Introducción a la probabilidad

4.1 Introducción

4.2 Principios de conteo

4.3 Regla de multiplicación

4.4 Regla de la suma

4.5 Permutaciones

4.5.1 Permutaciones o variaciones sin elementos repetidos: n>r

4.5.3 Permutaciones con elementos repetidos

4.6 Combinaciones

4.7 Reglas de probabilidad

4.7.1 Regla del complementario

4.7.2 Regla de la adición

4.7.3 Probabilidad condicional

4.7.4 Regla de la multiplicación

4.8 Tabla de probabilidades

4.9 Teorema de Bayes

4.10 Diagrama de árbol

4.11 Construcción de tablas cruzadas en Microsoft Excel con la base jugadores de FIFA 20

4.12 Ejercicios resueltos

4.13 Ejercicios propuestos

5. Distribución de probabilidad para variable aleatoria discreta

5.1 Introducción

5.2 Distribución de Bernoulli

5.3 Distribución binomial

5.4 Distribución binomial negativa

5.5 Distribución hipergeométrica

5.5.1 Construcción de la fórmula

5.6 Distribución de Poisson

5.7 Ejercicios resueltos

5.8 Ejercicios propuestos

6. Distribución de probabilidad para variable aleatoria continua

6.1 Introducción

6.1.1 Función de densidad f(x)

6.1.2 Función acumulada F (x)

6.1.3 Parámetros de la distribución de probabilidad

6.2 Distribución uniforme continua

6.3 Distribución triangular

6.4 Distribución normal

6.4.1 Regla empírica

6.4.2 Distribución normal estándar

6.5 Ejercicios resueltos

6.6 Ejercicios propuestos

Apéndices

Apéndice 1: Cálculo de rentabilidad (enfoque aritmético y logarítmico)

Apéndice 2. Demostración de la varianza muestral

Apéndice 3. Momentos de una variable aleatoria

Apéndice de tablas

Apéndice 4. Función de masa de probabilidad de la distribución binomial

Apéndice 5. Función acumulada de la distribución binomial

Apéndice 6. Valores de e-λ

Apéndice 7. Función de masa de probabilidad de la distribución de Poisson

Apéndice 8. Función acumulada de Poisson

Apéndice 9. Función acumulada F(x) de la distribución normal estándar

Bibliografía

Notas al pie

PRÓLOGO

EXPLORANDO EL MUNDO EMPRESARIAL IMPULSADO POR EL ANÁLISIS DE DATOS

En el vertiginoso mundo del negocio moderno, los datos ostentan su corona como reyes indiscutibles, pero su tesoro de información resulta escaso y esquivo. Cada decisión, cada estrategia y cada éxito dependen de la perspicaz interpretación de la información. Por tanto, bienvenido al mundo de la “Estadística descriptiva y probabilidad para los negocios con aplicaciones en Excel y jamovi”, donde el poder del análisis estadístico se encuentra con la practicidad de aplicaciones del mundo real proporcionado por los autores.

En el primer capítulo de este libro, se emprende un viaje para explorar los conceptos fundamentales de la estadística y su profundo significado en el panorama empresarial. Aquí, se sientan las bases del manuscrito definiendo términos cruciales como población, muestra, tipos de variables, parámetros y estimadores. Además, el libro se adentra en uno de los softwares estadísticos de código abierto más utilizados, jamovi, proporcionando una guía completa para su descarga, configuración y pasos esenciales para la exportación de bases de datos, creación de variables, agrupación y asignación de etiquetas de valor.

Pasando las páginas al Capítulo 2, el texto desentraña el arte de analizar datos no agrupados a partir de la explicación de las diferentes medidas de tendencia central, de posición, de dispersión, de forma y asociación lineal, además de incluir el grafico de caja y bigotes, la regla empírica y el Teorema de Chebyshev, entre otros aspectos. Asimismo, Excel emerge como un fiel compañero, permitiendo el cálculo de estas medidas junto con funciones complementarias como CONTAR, CONTARA, MAX, MIN, SUMA, JERARQUIA y SUMAPRODUCTO. A medida que avanza, el lector encuentra con jamovi, una fuente de trabajo para la estadística descriptiva de variables cuantitativas y cualitativas en la construcción de gráficos.

Con el Capítulo 3, el lector enfrenta los desafíos de analizar datos agrupados. Armado con el concepto de distribución de frecuencias para variables discretas y continuas, los autores muestran el poder de los gráficos (histogramas, ojivas y polígonos de frecuencias) para representar visualmente los datos. Excel demuestra su valía una vez más mientras se navega con destreza a través de ejercicios prácticos para comprender las complejidades de la estadística descriptiva en el ámbito de los datos no agrupados.

A medida que el contenido avanza hacia el Capítulo 4, el tema de la probabilidad toma protagonismo. El lector se familiariza con los conceptos de diseño de experimentos, espacio muestral, ensayo, suceso y clases de sucesos, pasando por las reglas de conteo y probabilidad y, terminando con las tablas de probabilidad, la regla de Bayes y los diagramas de árboles de decisión. La aplicación práctica de Microsoft Excel y los diagramas de Venn mantienen al lector alerta mientras se diferencian las técnicas para el cálculo de probabilidades.

Adentrándose en el Capítulo 5, se presentan las funciones de masa y acumulada de probabilidad. Aquí, el lector se encuentra con los principales parámetros y momentos que dan vida a la descripción de variables aleatorias discretas. El escenario está preparado para la presentación de las distribuciones de probabilidad discretas más comúnmente utilizadas en el ámbito de la administración, aplicadas habilidosamente con Microsoft Excel y jamovi.

Por último, el Capítulo 6, replica la estructura del capítulo anterior para variables aleatorias continuas con base en una comprensión básica del cálculo integral para determinar el área bajo la curva de distribuciones de probabilidad continua. Luego, se presentan las distribuciones de probabilidad continuas más utilizadas en administración con sus respectivas aplicaciones en Microsoft Excel y jamovi, enfatizando la distribución normal y normal estándar por ser esenciales en la base teórica de la estadística inferencial.

Estimado lector, en estas páginas yace un conocimiento fundamental para extraer información de los datos, datos que tienen el poder de transformar negocios y encaminarlos hacia un éxito sin precedentes. “Estadística Descriptiva y Probabilidad para los Negocios con aplicaciones en Excel y jamovi.” es una guía fundamental para entender el vasto paisaje del análisis estadístico, conduciéndote hacia decisiones informadas que impulsarán tu carrera académica y profesional hacia un futuro de potencial sin explotar.

Así que, adéntrate y que comience el viaje. Listo para conquistar el mundo de los negocios impulsado por datos con un nuevo fervor y una confianza inquebrantable que te proporcionan los autores del libro.

Sobre el autor del prólogo:

El Dr. Elvis Hernandez-Perdomo, Doctor en Ciencias de la Ingeniería y PhD en Finanzas, es un reconocido experto en estadística aplicada a los negocios, con amplia experiencia en análisis de datos, modelado estadístico y gestión cuantitativa de riesgos, y ha dedicado años de investigación y práctica en el campo de la estadística y ha impartido numerosos cursos y talleres para empresas y estudiantes interesados en utilizar datos para la toma de decisiones informadas.

Agradecemos sinceramente su invaluable contribución como autor del prólogo, que ha enriquecido esta obra y ha inspirado a lectores y profesionales a adentrarse en el emocionante mundo de la estadística y la probabilidad aplicada a los negocios.

ANTES DE COMENZAR A LEER

Las definiciones y conceptos asociados al idioma inglés se expresan en cursiva al igual que el nombre de las variables utilizadas en los ejemplos aplicados y las rutas para acceder a cada procedimiento en los software Microsoft Excel y jamovi. Los valores de las tablas de los ejemplos y los cálculos (resultados) realizados en el libro son números aproximados, redondeados a dos decimales. Este libro contiene ejemplos con bases de datos reales, ejercicios con respuesta, ejercicios propuestos y ejercicios complementarios de investigación. De igual manera, los autores periódicamente complementarán el libro con nuevos ejercicios producto de su actividad docente. Las bases de datos actualizadas, estarán disponibles en el repositorio del CESA para su consulta y descarga, escaneando el siguiente código QR.

El formato numérico utilizado en el libro es el anglosajón (1,200.58). Las comas son un separador de miles y el punto un separador decimal.

PRESENTACIÓN

El trabajo realizado surge de la necesidad de contar con un libro que presente sus ejemplos y aplicaciones con bases de datos reales utilizando software especializado. Este libro utiliza de manera adecuada la unión de conceptos teóricos y aplicaciones reales, lo que conlleva una mejor capacidad de retener el conocimiento por medio del ejemplo. Cada aplicación realizada utiliza Microsoft Excel y jamovi (que utiliza código R), por ser estos de alta demanda y aplicación en la academia y en el ámbito empresarial para solucionar necesidades de negocio haciendo énfasis en la analítica de datos.

Otro lenguaje de programación muy versátil e importante por su facilidad para aprender, entender y leer es Python. Este es libre, de código abierto y multiplataforma, y en la actualidad es el lenguaje de mayor crecimiento debido a su robustez para trabajar en aplicaciones que utilicen Big Data e Inteligencia Artificial. Por ello, en el repositorio de datos académicos del CESA, se anexarán periódicamente las soluciones a ejercicios desarrollados con bases de datos del libro o nuevos ejercicios con bases de datos diferentes. Esto le permitirá al lector ampliar su conocimiento y aplicación con el uso de otra herramienta de programación que complemente las desarrolladas en este libro.

El libro cuenta con más de setenta ejemplos realizados paso a paso, algunos como casos de la vida real en los que se aplica la estadística para solucionar problemas haciendo uso de los software anteriormente mencionados y datos obtenidos de Bloomberg, yahoo! finance, DANE, Kaggle, Statista, Instagram, Superintendencia financiera de Colombia, Secretaría Distrital de Planeación de Bogotá y ourworldindata; también se dejan algunas preguntas de investigación para que el lector pueda desarrollarlas por su cuenta, al finalizar cada capítulo se presentan ejercicios resueltos paso a paso y ejercicios propuestos con respuesta. De manera complementaria, se introduce y explica el funcionamiento del software jamovi, una herramienta de libre acceso multiplataforma para realizar análisis estadístico.

El libro se distribuye de la siguiente manera: el capítulo 1 introduce los conceptos básicos de estadística, su importancia en los negocios y una guía del uso del software jamovi; el capítulo 2 desarrolla las principales herramientas estadísticas para analizar un conjunto de datos, haciendo énfasis en los cuatros principales momentos de una distribución de probabilidad, la medición de la asociación entre dos variables y la representación gráfica de datos; en el capítulo 3 se explica cómo se organizan los datos mediante un tabulado o distribución de frecuencias y el cálculo de los principales estadísticos cuando se tienen datos agrupados; el capítulo 4 introduce el tema de probabilidad para tomar decisiones bajo escenarios de riesgo e incertidumbre, comenzando con las reglas de probabilidad y terminando con el teorema de Bayes y los diagramas de árbol; para finalizar, en los capítulos 5 y 6 se describen las principales distribuciones de probabilidad discretas y continuas utilizadas en los negocios para modelar eventos y calcular los diferentes momentos. Al final del libro se presentan varios apéndices o anexos con material complementario referente a demostraciones, argumentaciones y tablas para hallar probabilidades.

Esperamos que este libro contribuya al conocimiento y aplicación del análisis exploratorio de datos y la probabilidad en el mundo de los negocios, y sea de alto valor para la formación académica y profesional del lector.

Concepto de la estadística y sus aplicaciones en los negocios

1.1INTRODUCCIÓN Y CONCEPTOS BÁSICOS

Según el diccionario de Cambridge (2023) la estadística es la ciencia que usa información al recopilar, organizar y estudiar números. La Asociación Americana de Estadística (ASA por sus siglas en inglés) en su página web define la estadística como la ciencia que aprende de los datos y permite medir, controlar y comunicar la incertidumbre. Según Croxton y Cowden (1964) la estadística se define como recolectar, presentar, analizar e interpretar datos numéricos.

En este libro se definirá la estadística como una rama de las matemáticas que utiliza un método científico con el fin de recolectar, organizar, analizar, presentar, interpretar y concluir de manera numérica un fenómeno a partir de datos (Mishra et al., 2018). Según Jalajakshi y Myna (2022), el análisis estadístico se refiere al proceso de extraer información y analizar los resultados con el propósito de derivar o generalizar la base de datos; los datos proporcionados constituyen una combinación entre los análisis cuantitativo y cualitativo para medir y realizar su estudio. Estos datos provienen de fuentes primarias, como encuestas, uno de los principales instrumentos en la captura de información, o de fuentes secundarias, como libros o artículos, páginas de internet de agencias gubernamentales, empresas encuestadoras, comisionistas de bolsa, bancos y proveedores de información financiera digital, como Bloomberg.

En esta sección se definen los principales conceptos de estadística:

• Población: es el conjunto de todas las observaciones de interés para el investigador. Por ejemplo, si estamos realizando un estudio sobre el comportamiento de las acciones que se cotizan en el mercado bursátil colombiano debemos escoger estrictamente las acciones que se cotizan en la Bolsa de Valores de Colombia, no interesan las acciones que se cotizan en la bolsa de Madrid, en la bolsa de Lima o en cualquier otro mercado bursátil diferente al colombiano.

La población se encuentra delimitada por el objetivo de la investigación. En algunos tipos de investigación, por ejemplo, en el sector del comercio, es difícil tener información de toda la población debido a la accesibilidad, razón por la cual podríamos decir que esta población es infinita, pues determinar el número total de personas que compran una bebida que se comercializa en grandes superficies y establecimientos pequeños de barrio es, en la práctica, muy complejo, casi imposible. En contraste, una población se supone finita cuando es posible identificar a todas y cada una de las unidades de información porque están organizadas en un dispositivo o archivo, como los clientes de un banco, a los cuales mensualmente se les envía por correo el extracto para el respectivo pago de la cuota.

• Unidades: corresponde a cada uno de los elementos que componen la población. Por ejemplo: sectores, empresas, personas, facturas, acciones del mercado bursátil, entre otros.

• Variable: es una característica o cualidad que se analiza a un conjunto de datos. Por ejemplo, al mercado bursátil colombiano se le puede analizar la volatilidad, la rentabilidad, el tipo de inversionistas, el número de inversionistas, el volumen de negociación, el tipo de papeles que se negocian, entre otros. En una encuesta nacional de hogares se pueden analizar, para cada uno de los individuos, el género, el estado civil, la ciudad de nacimiento, la edad, el número de hijos, el nivel académico, la actividad comercial, entre otras.

• Parámetro: corresponde a una medida descriptiva de la variable en la población y se denotará con la letra griega theta. Los parámetros se suponen constantes y desconocidos cuando no se analiza el universo de elementos, y por ello, para su respectiva inferencia, deben estimarse a través de una muestra.

Algunos ejemplos de parámetros son:

a. Media poblacional.

b. Varianza poblacional.

c. Desviación estándar poblacional.

d. Proporción poblacional.

e. Coeficiente de asimetría poblacional

f. Covarianza poblacional.

g. Coeficiente de correlación lineal poblacional.

Por ejemplo, interesa observar cómo es el comportamiento de la rentabilidad y la volatilidad de las acciones que se cotizan en el mercado colombiano, y para ello podemos utilizar respectivamente la media y la varianza poblacionales.

Se concluye que a partir de un parámetro se analiza el comportamiento de una variable en la población. Uno de los problemas que a diario enfrenta un investigador es tomar decisiones de manera inmediata, pues la recolección de información en la población es lenta e implica altos costos y demoras; para solucionar este inconveniente se elige una porción representativa de la población, denominada muestra, la cual se supone, con el desarrollo adecuado del proceso de muestreo, permite obtener una buena información.

• Muestra: es un subconjunto de la población que se supone debe ser representativa, es decir, que todo el proceso de muestreo siga los requerimientos definidos por la estadística inferencial, relacionados en general con el tamaño de la muestra, el proceso de selección y la representatividad que busca el investigador, de manera que se corresponda con la población que intenta resumir y generalizar. Dependiendo del objetivo de la investigación se podrán utilizar diferentes métodos de selección probabilísticos, como el muestreo aleatorio simple, el muestro estratificado, el muestreo sistemático, entre otros; o el muestreo no aleatorio o aquellos no estudiados por la estadística formal, como el muestreo por cuotas, el muestreo intencional, el muestreo causal o incidental, y el muestreo por bola de nieve.

• Estadístico o estadígrafo: corresponde a una medida descriptiva de la variable en la muestra, algunos estadísticos representativos son:

a. Promedio o media muestral.

b. Varianza muestral.

c. Desviación estándar muestral.

d. Proporción muestral.

e. Coeficiente de asimetría muestral.

f. Covarianza muestral.

g. Coeficiente de correlación lineal muestral.

Podemos apreciar que a partir del estadístico logramos describir el comportamiento de la variable en la muestra; adicionalmente, esta medida es de gran utilidad porque permite estimar el comportamiento de los parámetros desconocidos y así inferir lo que está ocurriendo en toda la población, siempre y cuando cumpla con ciertas propiedades.

• Estimador: es una función que permite hacer una estimación del parámetro desconocido y se denota como theta estimado. Dado que es una variable aleatoria, el valor del estimador, que se conoce como la estimación, depende de la muestra seleccionada. Cada estimador arroja una estimación puntual o por intervalo sobre el comportamiento de un parámetro poblacional desconocido. Por ejemplo, el promedio o media muestral es el estimador asociado a la media poblacional; la varianza muestral es el estimador asociado a la varianza poblacional; la proporción muestral es el estimador de la proporción poblacional, y cada uno de ellos debe cumplir con ciertas propiedades para que sea un estimador; según Babatunde et al. (2020), dichas propiedades son: insesgado, eficiente, consistente y suficiente1. Como investigación de este tema se deja al lector encontrar la diferencia entre un estadístico y un estimador, ya que todos los estimadores son estadísticos, pero no todos los estadísticos son estimadores.

Supongamos que estamos analizando la rentabilidad anual de una muestra aleatoria de diez acciones que cotizan en el mercado colombiano, el estimador elegido para este análisis es el promedio cuyo valor fue 10%. Con este valor se puede concluir que en promedio una acción tiene una rentabilidad anual del 10%, y se puede inferir que la media de la rentabilidad de toda la población es del 10%, siempre y cuando los pasos para realizar esta estimación hayan seguido una rigurosa estrategia muestral, como se menciona en Bautista (2005). Es importante que la muestra seleccionada sea aleatoria ya que su principal ventaja radica en que se puede medir el tamaño del error en las predicciones (Hernández et al., 2014). Según Otzen y Manterola (2017), la representatividad de una muestra permite extrapolar y, por ende, generalizar los resultados a la población objetivo, de forma que una muestra será representativa o no, sólo si fue seleccionada al azar, es decir, si todos los sujetos de la población tuvieron la misma posibilidad de ser seleccionados en esta muestra.

• Estadística descriptiva: utiliza métodos para organizar, presentar y analizar datos provenientes de una población o muestra mediante el uso de tablas, gráficos y medidas numéricas. Su principal objetivo es resumir y describir las características de un conjunto de datos. Según Kaur et al. (2018) la estadística descriptiva se utiliza para resumir datos de manera organizada y describir la relación entre variables en una muestra o población; es el primer paso al realizar una investigación y siempre debe ir antes de cualquier análisis inferencial.

• Estadística inferencial: utiliza métodos que permiten inferir conclusiones del comportamiento desconocido de un parámetro a partir de un estadístico y del uso de la teoría de probabilidad. Los métodos tradicionales que se utilizan para realizar inferencia estadística son las estimaciones por intervalos de confianza y las pruebas de hipótesis. La estadística inferencial se refiere a la evaluación de afirmaciones por medio de intervalos y el uso de pruebas de hipótesis; para aplicar estadística inferencial en una investigación se deben tener en cuenta tres aspectos claves: 1) generalización a partir de predicciones y estimaciones; 2) uso de datos, y 3) uso de lenguaje probabilístico para realizar la generalización de la población a partir de una muestra (Makar y Rubin, 2009).

A partir de los anteriores conceptos se puede apreciar la utilidad o aplicación de la estadística. En primer lugar, permite describir un conjunto de datos, sean poblacionales o muestrales, y a partir del parámetro se describe el comportamiento de la variable en la población y mediante el estadístico o estimador el comportamiento de la variable en la muestra. Esta primera aplicación se conoce como estadística descriptiva. En segundo lugar, a partir de los estadísticos podemos inferir los aspectos que queremos observar sobre el comportamiento de una población, y este conjunto de teorías se conoce como estadística inferencial.

1.2CLASIFICACIÓN DE VARIABLES

Según Mishra et al. (2018) existen cuatro tipos de variables: nominales, ordinales, discretas y continuas. Las dos primeras se denominan cualitativas y las dos últimas cuantitativas. Las dos primeras (nominal y ordinal) se evalúan en términos de nombres o atributos, mientras que las variables discretas y continuas son parte de los datos cuantitativos.

En esta sección se tiene en cuenta la clasificación de variables según Stevens (1946), Kaur (2013) y Mishra et al. (2018). Las variables se pueden clasificar de cuatro maneras: 1) según su nivel de medición, también llamada escalas de medida; 2) según su naturaleza; 3) según el tipo de variable, y 4) según su dependencia.

Según su nivel de medición las variables pueden ser de tipo nominal, ordinal, intervalo y razón. Las variables de tipo nominal y ordinal permiten observar características no medibles a partir de números; vale la pena mencionar que la variable nominal corresponde a los nombres o clasificaciones que se utilizan para los datos en categorías mutuamente excluyentes, es decir que la pertenencia a un grupo imposibilita la opción de estar en otro, por ejemplo, el género: masculino o femenino; mientras que una variable ordinal corresponde a nombres o clasificaciones donde cada categoría tiene un orden significativo, por ejemplo, cuando se hace una encuesta dentro de un restaurante para calificar el servicio del mesero, se tendrían opciones como: excelente, bueno, regular o malo.

Una variable de tipo intervalo, es aquella que se mide en una escala numérica, donde el cero es arbitrario, esto quiere decir que el cero no denota ausencia de algo ya que puede ser otro valor; sin embargo, para este tipo de variables se pueden realizar solamente dos cálculos numéricos, la suma y la resta; algunos ejemplos son las notas de una asignatura que toman valores entre 1 y 10, la temperatura medida en grados centígrados o Fahrenheit, la fecha calendario2 y hora. Una variable de tipo razón se mide en una escala numérica donde el cero es un valor fijo, e indica ausencia de algo; en este tipo de variables se puede utilizar cualquier operación matemática básica; algunos ejemplos son: el peso, la estatura, la edad, los ingresos, los costos y la rentabilidad, entre otros.

Según su naturaleza se pueden tener variables discretas o continuas. Las variables discretas son aquellas que solo pueden tomar un número finito numerable de valores, y generalmente se asocian con los números enteros; mientras que las variables continuas son las que toman cualquier valor dentro un rango infinito de valores y se asocian con los números reales. Algunos ejemplos para variable discreta son: número de hijos, número de accidentes de tránsito, número de personas en un concierto, número de acciones transadas en el mercado accionario, número de accionistas de una empresa, número de cantidades vendidas, entre otras. Algunos ejemplos para una variable continua son: peso, estatura, salario, precio de un bien, entre otras.

Según el tipo de variable, pueden ser cualitativas y cuantitativas. Las cualitativas siempre están expresadas en categorías y medidas por escalas de tipo nominal u ordinal, por ejemplo: estado civil, género, calificación de un producto, entre otras. Mientras que las variables cuantitativas están expresadas en magnitudes, esto quiere decir que son números y por lo tanto se pueden realizar operaciones matemáticas básicas; además, están medidas en escalas de razón o de intervalo.

Según su dependencia, una variable dependiente es aquella cuyo comportamiento es estimado por una o más variables independientes; si la variable independiente es una variable que puede tomar cualquier valor, se puede observar su incidencia en otra haciendo un análisis de sensibilidad y comprobar el comportamiento de los valores que podría tomar la variable dependiente. Un ejemplo teórico es el cálculo del coeficiente Beta propuesto por Sharpe (1964) y Lintner (1965); se trata de un indicador de riesgo que mide la volatilidad del activo con respecto al mercado; la variable dependiente es la rentabilidad continua diaria de un activo y la variable independiente es la rentabilidad continua diaria del mercado. Otro ejemplo es la curva de demanda de un producto o servicio, en la que la variable dependiente es la cantidad demandada y la independiente el precio.

Ilustración 1. Resumen de clasificación de variables

Fuente: elaboración propia, a partir de Stevens (1946), Kaur (2013) y Mishra et al. (2018).

Vale la pena señalar que esta no es la única clasificación de variables. Por ejemplo, Mosteller y Tukey (1977) citados en Velleman y Wilkinson (1993), muestran la siguiente clasificación: nombres, grados, rangos, fracciones contadas, recuentos, cantidades y saldos.

En conclusión, es muy importante conocer y clasificar bien el tipo de variable, primero porque le permitirá al investigador escoger el análisis estadístico apropiado para cada variable y realizar la respectiva interpretación y, segundo, porque el software de análisis de datos seleccionado siempre lo solicitará.

A continuación se presentan diez preguntas de elección múltiple con única respuesta, con el fin de que el lector las resuelva y evalúe su proceso de aprendizaje. Las respuestas a este cuestionario se encuentran al final del capítulo.

1.3PREGUNTAS PROPUESTAS (SELECCIÓN MÚLTIPLE CON ÚNICA RESPUESTA)

1.3.1¿Cuál es la clasificación correcta de los datos iniciando desde el nivel más bajo de análisis cualitativo hasta el nivel más alto cuantitativo?

a. Nominal, ordinal, intervalo y razón.

b. Ordinal, nominal, intervalo y razón.

c. Intervalo, nominal, razón y ordinal.

d. Nominal, intervalo, ordinal y razón.

4. Enseñanza: la facilidad e intuición en el uso de jamovi lo hace ideal para introducir y apasionar a cualquier tipo de persona en al análisis estadístico de datos, pues a partir de sus características avanzadas asegura que los estudiantes obtengan capacidades para desarrollar procesos estadísticos que posteriormente servirán en sus procesos de investigación o laborales.

5. Comunidad: jamovi es un proyecto comunitario que invita a personas de todo el mundo a contribuir en él.

6. Reproducibilidad: la reproducibilidad no debería ser complicada, por eso jamovi guarda datos, análisis, opciones y resultados, todo en un solo archivo. Se puede hacer una copia de seguridad de este archivo, compartirlo con colegas y, en cualquier momento, volver a cargarlo en jamovi.

7. Solución de necesidades a la medida: jamovi facilita que los programadores de R, desarrollen y publiquen sus propios análisis. Los módulos que serán apropiados como fundamento de este libro se presentan en la siguiente tabla resumen.

Tabla 1. Descripción de los principales módulos en jamovi

Nombre del módulo

Descripción

scatr

Permite realizar análisis exploratorio a partir del gráfico de dispersión y Pareto.

Rj-Editor

Permite utilizar el código de R dentro de jamovi para analizar el conjunto de datos.

jjstatsplot

Permite generar gráficos a partir del paquete ggstatsplot de R

moretest

Permite agregar pruebas estadísticas adicionales dentro de jamovi; sin embargo, no es un módulo visible dentro del menú sino complementario a los análisis que trae por defecto jamovi; entre las principales pruebas se destacan las siguientes: pruebas de normalidad no paramétricas, test de homogeneidad de varianzas, ANOVA, ANCOVA y regresión lineal.

distrACTION

Permite calcular probabilidades de seis distribuciones de probabilidad, cuatro para variable continua y dos para variable discreta de manera interactiva.

clt

Permite realizar demostraciones estadísticas para ayudar al estudiante en la enseñanza de los principales conceptos de estadística de manera visual: aproximación normal de la distribución binomial, ley de los grandes números, teorema del límite central, correlación y pruebas de hipótesis.

Fuente: elaboración propia a partir de la versión 2.3.28.

Para mayor profundidad en el conocimiento de esta iniciativa se recomienda consultar su sitio web: www.jamovi.org/. También revisar el libro Learning statistics with jamovi: a tutorial for psychology students and other beginners de Navarro y Foxcroft que se encuentra en el siguiente enlace: https://davidfoxcroft.github.io/lsj-book/.

1.4.1Guía de instalación de jamovi

A continuación se presenta una explicación paso a paso para la correcta instalación y funcionamiento del software.

Lo primero que debe tener en cuenta son los siguientes requisitos del sistema:

• Sistema Operativo: Windows, macOS y Linux.

• Microsoft .Net framework 2.0/3.0/3.5 o posterior.

• 500 MB de espacio libre en el Disco Duro.

• 2GB de RAM (Recomendado).

• Derechos de Administrador sobre el equipo.

• Conexión a internet.

Una vez verificados los anteriores requerimientos, podrá realizar la instalación.

1.4.2Descarga del software

Abra su navegador de internet e ingrese a la siguiente página web: https://www.jamovi.org/. En ella encontrará todo el contenido relacionado con el producto. En esta ventana debe dar clic sobre la opción products y luego jamovi Desktop.

Descargue la versión según el sistema operativo. Acá se descargará la última versión del producto para el sistema operativo Windows (2.3.28). Es posible que al momento de abrir la página web encuentre una versión actualizada, descargue la última versión ya que seguramente tendrá corrección de errores y nuevas características.

1.4.2.1 Instalación del software

Debe identificar que el archivo descargado se llama jamovi y confirmar que el instalador tenga un peso alrededor de 260 Mb. Si no elige una carpeta de destino para guardarlo, generalmente lo encontrará en la carpeta de descargas en el explorador de Windows.

Deberá dar clic derecho sobre al archivo ejecutable y seleccionar la opción “Ejecutar como administrador”. Dependiendo de la configuración de seguridad de su computador podrán presentarse algunos mensajes de advertencia, por ejemplo, al instalar en Windows 10, es probable que aparezca la siguiente ventana:

En este requerimiento debe dar clic en Sí. El instalador empezará a ejecutarse.

Si desea probar que la instalación fue satisfactoria, abra jamovi, el programa lo encontrará escribiendo jamovi en la búsqueda Windows.

1.4.2.2 Instalación de paquetes

Jamovi es un software con una comunidad extensa de usuarios. Existen paquetes “librerías” diseñados por usuarios para que cualquier persona los utilice, en este paso vamos a descargar e instalar los principales paquetes de jamovi. Deberá abrir jamovi y luego dirigirse a la parte superior derecha “Módulo”, en esta parte damos clic encima de Biblioteca jamovi.

En la siguiente ventana emergente instale los siguientes paquetes:

• Scatr.

• Rj-Editor to run R code inside jamovi.

• Flexplot-Graphically Based Data Analysis.

• Jjstatsplot-Wrapper for ggstatsplot.

• Seolmatrix-Correlations suite for jamovi.

• Moretests-Adds more tests to the jamovi analyses.

• DistrACTION-Quantiles and Probabilities of Continuos and Discrete Distributions.

En caso de que el usuario requiera replicar cada uno de los procesos con R o RStudio, será necesario habilitar el Modo de sintaxis para visualizar el código de cada proceso dentro de jamovi.

Abrir jamovi por primera vez e importar datos

Para ingresar a jamovi (2.3.28), que es la versión que se trabaja en este libro, debe buscarlo en el navegador de Windows, ubicado en la barra de tareas y escribir jamovi.

El programa mostrará la siguiente ventana indicando la versión que tiene actualmente. La ventana de inicio cuenta con las siguientes características: 1) pestaña de herramientas; 2) hoja de cálculo, y 3) visor de resultados. Podrá ingresar los datos manualmente en la ventana (2); sin embargo, en la mayoría de casos los datos provienen de fuentes externas tipo .txt, .csv, .dta, .sav, entre otras; de esa manera será más práctico importar los datos.

Para importar una base de datos, 1) debe dar clic encima de las tres líneas horizontales, allí aparecen ciertas opciones; 2) buscar la opción Abrir, también podrá dar clic en la opción Importar especial. Este software cuenta también con una biblioteca de datos que proporciona 19 bases de datos. Luego de dar clic en la opción Abrir, 3) debe dar clic en la opción Navegar.

Cuando aparezca la ventana Navegar busque la base de datos denominada supermarket_sales-Sheet1, la cual se encuentra en el repositorio de bases de datos de libro o también la puede descargar desde https://www.kaggle.com/aungpyaeap/supermarket-sales.

Aparece la ventana con la hoja de cálculo y en la parte inferior la información del archivo cargado para esta sesión. Antes de realizar cualquier procedimiento estadístico es necesario validar con relación a las escalas de medición de las variables, por supuesto se debe tener conocimiento de la base de datos y su contexto.

El conjunto de datos representa las ventas históricas de una empresa de supermercados que ha registrado datos en tres sucursales diferentes durante tres meses. Se cuenta con 1.000 registros (filas) y 17 variables (columnas). A continuación se presenta una tabla resumen con la descripción y tipo de variable en la base de datos.

Tabla 2. Descripción de la base de datos.

Variable

Descripción

Tipo de variable

Invoice ID

Número de factura

Cualitativa (Nominal)

Debido a que esta variable representa un registro único, así como el número de identificación de una persona, el número de pasaporte, un número telefónico, tendría como característica un identificador.

Branch

Sucursal, se dispone de tres sucursales identificadas por A, B y C

Cualitativa (Nominal)

City

Ubicación de la sucursal

Cualitativa (Nominal)

Customer type

Tipo de cliente, registrado como socio para clientes con tarjeta, y Normal clientes sin tarjeta de socio.

Cualitativa (Nominal)

Gender

Género

Cualitativa (Nominal)

Product line

Categorización de artículos: accesorios electrónicos, accesorios de moda, alimentos y bebidas, salud y belleza, hogar y estilo de vida, deportes y viajes

Cualitativa (Nominal)

Unit price

Precio unitario en dólares

Cuantitativa (Continua)

Quantity

Número de productos comprados

Cuantitativa (Discreta)

Tax 5%

5% de tasa de impuestos por compra del cliente

Cuantitativa (Continua)

Total

Precio total, impuestos incluidos

Cuantitativa (Continua)

Date

Fecha de compra (registro disponible desde enero hasta marzo de 2019)

Cualitativa (Ordinal)

Time

Hora de compra (10 a. m. a 9 p. m.)

Cualitativa (Ordinal)

Payment

Pago utilizado por el cliente para la compra (hay tres métodos disponibles: efectivo, tarjeta de crédito y billetera electrónica)

Cualitativa (Nominal)

Cogs

Costo de los bienes vendidos

Cuantitativa (Continua)

Gross margin porcentage

Porcentaje de margen bruto

Cuantitativa (Continua)

Gross income

Ingreso bruto

Cuantitativa (Continua)

Rating

Calificación del cliente en su experiencia de compra (en una escala del 1 al 10)

Cuantitativa (Discreta)

Fuente: elaboración propia a partir de Kaggle (2023).

Nota: las variables Date y Time son por naturaleza cuantitativas; sin embargo, en este caso son cualitativas porque el software no las reconoce debido a su formato.

https://www.kaggle.com/datasets/aungpyaeap/supermarket-sales.

En la vista de hoja de cálculo se puede observar la base de datos, por lo tanto, puede editar manualmente cualquier campo simplemente dando doble clic donde desea editar. Las columnas indican una variable y las filas muestran información para un individuo, objeto o caso de análisis. Las celdas contienen los valores de cada variable, esta corresponde a la intersección entre el individuo y el atributo de ese individuo.

Como se mencionó, antes de comenzar con cualquier análisis estadístico con software especializado es importante verificar las unidades de medida de cada variable, ya que esto permite reconocer el proceso adecuado para describir la información, sea de manera numérica o gráfica, y para determinar el tipo de análisis a realizar. Para ello debe dar clic encima de la opción Datos y luego dar clic sobre configuración.

En esta ventana aparecen las principales características de las variables: nombre, descripción de la variable, tipo de medida (nominal, ordinal, continua, ID), tipo de datos (entero, decimal, texto), valores perdidos y niveles para las variables de tipo cualitativo. Los campos más importantes son el tipo de medida y el tipo de datos. Las variables cuantitativas que se tienen en el archivo son: Unit Price, Quantity, Tax5%, Total, Cogs, Gross margin percentage, Gross income y Rating. Al momento de verificar la variable Quantity el sistema la reconoce como cualitativa de tipo nominal, caso en el cual se debe cambiar el tipo de medida a continua entera.

La barra de menú contiene las siguientes opciones:

Tabla 3. Principales opciones y características de la barra de menú de jamovi

Opciones

Principales características

Variables

• Deshacer/Rehacer: permite devolverse en cualquier paso de la edición de datos.

• Editar: permite configurar el nombre, descripción y características de una variable o conjunto de variables.

• Calcular: permite crear una nueva variable (columna) mediante funciones matemáticas, estadísticas, lógicas, texto, referencia, base de datos y simulación.

• Transformar: permite crear una nueva variable a partir de una ya existente. Es una característica muy utilizada para transformar variables cuantitativas en cualitativas. También para crear variables dicotómicas a partir de condicionales. Además, esta transformación se puede realizar de manera simultánea con varias variables.

• Agregar: funciona como icono adicional para editar, calcular y transformar variables.

• Eliminar: permite eliminar variables (columnas).

• Filtros: permite generar filtros de filas.

Datos

• Pegar, cortar y copiar: en caso de copiar información de un archivo externo a jamovi podrá pegarla. También podrá manejar estas opciones con los datos cargados en jamovi.

• Deshacer/Rehacer: permite devolverse en cualquier paso de la edición de datos.

• Configuración: permite configurar el nombre, descripción y características de una variable o conjunto de variables.

• Calcular: permite crear una nueva variable (columna) mediante funciones matemáticas, estadísticas, lógicas, texto, referencia, base de datos y simulación.

• Agregar: permite agregar variables (columnas).

• Eliminar: permite eliminar variables (columnas).

• Filtros: permite generar filtros de filas.

• Agregar: permite insertar o añadir registros (filas).

• Eliminar: permite eliminar registros (columnas).

Análisis

• Exploración: permite realizar análisis descriptivo de la información y gráficos estadísticos.

•