Análisis Exploratorio de Datos de los pingüinos del archipiélago Palmer

Este notebook se centrará principalmente en explorar y visualizar el dataset Palmer Penguins utilizando bibliotecas como Seaborn, Matplotlib, y Pandas.

· 2 min de lectura
Análisis Exploratorio de Datos de los pingüinos del archipiélago Palmer
logo

El dataset palmer penguins es un conjunto de datos sobre pingüinos de tres especies diferentes que anidan en una colonia de Archipiélago Palmer, en la Antártida. Contiene información sobre las medidas corporales de los pingüinos, incluyendo la longitud y profundidad del pico, la longitud de la aleta y la masa corporal, así como información sobre el sexo y la edad de los pingüinos. Este conjunto de datos es ampliamente utilizado en la educación y la investigación para enseñar y ejemplificar técnicas de análisis de datos.

Hay tres especies de pingüinos en el conjunto de datos: Adelie, Gentoo, y Chinstrap. Conocidos cientificamente como Pygoscelis adeliae, Pygoscelis papua, y Pygoscelis antarctica, respectivamente. Cada especie se identifica en el dataset por su nombre común.

palmerpenguins

El culmen es el borde superior del pico de un ave. La longitud y profundidad del culmen se renombran como variables "bill_length_mm" y "bill_depth_mm" para ser más intuitivas. En este conjunto de datos de pingüinos, la longitud y profundidad del culmen (pico) se miden como se muestra a continuación:

pico

El objetivo es construir un modelo que utilice las características para clasificar los pingüinos con un máximo de precisión.

Para alcanzar este objetivo, vamos a realizar un análisis exploratorio de datos para comprender los datos y elegir las mejores características. Este notebook se centra en explorar y visualizar el conjunto de datos utilizando bibliotecas como Seaborn y Matplotlib. El procesamiento de datos se realiza con Pandas.

Paquetes utilizados

Procesamiento de datos

  • Pandas

Procesamiento numérico

  • NumPy

Visualización de datos

  • Seaborn
  • Matplotlib.

Referencias

Instructor

Joseph Santiago Portilla - Ingeniero Electrónico.

Notebook

Análisis Exploratorio de Datos Palmer Penguins
Explore and run machine learning code with Kaggle Notebooks | Using data from penguins

Código

GitHub - JoePortilla/PalmerPenguins-EDA: Análisis Exploratorio de Datos de los pingüinos del archipiélago Palmer
Análisis Exploratorio de Datos de los pingüinos del archipiélago Palmer - GitHub - JoePortilla/PalmerPenguins-EDA: Análisis Exploratorio de Datos de los pingüinos del archipiélago Palmer