Primeros pasos con Pandas

Introducción rápida a la gestión de datos con Pandas

Introducción

¿Qué es Pandas?

Pandas es una biblioteca de Python que proporciona estructuras de datos de alto rendimiento y herramientas de análisis de datos. Es ideal para manipular y analizar datos, así como para organizar datos en un formato tabular y adjuntar etiquetas descriptivas a las filas y columnas.

¿Por qué usar Pandas?

  1. Facilita el manejo de datos: Ofrece estructuras como DataFrames y Series para manejar datos de manera eficiente.
  2. Potente para análisis de datos: Proporciona funciones incorporadas para agrupar, fusionar y resumir datos.
  3. Compatibilidad con diferentes formatos de archivos: Puedes importar datos desde varios formatos como CSV, Excel, JSON, SQL y muchos otros.

Componentes principales

  1. Series: Un array unidimensional etiquetado capaz de contener cualquier tipo de datos.
  2. DataFrame: Una matriz bidimensional con etiquetas tanto de fila como de columna. Esencialmente, un conjunto de Series que comparten un índice.

Ampliación: pandas en AWS Sagemaker

Vemos cómo se lanza el lab en clase.

Última modificación September 7, 2023: proyeco (8f2e685)