Primeros pasos con Pandas
Introducción rápida a la gestión de datos con Pandas
Documentación
Introducción
¿Qué es Pandas?
Pandas es una biblioteca de Python que proporciona estructuras de datos de alto rendimiento y herramientas de análisis de datos. Es ideal para manipular y analizar datos, así como para organizar datos en un formato tabular y adjuntar etiquetas descriptivas a las filas y columnas.
¿Por qué usar Pandas?
- Facilita el manejo de datos: Ofrece estructuras como DataFrames y Series para manejar datos de manera eficiente.
- Potente para análisis de datos: Proporciona funciones incorporadas para agrupar, fusionar y resumir datos.
- Compatibilidad con diferentes formatos de archivos: Puedes importar datos desde varios formatos como CSV, Excel, JSON, SQL y muchos otros.
Componentes principales
- Series: Un array unidimensional etiquetado capaz de contener cualquier tipo de datos.
- DataFrame: Una matriz bidimensional con etiquetas tanto de fila como de columna. Esencialmente, un conjunto de Series que comparten un índice.
Ampliación: pandas en AWS Sagemaker
Vemos cómo se lanza el lab en clase.
Última modificación September 7, 2023: proyeco (8f2e685)