En este bloque vamos a ver cómo se trabaja con distintos formatos de archivos con Python.
Versión imprimible multipagina. Haga click aquí para imprimir.
Información en archivos. Texto, CSV, JSON, HTML, XML
1 - Archivos de texto
Documentación
Notebook Base
2 - Archivos CSV
El formato de archivos CSV
CSV significa “Comma-Separated Values” (Valores Separados por Comas), y es un formato de archivo que almacena datos tabulares en forma de texto. Un archivo CSV esencialmente consta de una o más filas, y cada campo en la fila está separado por una coma. Este es un ejemplo muy simple:
Nombre,Edad,Correo
Alice,30,alice@email.com
Bob,45,bob@email.com
Charlie,25,charlie@email.com
La primera fila a menudo contiene encabezados que describen qué datos se encuentran en cada columna. Sin embargo, esto no es estrictamente necesario. Los archivos CSV son muy flexibles y pueden ser abiertos o editados con un simple editor de texto o con software más avanzado como una hoja de cálculo.
Formato muy usado en la ciencia de datos y en IoT debido a su simplicidad, eficiencia y versatilidad. Su capacidad para almacenar datos de manera estructurada pero simple lo convierte en una opción popular para una variedad de aplicaciones.
3 - Archivos JSON
Documentación
Notebook Base
¿Qué es JSON?
JSON (JavaScript Object Notation) es un formato de intercambio de datos ligero y de fácil lectura para humanos. Está basado en un subconjunto del lenguaje de programación JavaScript y es muy similar a los diccionarios en Python. Aunque fue originado en JavaScript, se ha convertido en un formato estándar para el intercambio de datos entre diferentes lenguajes y aplicaciones.
¿Por qué es importante JSON en Python?
- Interoperabilidad: JSON es un formato ampliamente aceptado para el intercambio de datos en aplicaciones web.
- Facilidad de Uso: La sintaxis de JSON es sencilla y fácil de leer/escribir.
- Estructura de Datos Anidados: Permite anidar arrays y objetos, lo cual es especialmente útil para almacenar datos más complejos.
Bibliotecas para manipular JSON en Python
La biblioteca estándar de Python incluye el módulo json
, que permite codificar y decodificar datos en formato JSON.
json.dump() / json.dumps()
: Para escribir datos en JSON.json.load() / json.loads()
: Para leer datos en JSON.
Ejercicios Propuestos
Ejercicio 1: Leer y modificar datos JSON
- Leer un archivo JSON que contiene una lista de productos. Cada producto debe tener un
nombre
,precio
ycantidad_en_stock
. - Incrementar el
precio
de cada producto en un 10%. - Guardar los datos modificados en un nuevo archivo JSON.
Ejercicio 2: Análisis de Datos JSON
- Leer un archivo JSON que contiene datos sobre diversas ciudades, incluyendo el
nombre
,población
, yaltitud
. - Encontrar y mostrar la ciudad con la mayor y la menor población.
- Guardar esta información en un nuevo archivo JSON titulado
analisis_ciudades.json
.
Estos elementos deberían proporcionar una base sólida para enseñar la manipulación de archivos JSON en Python. Puedes adaptar los ejemplos y ejercicios según las necesidades de tus alumnos.