Información en archivos. Texto, CSV, JSON, HTML, XML

En este bloque vamos a ver cómo se trabaja con distintos formatos de archivos con Python.

1 - Archivos de texto

2 - Archivos CSV

Documentación

Notebook Base

  • Open In Colab
  • 🛠️ Open In Colab

El formato de archivos CSV

CSV significa “Comma-Separated Values” (Valores Separados por Comas), y es un formato de archivo que almacena datos tabulares en forma de texto. Un archivo CSV esencialmente consta de una o más filas, y cada campo en la fila está separado por una coma. Este es un ejemplo muy simple:

Nombre,Edad,Correo
Alice,30,alice@email.com
Bob,45,bob@email.com
Charlie,25,charlie@email.com

La primera fila a menudo contiene encabezados que describen qué datos se encuentran en cada columna. Sin embargo, esto no es estrictamente necesario. Los archivos CSV son muy flexibles y pueden ser abiertos o editados con un simple editor de texto o con software más avanzado como una hoja de cálculo.

Formato muy usado en la ciencia de datos y en IoT debido a su simplicidad, eficiencia y versatilidad. Su capacidad para almacenar datos de manera estructurada pero simple lo convierte en una opción popular para una variedad de aplicaciones.

3 - Archivos JSON

¿Qué es JSON?

JSON (JavaScript Object Notation) es un formato de intercambio de datos ligero y de fácil lectura para humanos. Está basado en un subconjunto del lenguaje de programación JavaScript y es muy similar a los diccionarios en Python. Aunque fue originado en JavaScript, se ha convertido en un formato estándar para el intercambio de datos entre diferentes lenguajes y aplicaciones.

¿Por qué es importante JSON en Python?

  1. Interoperabilidad: JSON es un formato ampliamente aceptado para el intercambio de datos en aplicaciones web.
  2. Facilidad de Uso: La sintaxis de JSON es sencilla y fácil de leer/escribir.
  3. Estructura de Datos Anidados: Permite anidar arrays y objetos, lo cual es especialmente útil para almacenar datos más complejos.

Bibliotecas para manipular JSON en Python

La biblioteca estándar de Python incluye el módulo json, que permite codificar y decodificar datos en formato JSON.

  • json.dump() / json.dumps(): Para escribir datos en JSON.
  • json.load() / json.loads(): Para leer datos en JSON.

Ejercicios Propuestos

Ejercicio 1: Leer y modificar datos JSON

  1. Leer un archivo JSON que contiene una lista de productos. Cada producto debe tener un nombre, precio y cantidad_en_stock.
  2. Incrementar el precio de cada producto en un 10%.
  3. Guardar los datos modificados en un nuevo archivo JSON.

Ejercicio 2: Análisis de Datos JSON

  1. Leer un archivo JSON que contiene datos sobre diversas ciudades, incluyendo el nombre, población, y altitud.
  2. Encontrar y mostrar la ciudad con la mayor y la menor población.
  3. Guardar esta información en un nuevo archivo JSON titulado analisis_ciudades.json.

Estos elementos deberían proporcionar una base sólida para enseñar la manipulación de archivos JSON en Python. Puedes adaptar los ejemplos y ejercicios según las necesidades de tus alumnos.