Extracción texto de webs e imágenes
Extracción de texto. Práctica con AWS
Documentación
Práctica de extracción de texto con AWS
En esta práctica vamos a utilizar el servicio de AWS
Sagemaker
para extraer texto de páginas web y de imágenes.
Para extraer texto de imágnes usaremos Textract
.
Sigue las instrucciones de esta actividad del curso: https://awsacademy.instructure.com/courses/55981/modules/items/4907052
Extra
Puedes intentar alguno de estos ejemplos en el mismo lab de Sagemaker
: https://github.com/aws-samples/amazon-textract-code-samples/tree/master
Por ejemplo:
- https://github.com/aws-samples/amazon-textract-code-samples/blob/master/python/03-reading-order.py
- https://github.com/aws-samples/amazon-textract-code-samples/blob/master/python/04-nlp-comprehend.py
Intenta cambiar las imágenes de ejemplo por otras que te resulten más interesantes.
Escrito a mano
Última modificación September 7, 2023: proyeco (8f2e685)