A veces hay que pasar texto de un PDF a un trabajo en word o open/libreOffice, pero el texto del pdf no se puede copiar, porque en sí es como una foto cada página. Aparte es demasiado texto como para ponerse a la antigua a pasar como se adelanta un cuaderno.
Para hacer la tarea de pasar texto del pdf a nuestro trabajo, mas ágil, primero separamos el PDF en imagenes, cada una por una página con:
convert mipdf.pdf imagen.jpg
Si se quiere un rango de páginas y no todo el pdf
convert mipdf.pdf[0-21] imagen.jpg
Se empieza a contar desde 0 y va a hasta la página 21
Ya con las imágenes nos valemos del servicio de Free ORC que permite extraer texto de imágenes
- Subimos la imagen que se le quiere extraer el texto.
- Seleccionamos el idioma, español, de suponer.
- Se llena un capcha
Acto seguido se verá el texto que tenía el archivo de la imagen o la página del PDF, funciona bastante bien la verdad aún así es recomendable leer como queda ya que a veces pero a veces quedan las palabras unidas o separadas dónde no deben.
visto en -> MundoGeek