OCRmyPDF

Möchte man unter Linux PDFs durchsuchbar machen, benötigt man dafür im Normalfall einige Schritte bis man zu dem gewünschten Ergebnis kommt. Mit Hilfe des Shellscriptes OCRmyPDF kann man sich diese Arbeit vereinfachen. Um eine PDF durchsuchbar zu machen reicht es auf der Konsole:

./OCRmyPDF.sh -l deu input.pdf output.pdf

einzugeben. Bei der ersten Benutzung kann es passieren, das die Umwandlung fehlschlägt. Tritt dieser Fall auf, sind einige Abhängigkeiten (unter anderem Tesseract und Unpaper) nicht installiert. Das Skript weißt den Nutzer auf die zu installierenden Pakete hin. Nachdem diese installiert worden sind, kann OCRmyPDF genutzt werden. Das Skript ist unter der MIT-Lizenz lizenziert und somit freie Software. Der Quelltext sowie die Installationsanleitung sind auf GitHub zu finden.

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.