seeseekey.net - Invictus Deus Ex Machina

Möchte man unter Linux eine PDF kom­pri­mie­ren, so kann dies rela­tiv unkom­pli­ziert auf der Kon­sole erle­digt wer­den. Dazu gibt man ein­fach fol­gende Zeile ein:

gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -sOutputFile=output.pdf input.pdf

Ghost­script nimmt sich dann der Datei an und schreibt die Aus­gabe in das mit­tels „sOut­put­File“ bezeich­nete Ziel. Die PDFs kön­nen dabei durch­aus auf ein Drit­tel ihrer Größe schrumpfen.

Wenn man unter Linux direkt in PDFs scan­nen möchte, bie­tet es sich an gscan2pdf zu nut­zen. Unter Mac OS X gibt es ein ähn­li­ches Tool mit dem Namen PDFScanner.

PDFScanner mit geöffneten Scanoptionen

PDF­Scan­ner mit geöff­ne­ten Scanoptionen

Neben dem Scan­nen in PDFs kann PDF­Scan­ner die Bil­der ent­zer­ren und auch OCR auf die PDFs anwen­den, so das diese durch­such­bar wer­den. Im Gegen­satz zu gscan2pdf han­delt es sich bei PDF­Scan­ner um eine kom­mer­zi­elle Soft­ware. Die offi­zi­elle Seite ist unter http://www.pdfscannerapp.com/ zu finden.

PDFScanner
PDFScanner
Down­load @
Mac App Store
PDF­Scan­ner
Ent­wick­ler: Felix Rotthowe
Preis: 13,99 €

Für alle die schon immer wis­sen woll­ten was sie an uni­xio­den Sys­te­men nicht mögen, ist es das prak­ti­sche Hand­buch schlecht­hin: das Unix Haters Hand­buch. Stil­echt begin­nend mit einem Antivor­wort von Den­nis Rit­chie (dem Erfin­der von C), zeigt es einem die Pro­bleme und Macken auf mit wel­chem man bei einem sol­chen Sys­tem zu kämp­fen hat. Das Buch fällt dabei defi­ni­tiv in die Kate­go­rie tech­nisch beding­ter Humor. Her­un­ter­la­den kann man das ganze in PDF Form unter http://web.mit.edu/~simsong/www/ugh.pdf.

Wei­tere Infor­ma­tio­nen gibt es unter:
http://en.wikipedia.org/wiki/The_Unix-Haters_Handbook

Wer in die Ver­le­gen­heit kommt und PDFs zusam­men­fü­gen möchte, der sollte sich ein­mal „pdftk“ anschauen. Unter Ubuntu muss das ganze mittels:

sudo apt-get install pdftk

instal­liert wer­den. Danach kann man meh­rere Dateien im Ter­mi­nal nach dem Schema:

pdftk rechnung.pdf rechnung-s2.pdf output rechnung-komplett.pdf

zusam­men­fü­gen.

Das Embed­ded Pro­jects Jour­nal ist in einer neuen Aus­gabe (Num­mer 8) erschie­nen. Es han­delt sich dabei um eine Com­mu­nity Zeit­schrift für den Embed­ded Bereich wel­che kos­ten­los bezo­gen wer­den kann. Zu fin­den ist diese unter https://journal.embedded-projects.net/.

Wei­tere Infor­ma­tio­nen gibt es unter:
http://www.mikrocontroller.net/topic/214370

Ges­tern gab es einen Arti­kel über einen Game­boy Color Emu­la­tor und schon lese ich bei Golem (http://www.golem.de/1106/84265.html) etwas über PDF Ren­de­ring in Java­script. Es han­delt sich dabei um die Java­script Biblio­thek pdf.js.Mit die­ser Biblio­thek kann man PDF Doku­mente im Brow­ser ohne Plugins oder der­glei­chen ren­dern. Sie ist dabei bei wei­tem noch nicht Fea­ture kom­plett aber schon ein sehr schö­nes Proof of Con­cept. Der Quell­code ist dabei unter https://github.com/andreasgal/pdf.js zu finden.

Wenn ich bis­her ein­ge­scannte Doku­mente zu einer PDF kon­ver­tie­ren wollte so habe ich sie ein­fach an den PDF Dru­cker geschickt. Bei mehr­sei­ti­gen Doku­men­ten ist die­ser Her­an­ge­hens­weise aller­dings unprak­tisch. Also musste eine andere Lösung her. Die Lösung hört dabei auf den Namen gscan2pdf und kann unter Ubuntu über den Paket­ma­na­ger instal­liert werden.

Dabei han­delt es sich um eine Anwen­dung mit der man gescannte Doku­mente effek­tiv zu PDFs kon­ver­tiert wer­den kön­nen. Dane­ben beherrscht gscan2pdf auch Tex­ter­ken­nung (über tesseract-ocr) sowie eine auto­ma­ti­sche Ver­bes­se­rung der Scans mit­tels Unpa­per. Die Soft­ware selbst steht dabei unter GPL. Die offi­zi­elle Seite ist unter http://gscan2pdf.sourceforge.net/ zu finden.

Wei­tere Infor­ma­tio­nen gibt es unter:
http://wiki.ubuntuusers.de/gscan2pdf

Wer einen ver­nünf­ti­gen PDF Rea­der für Android sucht, dem sei der Rep­liGo Rea­der emp­foh­len wel­chen im Mar­ket zu fin­den ist. Er kos­tet zwar ein paar Dol­lar besticht aber dafür mit sei­ner Geschwin­dig­keit sowie der Lay­out getreuen Dar­stel­lung. Neben dem Modus bie­tet der Rea­der auch einen Rea­ding Mode in dem man eine PDF sehr bequem lesen kann. Das Pro­gramm ist wirk­lich emp­feh­lens­wert :)

Möchte man unter C# eine PDF öff­nen und eine Seite die­ser PDF als Bit­map benut­zen so benö­tigt man dafür eine externe Biblio­thek. Eine sol­che Biblio­thek bzw. Kom­po­nente ist PDFRasterizer.NET wel­cher mitt­ler­weile in der Ver­sion 2.1 vor­liegt. Das ganze hat bloß einen Haken die Kom­po­nente ist „ziem­lich teuer“ wobei das wie­der Ansichts­sa­che ist. Jetzt benö­tige ich nur noch eine Lizenz und dann kann ich PDF auch mit Juli­ette ein­bauen. Bezo­gen wer­den kann die Kom­po­nente unter http://tallcomponents.com/.

Wei­tere Infor­ma­tio­nen gibt es unter:
http://www.codeproject.com/KB/showcase/pdfrasterizer.aspx

Vor eini­ger Zeit star­tete die Free Soft­ware Foun­da­tion Europe eine Kam­pa­gne um auf freie PDF Rea­der hin­zu­wei­sen. Diese Kam­pa­gne ist unter http://pdfreaders.org/ zu fin­den. Dort wer­den Infor­ma­tio­nen zu dem PDF For­mat sowie eine Liste freier Viewer ange­bo­ten. Also mir hat es Oku­lar ange­tan :)

Wei­tere Infor­ma­tio­nen gibt es unter:
http://www.fsfeurope.org/news/2009/news-20090202-01.de.html