Schlagwort-Archive: pdf

PDF Formulare

Seit acroread nicht mehr in den Repos ist und sich auch nicht mehr ohne Klimmzüge auf aktuelleren Linuxen installieren lässt, sieht es Mau aus mit dem Ausfüllen von PDF-Formularen. Man kann Okular nehmen … und dann damit leben, dass die Formularinhalte als XML Dateien im Homeverzeichnis „verschwinden“, statt direkt beim Dokument zu liegen. Für mich ist das ein No-go, weil ich PDF-Formulare noch Jahre später oder auch auf einer anderen Maschine ausgefüllt ansehen können will.

Eine unfreie aber praktikable Lösung scheint mir hier zu liegen:

https://code-industry.net/free-pdf-editor/

Erste Versuche mit den Beihilfeformularen zeigen, dass sich Master PDF Editor benimmt wie ein Acrobat Reader. Die Formulareinträge landen im PDF. Man kann das PDF also verschieben und kopieren und die Inhalte bleiben erhalten.

Die Installation wiegt mit rund 10MB nicht viel und abgesehen von einigen Qt Abhängigkeiten kommt wenig an Bord.

Regular Expressions im DreamWeaver

dw_regex

Wenn ich PDFs mit pdftohtml umwandle

pdftohtml input.pdf -s -i -p -noframes

dann ist die Ergebnisseite voller Stil- und Positions-Angaben, die ich nicht brauche.

Im Dreamweaver können die länglichen Absatzdefinitionen mit <P .*?> gesucht werden, sofern man das Häkchen bei „Regulärem Ausdruck verwenden“ setzt.

Davon hatte ich es schon einmal – geriet bei mir aber in Vergessenheit.

PDF nach JPG und zurück

PDFs putzen ist oft heikel, weil bei der Arbeit mit Acrobat oft nur ein neuer Layer über den Teil gelegt wird, den man hatte löschen wollen. Mit etwas Geschick kommen die „verborgenen“ Daten wieder zum vorschein.

Die Konvertierung nach JPG und das Löschen mit der Bildbearbeitung liefert 100%ige Ergebnisse. Bei diesem Verfahren ist das Ergebnis nicht nur sauber, sondern rein. Jedoch: convert exportiert PDFs in einer Auflösung, dass es einem die Schuhe auszieht.

So geht’s besser:

convert -density 1200 input.pdf input.jpg

Dabei entstehen zwar monsterdicke JPGs – die man in GIMP wieder auf eine ordentliche Größe bringen sollte, soll das Endprodukt nicht zu dick werden.

Mit

convert input_0.jpg input_1.jpg output.pdf

schiebt man die Bilder wieder in ein neues PDF.