Ubuntu 12.04 „Precise Pangolin“
Ubuntu 11.10 „Oneiric Ocelot“
Ubuntu 10.04 „Lucid Lynx“
PDF Split and Merge
(oder PDFSam) ist ein in Java programmiertes plattformunabhängiges Programm und in zwei Varianten verfügbar. Die kostenlose Variante kann zum einen mehrere PDF-Dateien zu einer einzigen PDF-Datei zusammenfügen (mergen) und zum anderen eine PDF-Datei in mehrere einzelne aufteilen (splitten).
Ab Version 2.x ist PDFSam auch in der Lage, PDF-Dateien zu sortieren (Plugin Visual Reorder) bzw. aus mehreren Dokumenten Seiten zu einer einzigen Datei zusammenzufügen und dabei die gewünschte Seitensortierung zu wählen (Plugin Visual composer). Beim Zusammenfügen werden die Lesezeichen der einzelnen PDF-Dateien übernommen.
Die kostenpflichtige Variante ist PDF Sam enhanced . Diese kann gegen eine Spende (ab 1 US $) vom Autor heruntergeladen werden. Die Unterschiede der beiden Varianten findet man auf dieser Seite
. Alternativ kann "PDF Sam enhanced" selbst aus dem Quelltext kompiliert werden. Dazu ist ein "Java Development Kit" (JDK) notwendig.
PDFSam ist unter den Bedingungen der GPL veröffentlicht, ist also samt Quelltext frei und kostenlos verfügbar. Auf der Webseite des Autors sind Programmversionen für Linux, Windows und Mac OS X erhältlich.
Das Programm basiert auf Java. Wie man eine Laufzeitumgebung (JRE, ab Version 6) installiert, ist im Artikel Java/Installation beschrieben.
pdfsam in Version 1.x ist in den offiziellen Paketquellen enthalten und wird mit dem gleichnamigen Paket
pdfsam (universe)
mit apturl
Paketliste zum Kopieren:
sudo apt-get install pdfsam
sudo aptitude install pdfsam
installiert [2].
Nach der Installation ist bei Ubuntu-Varianten mit einem Anwendungsmenü ein Eintrag unter "Büro -> pdfsam" zu finden, unter KDE 4 liegt der Eintrag im K-Menü unter "Büroprogramme -> pdfsam".
Es soll nicht unerwähnt bleiben, dass die Installation aus den Paketquellen nicht unbedingt erforderlich ist. Auch wer die neuere Version 2.x einsetzen möchte, muss das Programm manuell installieren.
Fremdsoftware kann das System gefährden.
Von der Downloadseite des Autors lädt man sich das .zip-Archiv herunter und entpackt dieses [3] in ein beliebiges Verzeichnis. Programme, die an der Paketverwaltung vorbei installiert werden, sollten nach /opt kopiert werden. Daher legt man hier nun ein Verzeichnis für PDFSam an [4]:
sudo mkdir /opt/pdfsam
Anschließend sollte der Inhalt des entpackten Ordners nach /opt/pdfsam/ kopiert werden. Hierfür werden Root-Rechte [5] benötigt. Um das Programm bequem starten zu können, fehlt noch ein kleines Startskript. Man erstellt daher mit einem Editor [6] - wiederum mit Root-Rechten - die Datei /usr/local/bin/pdfsam mit folgendem Inhalt:
#!/bin/bash java -jar /opt/pdfsam/pdfsam-CURRENT_VERSION.jar
CURRENT_VERSION
muss dabei durch die aktuelle Programmversion ersetzt werden. Dieses Skript macht man ausführbar [7]:
sudo chmod +x /usr/local/bin/pdfsam
Nun kann PDFSam mit dem Befehlsaufruf
pdfsam
gestartet werden. Sollte PDFsam bereits aus den Paketquellen installiert sein, muss man diese Version vorher eventuell deinstallieren und den versteckten Ordner ~/.pdfsam im Homeverzeichnis löschen. Möchte man PDFSam aus dem Startmenü aufrufen, so muss man einen Eintrag von Hand erstellen [8].
Die Enhanced Edition ist nicht als fertiges Paket verfügbar. Um die erweiterten Funktionen der Enhanced Edition zu nutzen, ist es nötig, das Programm aus dem Quelltext zu kompilieren. Dieser kann über die Downloadseite heruntergeladen werden. Außerdem müssen noch die folgenden Pakete für eine erfolgreiche Kompilierung installiert sein:
openjdk-6-jdk (universe, das Java Development Kit (JDK) für Entwickler )
openjdk-6-source (universe, Java Quellcode)
openjdk-6-jre-lib (universe, plattformunabhängige Java-Bibliotheken)
ant (universe, plattformunabhängiges Build-Tool)
mit apturl
Paketliste zum Kopieren:
sudo apt-get install openjdk-6-jdk openjdk-6-source openjdk-6-jre-lib ant
sudo aptitude install openjdk-6-jdk openjdk-6-source openjdk-6-jre-lib ant
Es ist gut möglich, dass man statt OpenJDK 6 auch die Version 7 oder die JDKs von Oracle Java nutzen kann. Bisher fehlen Erfolgsberichte dazu.
Nach der Installation dieser Pakete kann das Programm kompiliert werden. Zuerst wird die Datei pdfsam-<CURRENT_VERSION>-out-src.zip in ein beliebiges Verzeichnis entpackt [4], z.B. den persönlichen Ordner. Nun wechselt man in dieses Verzeichnis. Dort befinden sich nun verschiedene .zip-Dateien, welche alle in dieses Verzeichnis entpackt [4] werden müssen.
Fremdsoftware kann das System gefährden.
Die Datei ~/pdfsam-<CURRENT_VERSION>-out-src/pdfsam-maine/ant/build.properties wird mit einem Editor geöffnet [3], um die Pfade anzupassen. Hier ein Beispiel:
#deploy target destination dir (if you want to deploy) pdfsam.deploy.dir=../build/pdfsam-basic #root dir where every src directory is located workspace.dir=../ #where classes will be compiled, jars distributed, javadocs created and release created build.dir=../build #version to build pdfsam.version=enhanced #libraries itext.jar.name=iText-2.0.7 log4j.jar.name=log4j-1.2.15 dom4j.jar.name=dom4j-1.6.1 jaxen.jar.name=jaxen-1.1 bcmail.jar.name=bcmail-jdk14-138 bcprov.jar.name=bcprov-jdk14-138 looks.jar.name=looks-2.1.4 jcmdline.jar.name=pdfsam-jcmdline-1.0.3 emp4j.jar.name=emp4j-1.0.0 pdfsam-console.jar.name=pdfsam-console-1.1.4e pdfsam-split.jar.name=pdfsam-split-0.4.5 pdfsam-merge.jar.name=pdfsam-merge-0.6.4 pdfsam-cover.jar.name=pdfsam-cover-0.2.4e pdfsam-encrypt.jar.name=pdfsam-encrypt-0.2.4e pdfsam-mix.jar.name=pdfsam-mix-0.1.3e pdfsam-unpack.jar.name=pdfsam-unpack-0.0.3e pdfsam-langpack.jar.name=pdfsam-langpack
Nun kann das Programm kompiliert werden, und man sollte es ohne Probleme starten können.
#Kompilieren cd ~/pdfsam-<CURRENT_VERSION>-out-src/pdfsam-maine/ant/ ant #In das Programmverzeichnis wechseln cd ~/pdfsam-<CURRENT_VERSION>-out-src/build/pdfsam-maine/release/dist/pdfsam-enhanced #Ausführen java -jar pdfsam-<CURRENT_VERSION>.jar
Ab hier kann man die im Abschnitt Installation beschriebenen Schritte durchführen, um den Programmstart zu erleichtern.
Beim ersten Aufruf startet PDFsam in englischer Sprache. Um die deutsche Sprache einzustellen, wählt man den Reiter "Settings". Dort wählt man die Sprache German, speichert ab mit einem Klick auf "Save" und schließt das Programm. Beim nächsten Start von PDFsam sollten die Menüs und Button-Beschriftungen in deutsch sein.
Die Konfigurationsdaten werden im Ordner ~/.pdfsam/ im Homeverzeichnis gespeichert.
Um mehrere PDF-Dateien zusammen zu fügen, muss man den Reiter "Zusammenführen" (Merge) aktivieren und die "Hinzufügen"-Taste betätigen. Es erscheint ein Menü, in dem man die zu vereinenden PDF-Dateien auswählt. Diese erscheinen nun im Menü wieder. Nun den Ausgabepfad und die Ausgabedatei angeben, dies geschieht mit der "Durchsuchen"-Taste. Mit der "Starten"-Taste wird nun der Prozess gestartet.
Unten im Statusfeld wird man über den Fortschritt der Aktion informiert. Hat alles geklappt, erscheint in der letzten Zeile die Meldung
Total processed pages
gefolgt von der Seitenzahl des Ausgabedokuments. Fehlermeldungen färbt PDFsam rot ein, so dass man auf den ersten Blick sehen kann, ob etwas schiefgegangen ist. Das passiert beispielsweise, wenn man versehentlich eine Datei in einem anderen Format als PDF auswählt.
PDFSam kann auch ein einzelnes PDF-Dokument mit zwei oder mehr Seiten aufteilen und so z.B. aus einem fünfseitigem Dokument fünf einzelne PDF-Dateien erstellen.
Auf den Reiter "Teilen" (Split) wechseln und das PDF auswählen, das geteilt werden soll. Dazu die Taste "Durchsuchen" wählen. Ist das geschehen, sieht man weiter unten im Menü die Zerteilungsoptionen:
"in Einzelseiten zerlegen" (Burst) - erzeugt aus jeder Seite des Dokuments eine eigene Datei
"Zerteile nach je "n" Seiten" - mit dieser Option erhält man Dateien mit einer frei wählbaren Seitenzahl
"Zerteile nach geraden Seiten" - man erhält für jede Seite mit gerader Seitenzahl ein neues Dokument
"Zerteile nach ungeraden Seiten" - man erhält für jede Seite mit ungerader Seitenzahl ein neues Dokument.
Unter der Option "Ausgabeordner" gibt man entweder das Originalverzeichnis der Quelldatei ein, oder man setzt einen Haken bei "Bitte Wählen" - So kann man einen anderen Ausgabeordner wählen. Die Bezeichnungen der Ausgabedateien beginnen mit einer Zahl, gefolgt von der unter "Präfix der Ausgabedateien" eingestellten Zeichenkette und dem Namen der Originaldatei.
Mit Hilfe des Programms "pdfsam-console" lassen sich alle Aufgaben in der Kommandozeile bewerkstelligen.
Zum Zusammenfügen der Dateien "1.pdf" und "2.pdf" zu "12.pdf" muss folgender Befehl verwendet werden:
pdfsam-console -f 1.pdf -f 2.pdf -o ./12.pdf concat
Optionen zum Zusammenfügen lassen sich auf der Hilfeseite nachlesen:
pdfsam-console -h concat
Deutsche Dokumentation im PDF-Format
PDF-Werkstatt mit PDFsam - heise Open Source, 09/2012
PDF-Dateien splitten und zusammenfügen - EasyLinux 01/2007
jPdfTweak - weiteres Java-Programm zur Bearbeitung von PDF-Dateien