Das Portable Document Format (PDF) ist ein plattformübergreifendes Dateiformat für druckbare Dokumente, das von der Firma Adobe Systems entwickelt und 1993 mit Acrobat 1 veröffentlicht wurde. PDF ist ein kommerzielles, aber offengelegtes Dateiformat, das im PDF Reference Manual von Adobe dokumentiert ist. Eine Teilmenge des Formats ist inzwischen als PDF/X und PDF/A von der ISO genormt worden.
Damit lassen sich aus Texten, Bildern und Grafiken gemischt oder nur einzeln bestehende Dokumente/Dateien erzeugen (z. B. mit Adobe Acrobat Professional 7.0) und darstellen. Die Benutzenden sollen dieses Format nicht ändern und bearbeiten. Dadurch soll u. a. das Copyright besser gewahrt werden. Etwas daraus zu kopieren, kann beim Erstellen erlaubt oder verboten werden (kann bisher jedoch noch nicht wirksam gewährleistet werden).
In der Startphase war der Adobe Reader kostenpflichtig. Erst die kostenfreie Weitergabe der Software ermöglichte die Verbreitung im heutigen Ausmaß. Die aktuelle Version des PDF-Dateiformats ist 1.6 und kann mit Acrobat ab Version 7 verarbeitet werden. PDF-Dateien geben das mit dem Erstellungsprogramm erzeugte Layout in einer vom Drucker und von Voreinstellungen unabhängigen weitgehend originalgetreuen Darstellung wieder.
Ein häufig verwendetes Programm zur Erzeugung von PDF ist Adobe Acrobat Distiller, der aus PostScript-Dateien PDF erstellt. Der Distiller ist verfügbar für Windows und Mac. Diverse Office- und DTP-Anwendungen von Drittherstellern bieten einen direkten PDF-Export an und sind auf vielen Plattformen verfügbar. Mit weiteren Werkzeugen lassen sich – oft über den Druckbefehl, bei größeren Datenmengen aber meist mit einer Programmiersprache aus einer Datenbank heraus – PDF-Dateien einfach und schnell erstellen. Die Erzeugung von PDF-Dateien ist damit auf jeder Plattform möglich.
Durch Offenlegung und Normung von PDF können Drittentwickler unabhängig von Adobe PDF-Werkzeuge bereitstellen. PDF basiert zu großen Teilen auf dem PostScript-Format, das ebenfalls offengelegt ist.
Eine PDF-Datei gibt die Dokumente des Ursprungsprogramms einschließlich aller Schriften, Farben, Raster- und Vektorgrafiken präzise wieder. Diese Dokumente können eine oder tausende Seiten Umfang haben, wobei jede auf eine maximale Seitengröße von 508 cm × 508 cm beschränkt ist.
Das PDF basiert auf dem gleichen Grafikmodell wie PostScript. Im Gegensatz zu PostScript ist es aber keine Programmiersprache, sondern eine Seitenbeschreibungssprache. PDF erlaubt eine genauere Strukturierung von Dokumenten, als das mit Postscript möglich ist. Schriften (außer Pixelschriften) jeglicher Art und Vektorgrafiken können dabei beliebig ohne Qualitätsverlust vergrößert werden. Große Netzwerkpläne und Datenmodelle lassen sich unter diesen Voraussetzungen auf einer PDF-Seite unterbringen.
Aus PDF-Dokumenten lassen sich Textpassagen, Tabellen und Grafiken (und auch Ausschnitte davon) leicht in anderen Anwendungsprogrammen durch Kopieren und Einfügen der jeweiligen Elemente weiterverarbeiten. Text kann nicht nur zur Weiterverarbeitung in anderen Anwendungen, sondern auch zum Durchsuchen oder zur Verwendung mit anderen Ausgabemedien wie beispielsweise Screenreadern extrahiert werden. Durch die Textsuche im einzelnen Dokument oder die Volltextrecherche innerhalb einer PDF-Dokumentensammlung lassen sich sehr einfach Detailinhalte auffinden. Dies funktioniert selbst dann, wenn der Text grafisch verzerrt, z. B. in Kreis- oder Kurvenform dargestellt ist.
Eine Besonderheit des PDFs ist der optionale Dokumentenschutz mit 40- oder 128-Bit-Verschlüsselung. Durch Vergabe eines Benutzerpasswortes ist es so möglich, das Dokument nur einem beschränkten Personenkreis zugänglich zu machen. Weiterhin kann der Autor mit einem separatem Besitzerpasswort gezielt die Rechtevergabe des betreffenden Dokuments festlegen. So kann verhindert werden, dass Benutzer das Dokument abändern, ausdrucken oder Teilinhalte kopieren können. Die Kenntnis des Benutzerpasswortes vorausgesetzt lassen sich diese Rechteeinschränkungen jedoch mithilfe diverser Werkzeuge entfernen.
Durch entsprechende PDF-Werkzeuge lassen sich auch Rechte vergeben, die es ermöglichen, PDF-Dokumente mit Notizen, Kommentaren und Dateianhängen zu versehen oder Formulareinträge abzuspeichern. Ursprünglich konnten diese Merkmale nur mit Adobe Acrobat genutzt werden, seit Version 7 ist es jedoch auch mit dem kostenlosen Adobe Reader möglich, Notizen und Kommentare hinzuzufügen, sofern das entsprechende Dokument vom Verfasser mit den notwendigen Berechtigungen versehen wurde.
Ursprünglich war das PDF ein reines Ausgabe- bzw. Druckformat. Später gab es auch Programme, mit denen man fertige PDF-Dateien verändern kann, zum Beispiel mit dem Adobe Designer. Das Format ist nicht mit den internen Dateiformaten von Textverarbeitungsprogrammen vergleichbar und eignet sich, abgesehen von der Notiz- und Kommentarfunktion, nur begrenzt zur Weiterverarbeitung von Dokumenten. Es ist allerdings innerhalb gewisser Grenzen möglich, beispielsweise Tippfehler zu entfernen. Vorteile im Desktop Publishing sind für Grafiker und Designer die Einbindung aller Elemente für die Druckerstellung.
PDF-Dokumente können abhängig vom Einzelfall sowohl größer als auch kleiner als die Dateien der Ursprungsanwendung sein. Die Größe eines Dokuments hängt von der Art der enthaltenen Daten, von der Effizienz des Erstellungsprogramms und davon ab, ob Schriftarten eingebettet wurden. Schriften können entweder vollständig, als Untermenge der tatsächlich im Dokument verwendeten Zeichen oder aber überhaupt nicht eingebettet werden. Soll ein Dokument unabhängig davon, ob auf der Zielplattform die verwendeten Schriften installiert sind, zuverlässig darstellbar sein, müssen mindestens die tatsächlich verwendeten Zeichen eingebettet werden.
Das PDF wurde im Laufe seiner Entwicklung mehrfach auf spezielle Anforderungen für die Verwendung im Internet angepasst. So musste ein Dokument ursprünglich vollständig verfügbar sein, um dargestellt werden zu können. Inzwischen ist es möglich, PDF-Dokumente zu linearisieren, so dass bereits Teile eines Dokuments während des Ladevorgangs dargestellt werden können. Seit der Version 1.5 der PDF-Spezifikation kann der größte Teil der Dokumentstruktur komprimiert werden.
Heute ist es möglich, interaktive PDF-Formulare zu gestalten. In ihnen kann man in bestimmten Eingabefeldern Werte eingeben.
Es ist auch möglich, Dokumente als Bild einzuscannen und zusätzlich die entsprechenden Informationen als durchsuchbaren Text im gleichen PDF-Dokument zu erzeugen.
Eine der Stärken des PDF ist, dass es für die gängigen Plattformen Viewer (zum Beispiel den Adobe Reader) gibt, die eine plattformunabhängige Darstellung des Inhaltes ermöglichen. Dies bedeutet, dass auf jeder Hard- und Softwareplattform mit einem entsprechendem Viewer der Inhalt einer PDF-Datei ohne grafischen Unterschied dargestellt wird. PDF ist daher auch ein Format zum Publizieren von Inhalten. Während Vorarbeiten oft in Rich-Text-Editoren gemacht werden, wird das fertige Werk dann als PDF veröffentlicht.
Da PDF-Dateien oft für das Publizieren von urheberrechtlich geschützten Werken verwendet werden, ist es üblich, das Werk entweder als im PDF zusammengefasste nicht als Text zu bearbeitende Bilddateien oder als gesperrtes (Druck- und Editierfunktion im AcrobatReader ausgeschaltet) bzw. verschlüsseltes PDF bereitzustellen. Insbesondere die bei wissenschaftlichen Datenbanken sehr beliebte erste Methode führt dazu, dass die PDFs im Vergleich zu reinem Fließtext merkbar größer sind.
Im Internet publizierte PDF-Dateien können unbeabsichtigt vertrauliche Informationen offenlegen. Die übersehenen Peinlichkeiten unterlaufen meist beim Konvertieren von Textdateien nach PDF.
Es ist relativ einfach, sich gegen die Weitergabe vertraulicher Informationen abzusichern. Das Abspeichern der ursprünglichen Textdatei in eine neue Datei löscht in der Regel die im Original enthaltene Bearbeitungschronik. Nach Umwandlung dieser neuen Textdatei nach PDF ist zusätzlich eine sorgfältige Prüfung der in der PDF abgespeicherten Dateieigenschaften erforderlich.
Unter Windows wie auch unter GNU/Linux gibt es den kostenlosen Adobe Reader / Acrobat Reader, um PDF-Dateien anzuschauen. Für unixbasierte Systeme gibt es zusätzlich das äußerst schnelle Programm XPDF, welches auf die grundlegendsten Funktionen (Anzeige auf Bildschirm, Durchsuchen des Dokuments, Ausdrucken) reduziert ist, und deshalb viel schneller geladen und gestartet werden kann und einige weitere Programme (KPDF und Evince), die an ihre Desktop-Umgebung angepasst sind.
Siehe auch: Display Postscript
Freeware:
Kostenpflichtige Software:
Achtung: Dient das PDF als Vorlage für einen Druck in einer Druckerei, sollte diese vor der Erzeugung des PDFs kontaktiert werden, da einige der oben angeführten Programme Probleme in der Druckvorstufe bereiten.
Dient das PDF als Vorlage für einen Druck in einer Druckerei, sollte diese vor der Erzeugung des PDFs kontaktiert werden, da einige der oben angeführten Programme Probleme in der Druckvorstufe bereiten.
PDF-Dokumente können aus XML-Daten mit Hilfe geeigneter Transformationen nach XSL-FO und anschließender Formatierung erstellt werden.
Aus einer HTML-Datei können PDF-Dokumente recht schnell und einfach mit dem Programm htmldoc erzeugt werden. Dieses Programm verfügt sowohl über eine Konsolen-Schnittstelle wie auch über eine GUI. Damit ist es sowohl auf einem Client zur direkten Bedienung durch den Benutzer wie auch zum Servereinsatz, z. B. zur On-the-fly Generierung von PDF-Dokumenten geeignet.
Ein Perl-Modul HTML::HTMLDoc erleichtert Perl-Entwicklern die Schnittstelle zur Kommandozeile.
Das Satzprogramm TeX erhielt mit dem von Hàn Thể Thành entwickelten pdfTeX die Fähigkeit, aus TeX-Quellen direkt PDF zu erzeugen.
In verschiedenen Gremien der ISO werden seit 1997 Normen auf der Grundlage von PDF erarbeitet und verabschiedet. Hierbei werden basierend auf bestimmten PDF-Formatversionen Mindestanforderungen sowie Einschränkungen definiert. Adobe Systems hat in diesem Zusammenhang den betreffenden Gremien der ISO das Recht übertragen, die jeweils nötigen Spezifikationen zeitlich unbegrenzt zum kostenlosen Herunterladen bereitzustellen.
| ISO 15930 | PDF/X | Format für die Übermittlung von Druckvorlagen | |
| PDF/X-1a = ISO 15930-1 (2001) bzw. ISO 15930-4 (2003) | |||
| PDF/X-2 = ISO 15930-5 (2003) | |||
| PDF/X-3 = ISO 15930-3 (2002) bzw. ISO 15930-6 (2003) | |||
| PDF/X-4 = ISO 15930-7 (in Bearbeitung, erwartet für 2007) | |||
| PDF/X-5 = ISO 15930-8 (in Bearbeitung, erwartet für 2007) | |||
| ISO 19005 | PDF/A | PDF Archive | Format für die Langzeitspeicherung |
| PDF/A-1= ISO 19005-1 (2005) | |||
| PDF/E | PDF Engineering | Format für technische Zeichnungen (in Bearbeitung, erwartet für 2006 oder 2007) |
PDF | PDF | Portable Document Format | Portable Document Format | PDF | Portable Document Format | PDF | PDF | Portable Document Format | PDF | Pdf | Portable Document Format | Portable Document Format | Portable Document Format | PDF | Portable Document Format | PDF | Portable Document Format | Portable Document Format | Portable Document Format | PDF | PDF | Portable Document Format | PDF | PDF | PDF | PDF