Office 2007 und dessen neues Dateiformat
Mit dem Erscheinen des neuen Office Paketes von Microsoft ergeben sich in jüngster Zeit immer häufiger Fragen in Bezug zu den Dateirestriktionen der iQ.Suite.
Der Aufbau einer Datei entscheidet grundsätzlich über die Konfiguration der Fingerprints, mit deren Hilfe eine zuverlässige Erkennung stattfindet. Um erfolgreich MS Office 2007-Dokumente verarbeiten zu können, muss man - wie bei allen anderen Dokumenten auch - deren Struktur und Aufbau kennen. Da sich diese Struktur vollkommen von den bisherigen Dateiformaten unterscheidet, ist es nicht mehr ausreichend, einfach nur auf einen bestimmten Office-2007-Fingerprint zu prüfen.
Mit dem neuen Office Paket ist das voreingestellte Dateiformat Office Open XML.
Office Open XML ist ein auf mehreren XML-Dateien basierendes Dateiformat, das mithilfe von ZIP zu einzelnen Dateien kombiniert wird. Eine Office-2007-Datei ist also nichts weiter als eine ZIP-Datei, die alle Bestandteile eines Dokuments ("Parts" und "Items") in Form von XML-Dateien enthält.
Parts sind die einzelnen Bestandteile (Bausteine) des Inhalts des Dokuments (Text, Graphiken, Bilder, etc.), während Items beschreibende Metadaten sind, die festlegen, wie die einzelnen Bestandteile des Dokuments zusammengestellt und dargestellt werden sollen.
Der Aufbau, Name und Pfad (innerhalb der ZIP-Datei) des Main Parts hängt vom Typ des Office Open XML-Dokuments (Textverarbeitungsdokument, Tabellenkalkulationsdokument, etc.) ab.
Ein minimales Office Open XML-Textverarbeitungsdokument enthält im Wurzelverzeichnis der ZIP-Datei eine XML-Datei namens /[Content_Types].xml, sowie drei Ordner /_rels, /docProps und einen Ordner mit den eigentlichen Dokumentdaten.
Benennen Sie einfach eine .docx-Datei nach .zip um und entpacken Sie die Datei mit Ihrem Standard-Packer.
Über die Dateiendungen können Sie - wie bisher auch - den Dateityp erkennen. Die "alten" Endungen wurden hier beibehalten und durch einen zusätzlichen kennzeichnenden Buchstaben ergänzt. So erkennt man beispielsweise an der Endung .docx ein Office Word 2007 XML Dokument. Der Dateityp mit der Endung .docm wird erzeugt, wenn VBA Makro Code in einem Office Word 2007 XML Dokument enthalten ist.
Im Umgang mit der iQ.Suite müssen Sie also folgendes beachten:
- Im Ordner /docProps können sich sogenannte Thumbnails (Vorschaubilder) auf die einzelnen Dateien befinden - unabhängig vom Typ der Daten (also auch Text). Das heisst, selbst wenn die eigentlichen Daten keine Bilder enthalten, so können doch in den Meta-Informationen Bilder in Form dieser Thumbnails enthalten sein. Auch diese werden nach dem Entpacken von iQ.Suite erkannt und entsprechend behandelt.
- Office 2007-Dateien werden aufgrund Ihres Fingerprints vom konfigurierten Entpacker entpackt.
- Die darin befindlichen Dateien werden wiederum aufgrund Ihres Fingerprints von der iQ.Suite geprüft und entsprechend den Einstellungen behandelt.
- Office 2007-Dateien werden zunächst wie zip-Dateien behandelt. Um eine Abgrenzung zu "echten" Zip-Dateien zu schaffen, müssen Sie eigene Fingerprints anlegen.
Um Fingerprints für Office 2007-Dokumente zu erstellen, können Sie unterschiedliche Ansätze wählen.
Der gemeinsame Fingerprint für Zip- und Office 2007-Dokumente ist:
0000 04 50 4B 03 04
Gezippte XML-Dokumente erfassen Sie mit dieser Kombination:
0000 04 50 4B 03 04
001E 13 5B 43 6F 6E 74 65 6E 74 5F 54 79 70 65 73 5D 2E 78 6D 6C
Um ein Excel 2007-Dokument zu finden, können Sie diesen Fingerprint einsetzen:
0000 04 50 4B 03 04
001E 13 5B 43 6F 6E 74 65 6E 74 5F 54 79 70 65 73 5D 2E 78 6D 6C
0030..-1 13 77 6F 72 6B 62 6F 6F 6B 2E 78 6D 6C 2E 72 65 6C 73 50 4B
Word 2007 hat den folgenden Fingerprint:
0000 04 50 4B 03 04
001E 13 5B 43 6F 6E 74 65 6E 74 5F 54 79 70 65 73 5D 2E 78 6D 6C
0030..-1 13 64 6F 63 75 6D 65 6E 74 2E 78 6D 6C 2E 72 65 6C 73 50 4B
PowerPoint 2007:
0000 04 50 4B 03 04
001E 12 5B 43 6F 6E 74 65 6E 74 5F 54 79 70 65 73 5D 2E 78 6D
0030..-1 0B 70 70 74 2F 73 6C 69 64 65 73 2F
Um beispielsweise MS Office Word 2007 Dokumente zu verbieten, gehen Sie wie folgt vor:
- Erstellen Sie einen neuen Fingerprint für diesen Dateityp unter Watchdog - Utilities - Fingerprint:


- Fügen Sie ihn in die Dateirestriktion, die von Ihrem iQ.Suite Watchdog-Job aufgerufen wird, in die Liste der verbotenen Dateien ein:

