Textanalyse

Bausteintexte, auch als „Textkonserve“ bezeichnet, die OpenXML-basiert sind, können mit der Textanalyse in KnowlEdge Überprüft werden.

Abschnitte und Seitengrößen

Ein Text in Word besteht aus Wörtern, die in Absätze gruppiert sind. Diese Absätze sind wiederum Bestandteil von einem oder mehreren Abschnitten. In diesen Abschnitten legt man Eigenschaften fest, die bei der Montage des Dokuments wichtig sind. Z.B. enwird für ein Abschnitt festgelegt, welche Kopf- und Fußzeilen darin verwendet werden, in wie vielen Spalten der Text dargestellt wird, und auch die Seitenränder die Seitengröße für diesen Abschnitt. Bei der Montage des RTF wurden viele von diesen Angaben von Word nach der Montage ignoriert. Bei OpenXML werden die Angaben aus den unterschiedlichen Bausteintexten aber von Word übernommen. So mussten wir bereits feststellen, das bestimmte Bausteintexte nicht in A4, sondern im Letter-Format angelegt wurden. Bei der RTF-Montage wurde dies von Word ignoriert. Im OpenXML Dokument hat dieser Baustein dann auf einer neuen Seite angefangen, mit dem Letter-Format. Hier ein Beispiel des Dialogs für einen Bausteintext mit 3 Abschnitten, wobei der letzte Abschnitt das Seitenformat „Letter“ hat:

Neben der Darstellung der Eigenschaften des Abschnitts in XML ist wird auch angezeigt, welche Kopf- und Fußzeilen genutzt werden. Für beide gibt es drei mögliche Zustände. Neben die Information, ob eine Kopf- oder Fußzeile vorhanden ist (Häkchen) oder nicht (kein Häkchen), gibt es einen dritten Zustand für Kopf- und Fußzeilen, die zwar in der Definition des Abschnitts vorhanden sind, aber keine (sichtbaren) Inhalt haben. Diese Kopf- und Fußzeilen werden bei der Montage erkannt und so verarbeitet, als gäbe es sie nicht.

Platzhalter

Hier werden die im OpenXML gefundenen Platzhalter mit ihrem für die Bestückung zu verwendenden Format aufgelistet.

Formularfelder

Falls der OpenXML-Bausteintext Platzhalter für E-Forms enthält, werden diese hier aufgelistet. Hierbei ist zu beachten, dass hier PDF-Eigenschaften und Koordinaten verwendet werden. Deshalb ist keine Seiten-Nummer, sondern eine Seiten-ID angegeben. Die Position eines Formularfelds wird in PDF ab der linken unteren Ecke gemessen. D.H. je größer die X-Position ist, desto weiter rechts befindet sich das Formularfeld auf der Seite. Und je größer der Y-Position, desto weiter oben auf der Seite wird das Formularfeld dargestellt. Hierbei ist natürlich zu beachten, dass hier die Koordinaten von einem einzelnen Baustein angezeigt werden. Wenn dieser Baustein in ein Dokument montiert wird, werden auch die Positionen sich ggf. ändern.

Word-Feldfunktionen

Für das Darstellen in KnowlEdge, das Darstellen im CTV-Dialog und bei der Konvertierung von OpenXML nach PDF wird das TxTextControl verwendet. Diese Komponente unterstützt nicht alle Word-Feldfunktionen. Weil es teilweise nicht leicht ist, alle verwendeten Feldfunktionen in einem Bausteintext zu finden, werden die verwendeten Feldfunktionen bei der Textanalyse aufgelistet, und zwar in drei Kategorien: Es gibt eine Kategorie für Feldfunktionen, von denen bekannt ist, dass sie mit TxTextControl funktionieren. In der zweiten Kategorie werden Feldfunktionen angezeigt, von denen bekannt ist, dass sie nicht funktionieren. Die dritte Kategorie enthält Feldfunktionen, von denen nicht bekannt, ist ob sie funktionieren.

Weil TxTextControl ein externe Komponente ist und wir nicht bei einer Aktualisierung des Controls die Textanalyse anpassen möchten, und weil nicht bekannt ist, welche Feldfunktionen zu welcher Kategorie gehören, gibt es zwei Registry-Einträge, um die Kategorien von Feldfunktionen festzulegen.

  HKEY...[]\Tools\KnowlEdge\: WordFieldsAllowed (Zeichenfolge)
  HKEY...[]\Tools\KnowlEdge\: WordFieldsError   (Zeichenfolge)

Beide Zeichenfolgen sollten eine durch Semikolon getrennte Liste von Feldfunktionen enthalten. Falls diese Werte nicht in der Registry vorhanden sind, wird als Standard für WordFieldsAllowed derWert „NUMPAGES;PAGE“ verwendet, und für WordFieldsError der Wert „FILLIN“.

ctv:knowledge:textanalyse · Zuletzt geändert: 20.07.2016 13:17

Copyright © 1992-2024 TeamWiSE Gesellschaft für Softwaretechnik mbH         Adressen |  Kontakt |  AGB |  Datenschutzerklärung |  Impressum