Überflüssige Absatzmarken aus PDF-Dokumenten in Word 2010 entfernen
Es ist oft so, dass man PDF-Teile oder auch ein ganzes PDF-Dokument zurück nach Word konvertieren muss oder will. Mir ging es mal wieder so. Im Forum www.office2010-hilfe.de tauchte die Frage auf, wie das denn nun mit der neuen Übersetzungsfunktion in Word 2010 ist. Die Fragerin glaubte etwas falsch zu machen, weil sie Word nicht dazu überreden konnte, auch nur das kleinste Wort zu übersetzen.
Sie macht nichts falsch. Was noch in der Technical Preview halbwegs funktionierte, funktioniert in der public Beta nicht mehr. Aber im RC von Office 2010 funktioniert es dann wieder. Um das zu demonstrieren, brauchte ich einen längeren englischen Text. Was lag näher, als das von Microsoft zur Verfügung gestellte e-book Office 2010 First Look von Katherine Murray zu nehmen. Es ist ein englischer Text und liegt als PDF oder XPS-Datei auf meinem Rechner. Das Problem, die Übersetzungsfunktion meines Browsers versagt bei PDF-Dokumenten. Und ein PDF lässt sich nicht in Word öffnen. Also hab ich das ganze Buch als unformatierten Text gespeichert und mit Word geöffnet.
Durch die vielen Absatzmarken, die ein PDF bei der Umwandlung in unformatierten Text produziert, ist ein flüssiges Lesen des Dokumentes auch in Englisch nicht möglich. Aber wie bekommt man so einen Text, der immerhin 219 Seiten hat, schnell und problemlos bereinigt? Dazu kommen noch viele manuelle Seitenumbrüche, die sich aber schnell löschen lassen.
Aus dieser Problemstellung ist ein erstes Tutorial entstanden, das in der Knowledgebase des Forums Office 2010 Hilfe zu finden ist. Das Tutorial für Übersetzungen in Word wird folgen.
Author: Ursula Eilers





[...] Dieser Eintrag wurde auf Twitter von Uschi Eilers, Ursula Eilers und Office2010Hilfe, Coffee Cup erwähnt. Coffee Cup sagte: Überflüssige Absatzmarken aus Pdf-Dokumenten in Word 2010 entfernen http://twurl.nl/v8nq71 [...]