epub-tools

Adobe hat letztlich angekündigt, dass sie in das Projekt epub-tools Code zur Generierung von EPub-Dateien einbringen. Auf dem Adobe-DigitalEditions-Blog gibt es eine dürre Meldung dazu. Die eingebrachte Bibliothek mit dem Namen EPubGen enthält Java-Code, um EPubs aus Word-, RTF- und FB- (ich glaube, das ist FictionBook) Dateien zu erzeugen.

Owner von epub-tools ist “liza31337″, die mit der Firma Threepress assoziert ist. Threepress machen für O’Reilly ein interessant klingendes Projekt namens Bookworm, das, wenn ich es richtig verstehe, als Ziel hat, das Internet als Repository für eigene E-Books zu nutzen. Ich hätte meine E-Books also nicht auf meinem Reader oder lokal auf einer Festplatte, sondern auf einem Server im Netz. Das klingt ganz praktisch (außer für die Benutzer des Sony-Readers, die ja keine Internetverbindung haben, und selbst wenn sie eine hätten, keine URL eingeben könnten, mangels Hard- bzw. Soft-Tastatur. “Ist ja ein Reader, und kein Writer”, denkt sich Sony anscheinend).

Meine ersten Gehversuche mit EPubGen waren noch ernüchternd. Herunterladen per svn klappte reibungslos. Dokumentation ist allerdings keine dabei. In den Packages für rtf und word liegen Main-Klassen, die man für erste Tests benutzen kann.

Bei dem Versuch eine rtf-Datei zu konvertieren, tritt eine java.io.UnsupportedEncodingException auf. Gesucht wird das Encoding Cp1031. Keine Ahnung was das ist, das kennt noch nicht einmal Google

Anschliessend habe ich den Word-Converter versucht, zuerst mit einer binären Word 2000-Datei. Das klappte nicht, der Converter hat sich beschwert, dass er das Zip-Archiv nicht öffnen kann.

Daher bin ich auf die Idee gekommen, das neuere Word-XML-Format zu benutzen. OpenOffice kann das auch exportieren und nachdem ich die erzeugte Word2003-XMl-Datei manuell gezippt habe, kam ich über die Fehlermeldung, dass das Zip-Archiv nicht geöffnet werden könnte, hinaus. Anschliessend trat aber eine NullPointerException auf, weil anscheinend keine RunProperties (was auch immer das ist) im Dokument existieren. Ich weiss jetzt nicht, ob das Word2003-Format das erwartete ist und stelle die Versuche mit der Bibliothek für’s erste ein.

Tags: , ,

geschrieben am 17.05.2009 um 15:05 in Netzgedanken von cf · RSS 2.0 feed.
Weder Pings noch Kommentare sind erlaubt.