Witam
Jak skonwertować plik PDF do open office writer?
Pozdrawiam
Konwersacja
Re: Konwersacja
Ba! temat ciekawy i ważny, i godny obszernego artykułu.
Co prawda OOo potrafi -- czy też ma potrafić -- czytać PDF-y, ale dotyczy to specjalnej wersji PDF-ów, tzw. hybrydy.
W przypadku zwykłego PDF-a nie jest prosto.
Za pomocą narzędzi do obsługi PDF: czy to czysto użytkowych, jak Adobe Reader + schowek, ew. Evince, xpdf itp + schowek, czy to bardziej technicznych, jak skrypty GhostScripta, Cairo itp., jesteś w stanie gorzej lub lepiej odtworzyć z pdf-a niesformatowany tekst. Gorzej lub lepiej, gdyż nie w każdym pdf-ie znaki są tym, czym myślisz. Mogą być np. złożone z kilku części, mogą też nie być znakami, tylko kształtami.
Jednostronicowe dokumenty PDF po konwersji do postaci rysunkowej SVG, EPS lub WMF możesz odczytać za pomocą Draw.
Najgorzej jest ze strukturą dokumentu. W PDF-ie istnieje pewna struktura, np. związana z miejscami kotwiczenia i odsyłaczami, ale nie ma w nich informacji dotyczących np. poziomów hierarchii nagłówków, automatyzacji numerowania itp.
W przypadku, kiedy formatowanie jest ważne, z punktu widzenia domowego użytkownika wciąż jeszcze skuteczną metodą może się okazać droga okrężna: wydruk + skan + OCR z rozpoznaniem layoutu + zapis do formatu, na jaki pozwala oprogramowanie OCR.
Co prawda OOo potrafi -- czy też ma potrafić -- czytać PDF-y, ale dotyczy to specjalnej wersji PDF-ów, tzw. hybrydy.
W przypadku zwykłego PDF-a nie jest prosto.
Za pomocą narzędzi do obsługi PDF: czy to czysto użytkowych, jak Adobe Reader + schowek, ew. Evince, xpdf itp + schowek, czy to bardziej technicznych, jak skrypty GhostScripta, Cairo itp., jesteś w stanie gorzej lub lepiej odtworzyć z pdf-a niesformatowany tekst. Gorzej lub lepiej, gdyż nie w każdym pdf-ie znaki są tym, czym myślisz. Mogą być np. złożone z kilku części, mogą też nie być znakami, tylko kształtami.
Jednostronicowe dokumenty PDF po konwersji do postaci rysunkowej SVG, EPS lub WMF możesz odczytać za pomocą Draw.
Najgorzej jest ze strukturą dokumentu. W PDF-ie istnieje pewna struktura, np. związana z miejscami kotwiczenia i odsyłaczami, ale nie ma w nich informacji dotyczących np. poziomów hierarchii nagłówków, automatyzacji numerowania itp.
W przypadku, kiedy formatowanie jest ważne, z punktu widzenia domowego użytkownika wciąż jeszcze skuteczną metodą może się okazać droga okrężna: wydruk + skan + OCR z rozpoznaniem layoutu + zapis do formatu, na jaki pozwala oprogramowanie OCR.
JJ
LO (24.2|7.6) ∙ Python (3.12|3.11|3.10) ∙ Unicode 15 ∙ LᴬTEX 2ε ∙ XML ∙ Unix tools ∙ Linux (Rocky|CentOS)
LO (24.2|7.6) ∙ Python (3.12|3.11|3.10) ∙ Unicode 15 ∙ LᴬTEX 2ε ∙ XML ∙ Unix tools ∙ Linux (Rocky|CentOS)
Re: Konwersacja
extensions.services.openoffice.org/pl/project/pdfimport
Ja czasami tego używam... Potrafi pozytywnie zaskoczyć ta wtyczka elektronika, oczywiście przy uwzględnieniu uwag z komentarza wyżej...
Działa z Draw i Impress, ale pokombinować można...
Ja czasami tego używam... Potrafi pozytywnie zaskoczyć ta wtyczka elektronika, oczywiście przy uwzględnieniu uwag z komentarza wyżej...
Działa z Draw i Impress, ale pokombinować można...
Ostatnio zmieniony wt cze 04, 2013 10:12 am przez szumekjac, łącznie zmieniany 1 raz.
Re: Konwersacja
Jeżeli wtyczka od OOo " PDFimport" nie daje rady to poszukaj ściągnij pdf2doc i zaimportuj doca.
OOo3.1.1 na Ubuntu 9.04