Leda pisze:Czy istnieje możliwość tworzenia dokumentu z plików jpg w taki sposób, aby przekształcić je do doc lub PDF?
Czy chodzi o to, by utworzyć dokument z obrazkami wyglądającymi jak tekst?
Taki dokument byłby podzielony na strony, dałoby się coś do niego dopisać, ale rzeczy na obrazkach pozostawałyby niezmienne; nie do edycji. W takim przypadku propozycja Questa jest bliska optimum.
Czy może chodzi o to, żeby z obrazka zawierającego tekst wyciągnąć ten tekst do dokumentu? tak, żeby składał się z liter napisanych jakimś krojem czcionki, żeby dawało się ten tekst zmieniać, poprawiać? W takim przypadku potrzebujemy oprogramowania OCR (Optical Character Recognition, czyli rozpoznawanie znaków pisma). Dawno nie używałem, ale programy darmowe i o otwartym kodzie w tej niszy praktycznie nie istnieją. Najbardziej zaawansowane z nich, Google Tesseract oraz OCRopus, nie są łatwe w instalacji. Chyba najbardziej znany program komercyjny, ABBYY FineReader, bywa dołączany jako oprogramowanie do domowych skanerów. Inne zresztą również. Być może któreś mają w pełni funkcjonalną wersję próbną (patrz np. finereader.pl -- 12-dniowa wersja próbna FineReadera, z ograniczeniami opisanymi pod wskazanym adresem).
W praktyce pożyteczne być mogą także serwisy OCR działające w Internecie, np. onlineocr.net -- z tym, że należy uważać:
* nie przekazałbym takiemu serwisowi dokumentu o poufnej treści;
* wersje darmowe mają ograniczenia na objętość plików i intensywność ich przetwarzania (np. liczba stron na godzinę), często są “wabikami” do serwisów płatnych;
* trzeba jak zwykle w kontaktach z nieznanymi serwisami uważać na licencje, żeby się nie okazało, że gdzieś komuś jesteśmy dłużni pokaźną kwotę.
PS. wskazany adres konwersji online podałem dla przykładu. Nie twierdzę, że jest on trefny. Ale nigdy go nie używałem.
PS. W praktyce jakość konwersji zależy od jakości obrazu (rozdzielczość, brak zakłóceń) oraz od jakości słowników językowych, z którymi oprogramowanie współpracuje.