forCeblack utworzono 6 lutego 2018 utworzono 6 lutego 2018 Witam. Szukam pilnie programu do wyszukiwania plików PDF i automatycznego ich porównywania. Otóż mam kilkanascie tysiecy PDFow. Wiele z nich jest duplikatami w stu lub mniej %. Potrzebuje narzedzie, ktore przeszuka mi caly komputer i wylapie mi wszystkie takie same lub podobne pdfy. Wyzwanie? Muszę mieć skuteczny program, nie musi być free. Ktoś pomoże mi w tej kwestii? Dzięki
MasterYoghourt komentarz 7 marca 2018 komentarz 7 marca 2018 (edytowane) To nie jest taki pikuś. Moim zdaniem, należałoby zaprząc do tego jakąś aplikację zdolną do wyświetlania PDF w konsoli Linux. Tutaj dyskusja na ten temat: https://stackoverflow.com/questions/3570591/cli-pdf-viewer-for-linux Następnie treść przekierować na programy typu sed lub awk. Stworzyć dla tych programów pętle, które porównują po kolei zdania z jednego dokumentu z innymi, a wyniki zapisuje w jakiejś bazie. To jest robota dla ogarniętego programisty. Edytowane 7 marca 2018 przez MasterYoghourt
BaruEM komentarz 7 marca 2018 komentarz 7 marca 2018 (edytowane) Próbowałeś czymś takim? Nie wiem jakie dokładne filtry tam są, ale skoro można porównać różnice, to pewnie można znaleźć duplikaty. PS. Nie wiem czy da się porównać wiele plików czy tylko 2. To już do przetestowania. Edytowane 7 marca 2018 przez BaruEM
Wciąż szukasz rozwiązania problemu? Napisz teraz na forum!
Możesz zadać pytanie bez konieczności rejestracji - wystarczy, że wypełnisz formularz.