OCR i automatyzacja katalogów PDF - złożone dane produktowe w Excelu jednym kliknięciem

Projekt 2

OCR i automatyzacja katalogów PDF - złożone dane produktowe w Excelu jednym kliknięciem

1Problem

Drugi przykład to firma z branży okulistycznej działająca na rynku sprzętu i produktów optycznych, która współpracuje z szeroką bazą dostawców. Jej pracownicy regularnie otrzymywali obszerne katalogi produktowe w formacie PDF od różnych producentów - setki stron tabel, specyfikacji i cen, z których dane musieli następnie wprowadzać do wewnętrznych arkuszy Excel. Proces ten przebiegał manualnie: pracownik przekopywał się przez PDF, kopiował lub przepisywał kluczowe informacje (np. nazwy produktów, kody, parametry techniczne, ceny) do Excela.

Było to zajęcie żmudne, powtarzalne i czasochłonne - ręczne przepisanie danych z jednego katalogu mogło zajmować wiele godzin, a nawet dni. Sytuację komplikował fakt, że każdy dostawca miał inny format katalogu: różne układy stron i tabel, odmienne style prezentacji produktów. To oznaczało brak standaryzacji - za każdym razem pracownik musiał wymyślać, jak wyłuskać potrzebne dane z nowego układu, co rodziło błędy i frustrację zespołu. Firma odczuwała presję, by szybciej aktualizować informacje o produktach w systemie (np. gdy pojawiał się nowy cennik lub oferta), ale ręczna praca hamowała procesy biznesowe. Poszukiwano więc rozwiązania, które zautomatyzuje ekstrakcję danych z PDF, poradzi sobie z dowolnym formatem katalogu, drastycznie skróci czas potrzebny na przygotowanie zestawienia danych w Excelu i odciąży zespół od monotonnych zadań.

2Rozwiązanie

Nasz zespół zaproponował inteligentny system oparty na sztucznej inteligencji i widzeniu komputerowym, który potrafi czytać dokumenty tak jak człowiek, lecz z prędkością maszyny. Wykorzystaliśmy OCR (Optical Character Recognition) połączony z analizą strukturalną dokumentu, aby stworzyć narzędzie zdolne do automatycznego “rozumienia” zawartości katalogów PDF. System skanuje każdy nowy katalog i rozpoznaje zarówno tekst, jak i elementy graficzne na stronach, identyfikując kluczowe obszary, takie jak tabele produktów, nazwy kolumn, opisy czy ceny. Dzięki zaawansowanym algorytmom potrafi wykryć różnice w układzie - nieważne, czy tabela ma kolumny pionowe czy poziome, jakie ma nagłówki, czy produkty są wypisane w punktach czy w akapitach - nasz model AI analizuje strukturę i dopasowuje się do niej. W praktyce zbudowaliśmy coś więcej niż zwykły skaner: to wirtualny asystent do czytania dokumentów, który inteligentnie ekstraktuje potrzebne informacje niezależnie od formatu. Po rozpoznaniu danych następuje ich automatyczna normalizacja i transformacja - różne formaty i jednostki zostają ujednolicone według ustalonych standardów. Na przykład, jeśli jeden dostawca nazywa kolumnę “Nr kat.” a inny “Kod produktu”, system przypisze te wartości do tego samego pola w ustandaryzowanym arkuszu wynikowym.

Algorytm mapowania danych został zaprojektowany tak, by uczyć się różnych wariantów - obsługuje dziesiątki układów stron, tabel, wersji produktów czy sposobów prezentacji parametrów. Każdy katalog jest trochę inny, ale dzięki kombinacji reguł i uczenia maszynowego narzędzie automatycznie dopasowuje sposób ekstrakcji do konkretnego dokumentu, bez potrzeby pisania osobnych skryptów pod każdego dostawcę. Co ważne, daliśmy też użytkownikom pełną kontrolę nad efektem końcowym: powstała prosta aplikacja webowa jako interfejs, w którym pracownicy mogą zweryfikować i ewentualnie edytować wyodrębnione dane. Jeśli jakiejś informacji brak w katalogu lub ma nietypowy format, mogą ją ręcznie uzupełnić w aplikacji - choć system automatyzuje większość pracy, taka możliwość zwiększa poczucie kontroli i gwarantuje 100% kompletności danych. Gotowe zestawienie danych można następnie pobrać jednym kliknięciem jako plik Excel (xlsx), który od razu nadaje się do załadowania do wewnętrznych systemów firmy lub dalszej analizy. Całe rozwiązanie zintegrowaliśmy z istniejącym środowiskiem IT klienta - aplikacja webowa działa w przeglądarce, a dzięki integracjom API dane mogą być bezpośrednio przesyłane do ich bazy. Postawiliśmy na sprawdzone technologie OCR i biblioteki do analizy dokumentów, co przyspieszyło development i zapewniło wysoką niezawodność. Istotny był też aspekt bezpieczeństwa: dokumenty zawierające cenniki i oferty handlowe są przetwarzane wewnątrz firmy, bez ryzyka wycieku wrażliwych informacji biznesowych. Projekt zrealizowaliśmy w krótkim czasie, etapami dostarczając kolejne funkcjonalności - od rdzenia OCR po interfejs dla użytkowników - tak aby firma mogła jak najszybciej odczuć korzyści.

3Rezultaty

Wdrożenie tego rozwiązania przyniosło wymierne i niemal natychmiastowe korzyści. Przede wszystkim nastąpiła ogromna oszczędność czasu - zadania, które wcześniej zajmowały pracownikom wiele godzin, teraz są realizowane w kilka minut lub automatycznie w tle. Na przykład 200-stronicowy katalog z setkami produktów, który kiedyś wymagał od pracownika całego dnia mozolnej pracy, teraz jest przetwarzany przez AI w kilkanaście minut. Szacujemy, że automatyzacja przyspieszyła proces pozyskiwania danych nawet o 90%, co przekłada się na dziesiątki zaoszczędzonych godzin miesięcznie. Ręczne, monotonne przepisywanie danych zostało praktycznie wyeliminowane, dzięki czemu zespół uwolnił się od najbardziej nużących obowiązków administracyjnych. To nie tylko zwiększyło morale (pracownicy mogą skupić się na bardziej ambitnych zadaniach, zamiast ślęczeć nad tabelkami), ale też drastycznie zmniejszyło liczbę błędów. Dane wprowadzane do systemu są teraz spójne i wolne od literówek czy pominięć, niezależnie od tego, z którego katalogu pochodzą. Ustandaryzowany format wyjściowy sprawił, że wszelkie analizy czy porównania ofert dostawców stały się prostsze i bardziej wiarygodne - porównujemy symboliczne jabłka do jabłek, bo wszystkie dane mają jednolitą strukturę.

Firma zauważyła też, że wewnętrzne procesy uległy przyspieszeniu: informacje o nowych produktach są dostępne w systemie niemal od razu po otrzymaniu katalogu, co pozwala szybciej reagować na oferty i potrzeby rynku. Dodatkowo, dzięki opcji ręcznej weryfikacji w aplikacji, zachowano elastyczność - jeśli trafia się bardzo nietypowy dokument, pracownik nadal ma kontrolę, aby go poprawić. Mimo to ponad 80-90% pracy wykonuje automatycznie AI, a interwencje człowieka są rzadkie. Końcowy plik Excel generowany jest natychmiast, gotowy do wykorzystania - to olbrzymia zmiana w porównaniu z wcześniejszym wielogodzinnym przygotowywaniem takich arkuszy. Warto podkreślić, że rozwiązanie jest uniwersalne i skalowalne: system radzi sobie z katalogami o bardzo zróżnicowanych formatach, nie wymagając od dostawców żadnej standaryzacji danych wejściowych. Dla naszego klienta oznacza to, że może on dodawać nowych dostawców i produkty bez obaw o dodatkową pracę - AI wszystko odczyta i zunifikuje. Automatyzacja tego procesu przełożyła się na realne oszczędności operacyjne (mniej roboczogodzin, mniej błędów to także mniejsze koszty) oraz znaczące przyspieszenie workflow w działach odpowiedzialnych za ofertę produktową. Projekt pokazał naszą eksperckość w łączeniu różnych technik AI - od OCR, przez analizę dokumentów, po inteligentną normalizację danych. Co więcej, podkreślił naszą filozofię partnerstwa biznesowego: dostarczyliśmy klientowi rozwiązanie, które nie tylko działa od strony technicznej, ale jest też przyjazne dla ludzi w firmie, wpisuje się w ich procesy i rozwiązuje realny problem. Od identyfikacji potrzeby, przez prototyp, po pełne wdrożenie - towarzyszyliśmy klientowi na każdym kroku, dostarczając narzędzie, które odmieniło ich codzienną pracę na lepsze.

Wróć do projektów