Pełna definicja
Computer vision (CV) — po polsku "widzenie komputerowe" — to gałąź AI ucząca komputery rozumieć zdjęcia i wideo. Klasyczne zadania: klasyfikacja (co jest na zdjęciu), detekcja (gdzie konkretnie), segmentacja (obrys obiektu), OCR (czytanie tekstu z obrazu), rozpoznawanie twarzy.
Codzienne zastosowania 2026 w Polsce: kamery monitorujące ruch (Inteligentne miasta), rozpoznawanie tablic rejestracyjnych (płatność za autostrady), ChatGPT Vision czyta paragony i klasyfikuje koszt firmowy (dla JDG ogromne ułatwienie), Apple Face ID odblokowuje telefon, Allegro automatycznie znajduje podobne produkty po zdjęciu.
Najpopularniejsze "vision LLM" w 2026: ChatGPT Vision (część Plus), Claude Vision (część Pro), Gemini Vision (Google). Wszystkie umożliwiają wrzucenie zdjęcia + zadanie pytania ("co jest na obrazie", "wyciągnij dane z tej faktury", "czy ten produkt ma uszkodzenie"). Polskie kwoty na fakturach, polski NIP, polskie paragony — rozpoznają poprawnie.
Workflow dla polskiej JDG: sfotografuj paragon → wyślij do AI Vision → AI wyciąga: data, kwota, NIP, klasyfikacja kosztu (transport/reprezentacja/materiały) → eksport do księgowości. Zamiast 5 minut ręcznego wpisywania — 30 sekund automatu. Oszczędność: 3-4 godz/mc dla aktywnej JDG.