Przejdź do treści
KOWiR

Definicja

Computer vision

Computer vision to dziedzina AI zajmująca się "widzeniem" — rozpoznawaniem obiektów na zdjęciach i wideo. Twarze w Facebooku, paragony w aplikacji księgowej, tablice rejestracyjne, OCR dokumentów — wszystko to CV.

Pełna definicja

Computer vision (CV) — po polsku "widzenie komputerowe" — to gałąź AI ucząca komputery rozumieć zdjęcia i wideo. Klasyczne zadania: klasyfikacja (co jest na zdjęciu), detekcja (gdzie konkretnie), segmentacja (obrys obiektu), OCR (czytanie tekstu z obrazu), rozpoznawanie twarzy.

Codzienne zastosowania 2026 w Polsce: kamery monitorujące ruch (Inteligentne miasta), rozpoznawanie tablic rejestracyjnych (płatność za autostrady), ChatGPT Vision czyta paragony i klasyfikuje koszt firmowy (dla JDG ogromne ułatwienie), Apple Face ID odblokowuje telefon, Allegro automatycznie znajduje podobne produkty po zdjęciu.

Najpopularniejsze "vision LLM" w 2026: ChatGPT Vision (część Plus), Claude Vision (część Pro), Gemini Vision (Google). Wszystkie umożliwiają wrzucenie zdjęcia + zadanie pytania ("co jest na obrazie", "wyciągnij dane z tej faktury", "czy ten produkt ma uszkodzenie"). Polskie kwoty na fakturach, polski NIP, polskie paragony — rozpoznają poprawnie.

Workflow dla polskiej JDG: sfotografuj paragon → wyślij do AI Vision → AI wyciąga: data, kwota, NIP, klasyfikacja kosztu (transport/reprezentacja/materiały) → eksport do księgowości. Zamiast 5 minut ręcznego wpisywania — 30 sekund automatu. Oszczędność: 3-4 godz/mc dla aktywnej JDG.

Przykład z polskiego życia

Tomek (JDG marketing) ma 50 paragonów miesięcznie z różnych miejsc (paliwo, restauracje, materiały). Workflow: foto z telefonu → Drive → n8n → ChatGPT Vision → CSV → import do Fakturowni. Zamiast 4h ręcznego wpisywania = 30 minut sprawdzania wątpliwych. Oszczędność: 3,5 h/mc = 42 h/rok.

Powiązane pojęcia

Powiązane szkolenia KOWiR

Czy ta definicja Ci pomogła? Zostaw nam znać, czego brakuje: biuro@kowir.pl. Słownik rośnie razem z Wami.