Jak działa OCR? Wyjaśnione w prosty i zrozumiały sposób
W tym artykule wyjaśniamy, jak działa OCR. OCR oznacza „optyczne rozpoznawanie znaków” i jest po prostu określane w języku niemieckim jako rozpoznawanie tekstu. Oznacza to, że komputer może rozpoznać tekst na zeskanowanym obrazie za pomocą OCR, a następnie przekonwertować go na prosty dokument tekstowy.
Tak działa OCR
Wyobraź sobie, że otrzymałeś prezentację papierową od kolegi. Teraz chcesz je edytować na komputerze, ponieważ nie lubisz pojedynczych fragmentów. Więc zeskanuj go i przejdź do programu OCR. Teraz dzieje się tak:
- Oprogramowanie najpierw wykonuje tak zwaną analizę układu. Aby to zrobić, przegląda układ strony i oddziela obrazy od tekstu. Zwraca także uwagę na ich pozycję na stronie. Następnie zliczana jest liczba akapitów i zapisywane są poszczególne elementy, takie jak numery stron.
- Teraz nadchodzi najtrudniejsza część. Oprogramowanie analizuje poszczególne bloki tekstowe i dzieli je na zdania. Zdania są następnie dzielone na pojedyncze słowa, a słowa na litery.
- Oprogramowanie OCR zawiera wzory liter i znaków. Program porównuje teraz zeskanowane litery z tymi wzorami. Jeśli są w 99% podobne, algorytm decyduje, że prawdopodobnie musi to być ta litera. Jest bardzo precyzyjny, ponieważ może porównać wiele wzorów w krótkim czasie. W ten sposób z powodzeniem rozróżnia „8” i „B”.
- Tak więc litery i znaki są stopniowo rozpoznawane. Następnie łączy się je ponownie jako słowa i umieszcza z powrotem na swoim miejscu w zdaniu. Gdy tylko oprogramowanie zostanie ukończone, całość jest zapisywana w normalnym dokumencie, który można następnie edytować. Gotowe!
Czy chcesz sprawdzić swoją wiedzę na temat oprogramowania? Weź udział w naszym dużym quizie oprogramowania!