Как работает OCR? Объясняется просто и понятно
Видео по теме: (May 2024).
В этой статье мы объясним, как работает OCR. OCR расшифровывается как «Оптическое распознавание символов» и просто называется на немецком языке как распознавание текста. Это означает, что компьютер может распознать текст на отсканированном изображении с помощью OCR, а затем преобразовать его в простой текстовый документ.
Вот как работает OCR
Представьте, что вы получили бумажную презентацию от коллеги. Теперь вы хотите редактировать их на ПК, потому что вам не нравятся отдельные отрывки. Так что отсканируйте его и перейдите к программе OCR. Теперь происходит следующее:
- Программное обеспечение сначала выполняет так называемый анализ макета. Для этого она смотрит на макет страницы и отделяет изображения от текста. Она также отмечает их положение на странице. Затем подсчитывается количество абзацев и сохраняются отдельные элементы, такие как номера страниц.
- Теперь самое сложное. Программное обеспечение просматривает отдельные текстовые блоки и разбивает их на предложения. Затем предложения разбиваются на отдельные слова, а слова на буквы.
- Программное обеспечение OCR содержит шаблоны букв и символов. Теперь программа сравнивает отсканированные буквы с этими шаблонами. Если они похожи на 99%, алгоритм решает, что это, вероятно, та буква. Это очень точно, потому что это может сравнить много образцов за короткое время. Таким образом, он успешно проводит различие между «8» и «B».
- Таким образом, буквы и символы постепенно распознаются. Затем они снова объединяются в слова и возвращаются на место в предложении. Как только программное обеспечение завершено, все это сохраняется в обычном документе, который затем можно редактировать. Готово!
Хотите проверить свои знания программного обеспечения? Примите участие в нашей большой викторине по программному обеспечению!