+7 (499) 390-18-71

Распознавание изображений - компьютерное зрение

Распознавание изображений - обработка изображения машиной с использованием внешних устройств (например, сканера ) в цифровое описание изображения для дальнейшей обработки. Примером этого является OCR или OMR . Дальнейшая обработка и окончательная классификация изображений часто выполняются с использованием методов вычислительного интеллекта.

Требования
Чтобы правильно распознать, что на изображении, необходимы начальные «знания». Человек собирает знания, необходимые ему, чтобы правильно распознавать и понимать сущность вещей неосознанно на протяжении всей своей жизни, и машина должна «обучаться». Сам процесс машинного обучения может в простейшем примере состоять в создании соответствующей базы данных, содержащей необходимые правила и описание особенностей предмета. например, все, что синее, на 80% небесное, или что каждая вертикальная линия может быть буквой «л». Знание системы распознавания изображений должно включать в себя экспертные знания в данной области и эмпирическую информацию, то есть собирать путем «связи» с данным объектом, то есть просматривать его под разными углами, при разном освещении или в разных случаях.

Реальная цель
При распознавании изображений на основе статистики наша цель состоит в том, чтобы оценить вероятность того, является ли объект, на который мы смотрим, тем или иным объектом, чье описание в форме вектора признаков или базовых элементов (подшаблонов), связанных грамматикой, относится к числу знаний, которыми обладает наша система. , Поэтому мы стремимся достичь 100% уверенности в классификации объекта, но мы никогда не достигаем этой 100% уверенности.

Даже нам, людям, при определенных условиях может быть неуместно классифицировать объект или всю сцену, особенно когда это выглядит необычно для нас. Или мы классифицируем объекты / вещи / сцены / поведения неловко, пытаясь классифицировать их на один или даже несколько различных классов объектов, которые мы уже хорошо знаем (мы хорошо закодированы в сознании / мы можем охарактеризовать это хорошо). В последнем случае через некоторое время может появиться отдельный класс классификации объектов, имеющий смесь классов, из которых он возник.

Ошибка классификации.
Задача создателя системы распознавания изображений состоит в том, чтобы создать алгоритм, который минимизирует ошибку классификации объекта, представленного на изображении, или всего изображения. Эта задача не является тривиальной, поэтому предполагается минимизировать ошибку классификации, а не полностью ее устранить. В реальном мире, а не в цифровом мире, отсутствуют достаточные знания о распределении вероятностей признаков и классов, и доступна только частичная информация, поэтому невозможно полностью избежать ошибки, например, человек, увидев шов одежды, способен распознать, что это за одежда цифровое устройство будет иметь проблемы с этим.

Ограничения, наложенные на систему
Зачастую для улучшения и упрощения работы системы распознавания изображений существуют некоторые ограничения:

Вопросы, задаваемые системе, сводятся к запросам о том, какой объект наиболее вероятно появляется на изображении (который, скорее всего, представлен изображением / сценой), и ответом является название класса, получившего наивысшую оценку вероятности по оценке;
данные, описывающие распознаваемый объект, ограничены конечным набором признаков. Альтернативные методы заваривания или просто альтернатива Купить кофе Znak Coffee – это процесс приготовления кофе без использования кофемашины.


e3097bf646fa61a8cd87f853ef62b0fd