РАСПОЗНАВАНИЕ КАК НИЗШАЯ ФОРМА МЫШЛЕНИЯ ИСКУССТВЕННОГО ИНТЕЛЕКТА

Кузнецова Т.Н.

Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Тема «искусственного интеллекта» уже долгое время является одной из самых будоражащих для многих научных умов человечества. Стремление человечества к полной автоматизации жизненного процесса привело к созданию специальных машин, способных выполнять хоть какие-то задачи по определенной инструкции и без вмешательства человека. Подобная реализация далека от идеала, поэтому многие ученые стремятся усовершенствовать искусственный интеллект и добиться восприятия необходимой информации без ввода через клавиатуру или подобные устройства, – посредством идентификации речи или компьютерного зрения. Сам интеллект не сможет существовать, если он не будет воспринимать информацию из вне. Человек общается с внешним миром при помощи органов чувства: глаза, нос, уши, язык. Мы используем их с самого рождения, и нам, кажется, что все это очень просто. Однако заставить машину воспринимать информацию как человек очень сложно. Самое большое количество информации человек воспринимает благодаря зрению и слуху, – следовательно, чтобы заставить машину мыслить необходимо заставить ее видеть и слышать. Главная цель моих тезисов - раскрыть тему распознавания образов машиной при помощи параллелей между человеком и компьютером, а также необходимость этой темы для современной науки и информационных технологий в целом.

Машинное зрение – это достаточно молодое и перспективное направление современной науки. Оно нашло свое практическое применение во многих прикладных отраслях информационных технологий, начиная с медицины и био-информатики, заканчивая машиностроением в различных инновационных центрах (Силиконовая долина, Сколково) и военной промышленностью. Компьютерное зрение применяется для полной автоматизации производства. На данный момент компьютерное зрение часто используют в автомобилестроении, к примеру, в качестве систем предупреждающих о препятствиях. Однако на этом список применения не заканчивается, – он непрерывно растет вместе с развитием информационного общества. К примеру, появление Кинекта и других мультимедийных игровых приставок внесло в машинное зрение новые веяния, расширив круг его использования до простых «обывателей» и развлекательных целей.

Суть машинного зрения заключается в создании специального программного обеспечения способного идентифицировать различные объекты, классифицировать их и следить за ними. Инвестирование в подобные разработки с каждым годом растет, и это не удивительно, – ведь это перспективное и прибыльное капиталовложение, способствующее развитию жизненно-важных сфер деятельности человека. А смогут ли «умные» машины полностью его заменить? Проанализируем это в данной статье.

Многие полезные функции, которые выполняет наш мозг, но трудные для вычислительной машины, классифицируются как распознавание образов. С некоторыми функциями мы справляемся настолько легко, что нам не приходит в голову, насколько трудно реализовать их на машине. Когда человек читает неразборчивый почерк или ищет знакомое лицо в толпе, он обычно не думает, что выполняет интеллектуальную задачу достаточной высокой степени сложности. Тем не менее, он делает то, что очень трудно имитировать на компьютере. Распознавание образов, как элемент повседневной жизни, существовало еще у первобытных людей – им приходилось определять хищника и потенциальную жертву. Компьютерное зрения является «ушами» и «глазами» искусственного интеллекта. Как говорил Оливер Селфридж: «Без распознавания образов – интеллект вычислительной машин – нереальное, эфирное свойство».[2]

Задумывались ли вы когда-нибудь, как в проходящем мимо человеке вы узнаете вашего знакомого. При этом не важно, сколько лет прошло, как изменились его волосы или одежда. А если бы он шел перед вами и вы не видели его лицо, то смогли бы вы с такой же точностью и быстротой сказать что это ваш друг? Ведь за это время друг мог измениться внешне и сменить привычную для вас одежду. Несмотря на некоторые искажения, вы все-таки смогли узнать данного человека при помощи подсознательного умозаключения. Посредством него мы объединяем несколько признаков и при выполнении всех из них принимаем решение. Мы можем распознавать объекты и людей благодаря памяти, в которой хранятся полученные новые образы, и глазам, которые обеспечивают нас новой сенсорной информацией. Собственно по такому же алгоритму происходит определение и нахождение необходимых объектов машиной.

В искусственном интеллекте глазами выступает видео-камера и различного рода сенсоры, в качестве памяти используется жесткий диск, а функции мозга выполняет специально обученный классификатор (в его основе лежит математическое дерево), который принимает решение «верно» или «ложно» на основе наборов статистических данных («признаков»). Лишь только при совпадении необходимых свойств в определенной конфигурации он принимает решение «верно», что означает успешную идентификацию необходимого объекта. При этом подобные необходимые свойства берутся из «эталона».

А что же мы все-таки понимаем под эталоном объекта? Всего скорее, что у этого объекта должны быть определенные признаки, характеризующие только его. Рассмотрим, к примеру, стул. В моем представлении сразу рисуется деревянный стул с четырьмя ножками и с мягкой спинкой, стоящий чуть-чуть на бок. У многих это представление может отличаться. Стул может быть чем-то выделан, иметь разный цвет, но все-таки в большинстве случаев он будет иметь также четыре ноги и спинку. Можем ли мы принять наличие четырех ножек и спинки отличительным признаком стула? Всего скорей да, хотя некоторые могут ошибиться и представить вместо стула обыкновенный табурет, тогда у полученного объекта не может быть спинки. Или стул с тремя ножками разве не будет стулом? В любом случае нельзя выбирать наличие определенных признаков к объектам, они должны классифицироваться. То есть необязательно наличие всех признаков, но притом система не должна воспринимать диван за стул. Поэтому под эталоном понимается идеальное представление объекта, затем эталон вместе с его свойствами обобщают до тех пор, пока в окружение не попадет тот объект, который будет хоть немного соответствовать стулу. Процесс обобщения должен быть ограничен.

Кроме того, в теории распознавания образов существует термин канонические перспективы. Он эквивалентен изображению, которое лучше всего представляет объект и образы, которые приходят на ум первыми. Ярким примером является опыт, проведенный Палмером, Рошем и Чейзом. Они делали серии фотографий обычных объектов в разных ракурсах и показывали их испытуемым, те должны были как можно быстрее назвать предмет, изображенный на фотографии [1]. Канонического вида фотографии определялись быстрее всех, а вот фотографии с видом сверху или снизу идентифицировались уже хуже. Это объясняется тем, что мы обычно видим предметы в привычном ракурсе, но стоит его повернуть, то сразу возникают некоторые проблемы в его идентификации. Обстоятельства с искусственным интеллектом обстоят еще хуже. Он может быстро определить объекты лишь в натренированных ракурсах, но при кардинальном изменении его возможность идентификации будет стремиться к нулю. В тоже время решение подобной задачи не составляет особого труда для человека.

Человеческие способности распознавания образов зависят от обучения и от опыта, полученного в течении жизни. Ребенок учится распознавать лица и предметы, затем слова и только потом уже буквы. Каждая идентификация с каждым разом сопровождается все более точной и правильной классификацией. Процесс распознавания образов непрерывно связан с обучением. Способность обучения используется также и для искусственного интеллекта, она способствует автоматическому улучшению статистического алгоритма во время работы. Машинное обучение в распознавании образов решает задачу классификации. Для повышения точности аналитических моделей используют технологию бустинга. Данная технология способствует улучшению слабых моделей при помощи последовательного построения композиций алгоритмов машинного обучения, когда каждый следующий алгоритм стремится компенсировать недостатки композиции всех предыдущих алгоритмов. В основе идеи лежит построение цепочки классификаторов, каждый из которых обучается на ошибках предыдущего.

Хотелось бы поподробнее остановиться на ошибках. Все же мы люди и совершаем их, а вот как относиться к ошибкам компьютера? Некоторым покажется, что это непозволительная роскошь. Как потом объяснить машине, что она не права? Перепрограммировать если только или же заставить учиться её на своих ошибках. Тогда мы получим идеальный разум, который не будет никогда совершать их, принимая лишь четкие математически верные решения. Ему не будет свойственна жалость, сострадание и другие обычные человеческие чувства. Сейчас нам кажется это фантастикой, ведь машины выполняют только команды человека и совсем лишены самостоятельности. Но кто знает, что будет происходить через 100 лет на земле. Размышление над этим вопросом инициирует выход на проблемы этического порядка.

Допустим, прошло более десятка лет, и интеллектуальные системы ощутимо прибавили в своих способностях благодаря почти совершенным сенсорам и новым, более точным математическим алгоритмам. В больницах появились автоматизированные терапевты, хирурги, медицинские сестры. Они беспрекословно выполняют клятву Гиппократа и способны принимать верные решения в 99.9% случаев при работе с пациентами. Ну а как же человеческий фактор? Уже в наше время очевидно доказано, что лечение - это не только строгое следование рекомендациям врача, а еще и поддержание морального и духовного состояния, эффект плацебо. Больному всегда будут необходимы простое человеческое общение, поддержка и забота, как элемент терапии. Сможет ли машина справиться с этими задачами? Мы не можем предугадать настроения и ценности информационного общества в далеком будущем, но беря в учет традиционность и незыблемость большинства из них, дошедших до наших дней испокон веков, – вполне очевиден конфликт этики, религии и науки в смежных с компьютерным зрением областях и открытиях.

Необходимо отметить еще то, что машинное зрение является достаточно неоднозначной наукой на данный момент. С одной стороны, в этой области получены впечатляющие результаты и решены многие поставленные задачи, но с другой стороны компьютерному зрению все еще далеко до человеческого. Многие высоты достигнуты, многое еще впереди. Поэтому существует два взгляда на развитие машинного зрения. Одни говорят, что машины достигнут небывалых высот и разовьют огромную мощь, опередят человека. Другие утверждают, что машины никогда не превзойдут человека и машинное зрение так и останется непригодным для решения некоторых проблем, где необходимо вмешательство человека.

Искусственный интеллект на данный момент находится на пороге открытия чего-то нового. В мире IT-технологий оно развивается бешеными темпами, возможно, что в скором времени появятся компьютеры, способные принимать верные решения независимо от человека. И тогда возможно возникнет вопрос: если есть машина, принимающая «безошибочное решение», нужен ли вообще человек? И не будет ли лет через 50 восстание машин? Ведь как говорил Платон: «Низшая форма мышления – это простое опознание. Высшая – это глубокая интуиция человека, видящую всякую вещь как часть некоторой системы» [1]. Мы смогли научить машину воспринимать информацию, классифицировать её. Но такая способность, как интуиция, никогда не сможет появиться у груды металла, работающей только при помощи математических алгоритмов.

Литература

Солсо, Р. «Когнитивная психология», 6-е издание, – СПб.: Питер, 2006 –589 с.
Эндрю, А. «Искуственный интелект», - М.:Мир, 1985.
Тюхтин, В.С. «Теория автоматического опознания и гносеологии», - М. 1976.

Просмотров работы: 1081

Код для цитирования:

VI Международная студенческая научная конференция Студенческий научный форум - 2014

РАСПОЗНАВАНИЕ КАК НИЗШАЯ ФОРМА МЫШЛЕНИЯ ИСКУССТВЕННОГО ИНТЕЛЕКТА

Студенческий научный форум - 2014
VI Международная студенческая научная конференция