Интеллект как средство достижения целей

В Авторы принимаем ВСЕХ, в каждой статье до 4 авторов

Модераторы: DCV, Dimmy, victorst

Re: Интеллект как средство достижения целей

Сообщение DCV » Пн апр 15, 2013 8:37:22

Yandersen писал(а):Простите, просто привычка такая дурная привита - думать, прежде чем делать... :)


Вы собираете информацию, которая находится на поверхности. Когда начнете вникать глубже и делать, то столкнетесь с трудностями.
(С) Александр Белов
Диалоговая система Думбот 2 v1.2: http://www.iknowww.ru/Products/Dumbot
Думбот 3 www.dumbot.ru

Золотой Будда не переправится через плавильный котел. Деревянный Будда не переправится через огонь. Глиняный Будда не переправится через реку.
Аватара пользователя
DCV
Эксперт ИИ
 
Сообщения: 615
Зарегистрирован: Ср апр 21, 2010 11:43:51
Откуда: Беларусь, Гомель

Re: Интеллект как средство достижения целей

Сообщение DCV » Пн апр 15, 2013 21:24:16

Yandersen писал(а):Кстати, DCV, я тоже с Беларуси, только с Минска. :)

Вы из Минска переехали в Канаду?
(С) Александр Белов
Диалоговая система Думбот 2 v1.2: http://www.iknowww.ru/Products/Dumbot
Думбот 3 www.dumbot.ru

Золотой Будда не переправится через плавильный котел. Деревянный Будда не переправится через огонь. Глиняный Будда не переправится через реку.
Аватара пользователя
DCV
Эксперт ИИ
 
Сообщения: 615
Зарегистрирован: Ср апр 21, 2010 11:43:51
Откуда: Беларусь, Гомель

Re: Интеллект как средство достижения целей

Сообщение Yandersen » Пн апр 15, 2013 21:36:38

Да. Но надумываю вернуться через несколько лет - не выносим вонючий капитализм, тотальный дебилизм и ограниченность интересов человекоподобных макак вокруг. :cry:
Больше знаешь - меньше размышляешь.
Аватара пользователя
Yandersen
Заинтересованный
 
Сообщения: 27
Зарегистрирован: Ср апр 06, 2011 14:47:00
Откуда: Canada

Re: Интеллект как средство достижения целей

Сообщение DCV » Вт апр 16, 2013 9:28:36

Это потому что Вы умнее окружающих людей. На что Вы хотите потратить свои способности?
(С) Александр Белов
Диалоговая система Думбот 2 v1.2: http://www.iknowww.ru/Products/Dumbot
Думбот 3 www.dumbot.ru

Золотой Будда не переправится через плавильный котел. Деревянный Будда не переправится через огонь. Глиняный Будда не переправится через реку.
Аватара пользователя
DCV
Эксперт ИИ
 
Сообщения: 615
Зарегистрирован: Ср апр 21, 2010 11:43:51
Откуда: Беларусь, Гомель

Re: Интеллект как средство достижения целей

Сообщение Yandersen » Вт апр 16, 2013 13:57:50

Ну, мечта лишь одна - создать ИИ, но попутных интересов много. Всегда мешает лень и отсутствие силы воли - из задач, требующих усилия мозга, делаю лишь то, что интересно.
Появилась парочка идей касательно графического аналаиза подобно описанному на предыдущей странице. Надеюсь, на этот раз руки дойдут до кодирования.
Планирую реализовать так. Для каждого пиксела картинки вычислю доминантную ориентацию контура, проходящего через пиксель - всего различается 3 ориентации (горизонтальная, вертикальная или диагональная чёрточка). Затем по порядку берётся каждый пиксель (от центра к периферии, один пиксель за такт) и связанная с ним информация подаётся на сенсорные входы мозга, составленного из моих элементов ("эталонов"). Каждый сенсор активируется своим условием: один активируется, если чёрточка центрального и подаваемого пикселя параллельны, другой сенсор реагирует на перпендикулярность, третий и четвёртый - на взаимодиагональности обоих видов; пятый и остальные чувствительны к углу между вектором направления на подаваемый пиксель и чёрточкой центрального пиксела.
Что это даёт? Восприятие картинки на основе её геометрии: центральная точка считается опорной и должна принадлежать участку контура, составляющего фигуру. Ориентации и положения всех остальных участков контура в таком случае рассматриваются относительно положения и ориентации данного опорного участка. От масштаба картинки будут зависеть временные интервалы между паттернами сенсорных активностей, причём каждый паттерн сенсорного состояния относится к паре точек, принадлежащих картинке. При любой другой ориентации образа паттерны будут теми же (обязательное условие - центрование на опорной точке), и временные интервалы между ними изменятся прененбрежимо слабо; при наличии дополнительных данных помимо паттернов, относящихся к данному образу появятся дополнительные паттерны в свободных временных диапазонах. При неполноте образа некоторые паттерны будут отсутствовать. При изменении масштаба все временные интервалы пропорционально изменятся.
Посмотрим, что из этого выйдет, если выйдет. :)
Больше знаешь - меньше размышляешь.
Аватара пользователя
Yandersen
Заинтересованный
 
Сообщения: 27
Зарегистрирован: Ср апр 06, 2011 14:47:00
Откуда: Canada

Re: Интеллект как средство достижения целей

Сообщение DCV » Ср апр 17, 2013 9:39:51

Yandersen писал(а):Ну, мечта лишь одна - создать ИИ, но попутных интересов много. Всегда мешает лень и отсутствие силы воли - из задач, требующих усилия мозга, делаю лишь то, что интересно.

Вас интересует обработка текстов на Естественном Языке? Создание диалоговых систем? Я могу предложить интересные задачи. Например, разработка диалоговой системы, которая демонстрирует понимание простых текстов определенного типа. Могу поделиться опытом тренировки силы воли.


Yandersen писал(а): Каждый сенсор активируется своим условием: один активируется, если чёрточка центрального и подаваемого пикселя параллельны, другой сенсор реагирует на перпендикулярность, третий и четвёртый - на взаимодиагональности обоих видов; пятый и остальные чувствительны к углу между вектором направления на подаваемый пиксель и чёрточкой центрального пиксела.

Так рассказывал Алексей Редозубов про мозг. Будет ли это лучше, чем то, что уже сделано в данной области? Сколько времени займет работа? Какой должен получиться полезный результат?
(С) Александр Белов
Диалоговая система Думбот 2 v1.2: http://www.iknowww.ru/Products/Dumbot
Думбот 3 www.dumbot.ru

Золотой Будда не переправится через плавильный котел. Деревянный Будда не переправится через огонь. Глиняный Будда не переправится через реку.
Аватара пользователя
DCV
Эксперт ИИ
 
Сообщения: 615
Зарегистрирован: Ср апр 21, 2010 11:43:51
Откуда: Беларусь, Гомель

Re: Интеллект как средство достижения целей

Сообщение Yandersen » Ср апр 17, 2013 13:43:37

"Вас интересует обработка текстов на Естественном Языке? Создание диалоговых систем?"

Я очень не хочу Вас обидеть, но если честно, то не очень. Возможно, лишь пока. Мне почему-то всегда казалось, что графический анализ имеет наибольший приоритет для ИИ. Возможно из-за того, что это наиболее сложная задача.

"Сколько времени займет работа?"

Вчера закончил интерфейс - загрузка картинки, указание области для анализа, выделение чёрточек, сортировка пикселов анализируемого круга по удалённости от центрального пиксела. Сегодня планирую выделять взаимоориентации и заполнять матрицу сенсоров данными. К концу недели надеюсь, наконец, взяться за описание элементов и привинтить сам мозг.

Под конечным результатом ожидается узреть программу, которая как минимум единожды узрев образ и сопоставив его с уникальным соответствующим ему сигналом научится опознавать его в иных стилях написания и среди шума на картинках. Образ не единственный - сколь угодно много из представленных.
Пока что единственным недочётом кажется то, что придётся указывать одну и ту же точку на образе для достоверного опознавания. Но это лишь теория, взглянем, какие проблемы проявятся на практике.

"Могу поделиться опытом тренировки силы воли."

Есть решение?! Поделитесь, пожалуйста. Ибо раньше было лучше, но после гриппа всё никак не могу отойти от снобизмного состояния. :oops:
Больше знаешь - меньше размышляешь.
Аватара пользователя
Yandersen
Заинтересованный
 
Сообщения: 27
Зарегистрирован: Ср апр 06, 2011 14:47:00
Откуда: Canada

Re: Интеллект как средство достижения целей

Сообщение DCV » Чт апр 18, 2013 8:28:22

Yandersen писал(а): Мне почему-то всегда казалось, что графический анализ имеет наибольший приоритет для ИИ. Возможно из-за того, что это наиболее сложная задача.

У Хачукаева есть какие-то идеи по анализу изображений. Он ищет программистов, которые будут их реализовывать. Могу спросить, откроет ли он для Вас свои текстовые документы по графике.

Yandersen писал(а):Есть решение?! Поделитесь, пожалуйста. Ибо раньше было лучше, но после гриппа всё никак не могу отойти от снобизмного состояния. :oops:

Отправить на E-mail, который Вы указали после статьи?
(С) Александр Белов
Диалоговая система Думбот 2 v1.2: http://www.iknowww.ru/Products/Dumbot
Думбот 3 www.dumbot.ru

Золотой Будда не переправится через плавильный котел. Деревянный Будда не переправится через огонь. Глиняный Будда не переправится через реку.
Аватара пользователя
DCV
Эксперт ИИ
 
Сообщения: 615
Зарегистрирован: Ср апр 21, 2010 11:43:51
Откуда: Беларусь, Гомель

Re: Интеллект как средство достижения целей

Сообщение Yandersen » Чт апр 18, 2013 23:52:22

"У Хачукаева есть какие-то идеи по анализу изображений."

У меня их явно будет больше, готов поспорить на пять баксов. Думаю даже топик новый открыть. А вот кодить себя заставить - тяжко (видимо, у Хачукаева та же проблема). :) Пока что прога ориентации выделяет, взаимоориентации считает, направления на пикселы и проч. Сам мозг и элементы ещё не начинал, да и то что уже есть переписать охота.

"Отправить на E-mail, который Вы указали после статьи?"

Да, пожалуйста.
Больше знаешь - меньше размышляешь.
Аватара пользователя
Yandersen
Заинтересованный
 
Сообщения: 27
Зарегистрирован: Ср апр 06, 2011 14:47:00
Откуда: Canada

Re: Интеллект как средство достижения целей

Сообщение victorst » Пт апр 19, 2013 5:37:48

Если вас заинтересует, можете почитать то, что я довольно давно начал делать: http://roboforum.ru/forum103/ там есть ветка форума: http://roboforum.ru/forum103/topic7141.html
Этим я сейчас вновь активно занимаюсь на новой программной основе в рамках конкурса летающих роботов: http://robots.croc.ru Но, думаю, что я не успею сделать все как положено к установленному конкурсом сроку. Однако делать свою онтологическую систему все равно продолжу.
Возможно, то, что я делаю, как-то перекликается с вашими идеями. Я использую каждый пиксел изображения для исследования его окрестностей. Но вместо полного перебора использую свою ассоциативную мегатронную сеть. Ведь нужно сравнить изображение со всеми ранее запомненными образами-шаблонами и выдвинуть одновременно множество гипотез, из которых выбрать одну - две наиболее подхожящих.
Аватара пользователя
victorst
Полноправный участник
 
Сообщения: 1073
Зарегистрирован: Вс янв 09, 2005 22:36:18
Откуда: Россия, г.Омск

Re: Интеллект как средство достижения целей

Сообщение DCV » Пт апр 19, 2013 8:34:30

Yandersen писал(а):У меня их явно будет больше, готов поспорить на пять баксов. Думаю даже топик новый открыть.

Обычно проекты сталкиваются с какими-то трудностями и тормозятся. Когда столкнетесь с трудностями, то скажите.

Yandersen писал(а):А вот кодить себя заставить - тяжко (видимо, у Хачукаева та же проблема). :)

У Хачукаева проблема с отсутствием финансирования. Ему не удается убедить инвесторов вкладывать деньги в его проекты. Он хочет создать хотя бы прототип программы, чтобы показывать инвесторам. Он сам не программист.


Yandersen писал(а):"Отправить на E-mail, который Вы указали после статьи?"

Да, пожалуйста.

Отправил.
(С) Александр Белов
Диалоговая система Думбот 2 v1.2: http://www.iknowww.ru/Products/Dumbot
Думбот 3 www.dumbot.ru

Золотой Будда не переправится через плавильный котел. Деревянный Будда не переправится через огонь. Глиняный Будда не переправится через реку.
Аватара пользователя
DCV
Эксперт ИИ
 
Сообщения: 615
Зарегистрирован: Ср апр 21, 2010 11:43:51
Откуда: Беларусь, Гомель

Re: Интеллект как средство достижения целей

Сообщение DCV » Пт апр 19, 2013 8:58:05

Yandersen писал(а):видимо, у Хачукаева та же проблема

Для меня важнее не кодирование, а постановка задачи. Когда будет полное описание алгоритма, я могу и сам закодировать.
(С) Александр Белов
Диалоговая система Думбот 2 v1.2: http://www.iknowww.ru/Products/Dumbot
Думбот 3 www.dumbot.ru

Золотой Будда не переправится через плавильный котел. Деревянный Будда не переправится через огонь. Глиняный Будда не переправится через реку.
Аватара пользователя
DCV
Эксперт ИИ
 
Сообщения: 615
Зарегистрирован: Ср апр 21, 2010 11:43:51
Откуда: Беларусь, Гомель

Re: Интеллект как средство достижения целей

Сообщение Yandersen » Сб апр 20, 2013 11:58:15

"Если вас заинтересует, можете почитать то, что я довольно давно начал делать: http://roboforum.ru/forum103/ там есть ветка форума: http://roboforum.ru/forum103/topic7141.html"

Дали бы просто линк сразу на видео - информация в постах бессмысленна. Результат ошарашил - успех безоговорочный!

"Однако делать свою онтологическую систему все равно продолжу."

Всё никак не могу разобраться со смыслом Вашего любимого слова "онтология", но идею продолжения банкета поддерживаю. Есть ли продвижения со времён записи видео? Как я заметил, Вы тыкаете кнопку обучения вручную. Интуитивно напрашивается автоматическое определение объекта как совокупности пикселов, двигающихся на неподвижном фоне (реакция на движение).

"Возможно, то, что я делаю, как-то перекликается с вашими идеями."

Более чем уверен, если Вы не паттерны накладываете (в чём сомневаюсь, видя отличный результат). Свою теорию уже расписываю (и разрисовываю). Надеюсь закончить на следующей неделе, если апокалипсис не случится. Кое-кто не ленивый как я, проявил интерес к реализации, надеюсь не врёт. :)

"Обычно проекты сталкиваются с какими-то трудностями и тормозятся. Когда столкнетесь с трудностями, то скажите."

На то форумы и существуют. Но теорию описывать не трудно, и, похоже, моя роль на большее не пожелает распространиться.

"Когда будет полное описание алгоритма, я могу и сам закодировать."

Описываю всё настолько просто и детально, что ребёнок поймёт. Иллюстраций достаточно. Было б желание реализовать, если того будет стоить. Поживём-увидим.
Больше знаешь - меньше размышляешь.
Аватара пользователя
Yandersen
Заинтересованный
 
Сообщения: 27
Зарегистрирован: Ср апр 06, 2011 14:47:00
Откуда: Canada

Re: Интеллект как средство достижения целей

Сообщение DCV » Сб апр 20, 2013 14:08:19

Yandersen писал(а):Описываю всё настолько просто и детально, что ребёнок поймёт. Иллюстраций достаточно. Было б желание реализовать, если того будет стоить. Поживём-увидим.


Главное, чтобы теория пережила первую волну критики. Если первую волну переживет, то жить будет.
(С) Александр Белов
Диалоговая система Думбот 2 v1.2: http://www.iknowww.ru/Products/Dumbot
Думбот 3 www.dumbot.ru

Золотой Будда не переправится через плавильный котел. Деревянный Будда не переправится через огонь. Глиняный Будда не переправится через реку.
Аватара пользователя
DCV
Эксперт ИИ
 
Сообщения: 615
Зарегистрирован: Ср апр 21, 2010 11:43:51
Откуда: Беларусь, Гомель

Re: Интеллект как средство достижения целей

Сообщение Yandersen » Вт апр 23, 2013 1:09:53

Сразу предупреждаю, что света в конце туннеля не будет - получилась некоторая архисложная задача, грозящая мутными векторными вычислениями, так что труд не окончен. Если кого заинтересут направление моих мыслей, можем доработать до логического финала, если это возможно.

----------

Анализ графических данных

Введение

Задачей графического анализа (ГА) является выделение полезной информации из набора графических данных. Материалом для анализа может быть отдельное двумерное изображение (картинка), трёхмерное изображение (карта высот/глубин), их последовательность (видео), или геометрия виртуальной трехмерной сцены (3D объекты). В рамках данной статьи ограничимся анализом двумерных трёхцветных изображений.
Графический анализатор человека, в отличие от компьютерных программ, показывает чёткие результаты опознавания представленных на картинке образов вне зависимости от их вариаций, искажений или неполноты/избыточности представления. На следующем рисунке представлены примеры разнообразных искажений символа «А»:
Styles.png

Цифрой 1 обозначен эталонный образ. Для человека не представляет трудности опознать его при поворотах (2), слабом искажении формы (3), стиля написания (4), псевдо-3Д искажениях (5 – вращение вокруг вертикали, 6 – наклон по горизонтали, 7 – комбинированнный наклон), частичном перекрытии (8, 9), в окружении других не связанных с образом данных (10), размытии (11), разности цвета и освещения и пр. искажениях и вариациях эталонного образа и побочных условиях.
Требованием к искусственному графическому анализатору будет максимальное приближение его способностей к человеческому. Для этого необходимо выяснить, на какие именно свойства картинки опирается графический анализатор человека, что позволяет ему опознавать образы с такой высокой надёжностью?
Начальные этапы графического анализа приматов изучены достаточно точно, чтобы выявить особое значение выделения контуров и линий, их образующих на начальных этапах анализа изображения. Вполне логично предположить, что анализ форм основан на определении закономерностей во взаиморасположении линий, принадлежащих контурам объекта, т.к. при искажениях формы данные зависимости изменяются не сильно (причём при псевдо-3D искажениях изменения параметров взаиморасположения всех линий подвержены определённой закономерности). Очевидно, что анализ геометрии будет намного эффективней сравнения паттернов. Помимо линий из картинки выделяется информация о цветах, контрастах и пр. графическая информация, которая может представлять ценность для графического анализа.

Выделение информации из трёхцветного двумерного изображения

Первой задачей является выделение информации, содержащейся непосредственно в отдельных пикселях. Каждый пиксель хранит интенсивность трёх цветовых компонент: r,g,b (в диапазоне от 0 до 255).
Единственной информацией, которую можно выделить из отдельно рассматриваемого пикселя является его цветовая характеристика.
Цвет можно условно определить как отношения интенсивностей цветовых компонент, т.е. нужно вычислить отношения r/g, r/b, g/r, g/b, b/r, b/g. В отличие от абсолютных значений их интенсивностей, эти отношения не изменятся при изменении яркости освещения (но не цвЕта светильника). Однако нужно обратить внимание на значения интенсивностей 0 и 255: первое означает отсутствие цветовой составляющей, вторая – на засветку (т.е. значение, выходящее за пределы рабочего диапазона сенсоров). В обоих случаях опирающиеся на эту компоненту значения могут быть неверными. Эти ситуации необходимо также сигнализировать. С одной стороны, засветка является признаком блика, что информативно, однако с другой стороны она скрывает информацию о реальном цвете точки. Нулевая же интенсивность говорит об отсутствии освещения, необходимого для извлечения данных, принадлежащих этой точке.
Если хотя бы одна из компонент равна 0 или 255, это говорит о возможной недостоверности замеренного значения, что также является значимой информацией и влияет на дальнейшие операции.
К примеру, при интенсивности освещения И1 красная компонента некоторой точки объекта была равна 50, зелёная – 200. Т.е. отношение g/r=4. Половинная интенсивность освещения приведёт к замеру 25 и 100, но отношение g/r останется прежним, т.е. 4. Однако удвоенная интенсивность освещения приведёт к выходу зелёной компоненты из диапазона допустимых значений, дав замер 100 для зелёной и 255 для красной компоненты. При этом отношение g/r окажется 2.55, что неверно. С другой стороны, ослабление освещения в 100 раз приведёт к замеру красный – 0, зелёный – 2, и в этом случае определение отношения просто невозможно, т.к. дискретность замера интенсивности не позволяет отобразить реальное значение красной компоненты (0.5).
Дальнейшее извлечение информации основывается на анализе данных группы соседних пикселей. Для шестиугольной «бензольной» матрицы это будет пиксель, окружённый шестью соседними; для стандартной прямоугольной матрицы это будет кластер из 9 пикселей (этот вариант и будем рассматривать).
Рассмотрение группы смежных пикселей позволяет извлечь такую информацию, как градиенты, т.е. изменения параметров пикселей и направление этого изменения. Таким образом можно выделить ориентацию линии контура, проходящего через данный пиксель на основании интенсивностей 8 соседних пикселей с учётом их взаиморасположения. Вот иллюстрация:
DSCF0144.jpg

Выделяемый таким образом градиент представляет собой двумерный вектор, показывающий направление увеличения интенсивности. Этот вектор является нормальным вектором к линии возможного контура, проходящей через центральный пиксель. Таким способом можно выделять из картинки элементарные фрагменты информации для анализа геометрии взаиморасположения контуров – «чёрточки», т.е. отрезки, совокупность которых представляет собой контур, т.е. некую границу, лежащую перпендикулярно направлению изменения некоторого параметра. Стоит напомнить, что если хотя бы один из пикселей кластера имел недостоверное значение интенсивности требуемой цветовой компоненты, то и полученный вектор наследует это клеймо.
Обратите внимание на необходимость независимой параллельной обработки каждой из трёх интенсивностей, т.е. вычисление трёх градиентных векторов для каждого пикселя. Если ограничится лишь средним значением интенсивности, то образы, нанесённые красным цветом (254,0,0) на синий фон (0,0,254) будут давать равномерный серый фон для усреднённой интенсивности, не позволяющий выделить границы контуров. Однако градиентный вектор для усреднённой интенсивности также представляет не меньший интерес: в то время как градиент каждого отдельного цвета часто связан с определением формы цветовых отметин на поверхностях, градиент средней интенсивности позволяет судить об объёмной форме объекта (затенения).
Взглянем на следующую иллюстрацию:
DSCF0143.jpg

Очевидно, что ненулевые градиенты имеются у всех пикселов картинки, в то время как настоящим контурам соответствует лишь малая доля пикселов. Та же ситуация будет наблюдаться и в размытых картинках. Как же отделить пикселы реальных контуров от тех, градиент которых связан с затенением?
Рассмотрим интересующий нас участок в пиксельном виде:
DSCF0145.jpg

Стрелочками на рисунке обозначены градиенты интенсивностей каждого пиксела. Становится ясно, что наибольшая длина вектора градиента соответствует наиболее контрастно выраженной границе. Таким образом выяснить, является ли данный пиксель границей контура или нет, можно на основании сравнения длины вектора градиента с длинами градиентных векторов смежных пикселей. Если хотя бы один из близлежащих пикселов имеет больший по модулю градиент, значит контур проходит НЕ через данный центральный пиксель. Если же обнаруживается, что длина градиентного вектора данного пикселя больше, чем у любого из его соседей, значит именно данный пиксель относится к контуру. На картинке выше пиксель Е соседствует с пикселями, длина векторов градиента для которых выше, чем его собственного, поэтому пиксель Е не принадлежит контуру. Нужно учесть, что сравнению подлежат длины градиентных векторов только соответствующих цветовых компонент.
Сравнение длин векторов эквивалентно сравнению квадратов их длин, что есть сумма квадратов х и у компонент (т.е. [х1*х1+у1*у1]<=>[x2*x2+y2*y2]). Если длины обоих векторов равны, оба считаются точками контура. Любой из градиентных векторов, опирающийся на недостоверные значения интенсивностей не может быть отмечен контурным, даже если его длина доминантна среди длин векторов окружающих его пикселов.
У вас нет необходимых прав для просмотра вложений в этом сообщении.
Последний раз редактировалось Yandersen Вт апр 23, 2013 1:21:05, всего редактировалось 3 раз(а).
Больше знаешь - меньше размышляешь.
Аватара пользователя
Yandersen
Заинтересованный
 
Сообщения: 27
Зарегистрирован: Ср апр 06, 2011 14:47:00
Откуда: Canada

Re: Интеллект как средство достижения целей

Сообщение Yandersen » Вт апр 23, 2013 1:12:16

Таким образом выделенные из картинки локально-доминантные векторы градиентов представляют собой нормали к линиям контуров, представленных на изображении. Характер изменения линии контура (характеристика криволинейности) в таких точках может быть выделена на основе анализа направлений градиентных векторов кластера пикселей. Возможны три ситуации:
Corner In.png
Line.png
Corner Out.png

На первой и третьей картинке показаны участки криволинейного контура, на второй – прямого. Очевидно, что чем сильнее выражено искривление контура, тем больше будет угол между градиентными векторами. Для численного определения кривизны контура нужно векторно перемножить градиентный вектор центрального пиксела с градиентными векторами смежных с ним пикселов и сложить полученные значения:
v = [a x e] + [b x e] + [c x e] + [d x e] + [e x f] + [e x g] + [e x h] + [e x i]
Где a,b,c,d,e,f,g,h,i – это обозначения градиентных векторов пикселов A,B,C,D,E,F,G,H,I соответственно, а знак «х» обозначает векторное умножение (напомню, что положительное направление оси у выбрано направлением сверху вниз, а оси х – слева направо). Для первой картинки полученное значение v будет положительным, для второй – нулевым, для третьей – отрицательным. Таким образом положительное значение говорит о выпуклости контура светлого объекта на тёмном фоне, отрицательное – о вогнутости контура светлого объекта на тёмном фоне, а близкое к нулю значение говорит о прохождении прямолинейной границы через данный пиксель.
Несмотря на громоздкость формулы выше, она легко сворачивается и упрощается для вычисления, преобразуясь в следующий вид:
v = e.x * (f.y+g.y+h.y+i.y-a.y-b.y-c.y-d.y) - e.y * (f.x+g.x+h.x+i.x-a.x-b.x-c.x-d.x);
Модуль же данной величины проблематично (и нецелесообразно) привязывать к количественной характеристике искривления контура (т.е. выделять значение угла изгиба), однако сравнение параметров v смежных пикселов позволяет сделать несколько логических выводов о характеристике точки Е: если хотя бы один из смежных пикселей имеет большее значение v по модулю, то данная точка является лишь выпуклостью (вогнутостью) поверхности при условии, что Е не была прежде определена границей контура, а иначе эта точка принадлежит грани; если же v данной точки E наибольшая по модулю среди всех смежных, и при этом данная точка уже определена как принадлежащая контуру, то данная точка является вершиной объекта, т.е. участком контура с максимальным локальным искривлением.
Таким образом из совокупности пикселов картинки выделяются цветовые характеристики, контуры, состоящие из вершин и граней, а также такие характеристики поверхностей как выпуклости и вогнутости. Все эти характеристики относятся к точкам, связанным с конкретными пикселами картинки и представляют собой аттрибуты пикселов. Для анализа геометрии представленных на картинке образов потребуется провести анализ взаиморасположения отдельных пикселов, характеризующихся уникальными аттрибутами, извлечёнными ранее.
У вас нет необходимых прав для просмотра вложений в этом сообщении.
Больше знаешь - меньше размышляешь.
Аватара пользователя
Yandersen
Заинтересованный
 
Сообщения: 27
Зарегистрирован: Ср апр 06, 2011 14:47:00
Откуда: Canada

Re: Интеллект как средство достижения целей

Сообщение Yandersen » Вт апр 23, 2013 1:14:49

Анализ геометрии

Сделаем небольшое отступление и задумаемся над тем, что из себя представляет изучаемое двумерное изображение. По сути ведь это перспективная проекция трёхмерных объектов реального мира на плоскость. Геометрическое расположение точек объекта относительно друг друга в пространстве в большинстве случаев неизменно, т.е. их взаиморасположение определяет тип объекта. Однако при проекции этих точек на плоскость теряется информация о третьей координате, из-за чего разные в пиксельном представлении изображения могут соответствовать одному и тому же объекту:
DSCF0147.jpg

На картинке выше эталонный образ слева эквивалентен образу справа при условии поворота вокруг вертикальной оси. Взаиморасположение точек А,В,С в проекции разное, хотя их пространственное взаиморасположение осталось прежним. Таким образом опознание образа означает одновременное распознавание типа объекта, его положения (дальше-ближе, от чего будет зависеть масштаб) и ориентации.
Выделенные описанным ранее алгоритмом аттрибуты пикселей позволяют определять некоторые особые точки объекта (будем называть их маркерами). Для геометрического анализа особую ценность будут представлять контурные точки (т.е. те, градиент которых по направлению эквивалентен спроецированной на плоскость картинки нормали к поверхности трёхмерного объекта).
Сразу стоит отметить, что на одном изображении может быть представлено любое количество объектов, как угодно расположенных относительно друг друга, возможно с перекрытием, в любой ориентации:
ABV.png

Графический анализатор должен быть способен опознавать все известные ему объекты, представленные на картинке. Однако очевидно, что одновременное детектирование нескольких объектов не только сложная задача, но и непрактичная, т.к. помимо опознания наличия объекта на картинке требуется находить его расположение и ориентацию. Опознание нескольких объектов одновременно делает неопределённым значение выдаваемой координаты и ориентации (какому из объектов они будут соответствовать?). Поэтому условимся, что выборка конкретного объекта опознания будет зависеть от выбора опорной точки, которая для успешного опознания должна принадлежать одному из известных объектов (эту точку назовём центром взгляда или прицелом). Выбираемый пиксель должен быть вершиной или гранью контура, т.е. иметь ярко выраженную информативность.
Эта точка задаёт систему координат объекта: её нормаль будет считаться осью Оу, перпендикулярное направление – осью Ох (Ox={Oy.y, -Oy.x}). Таким образом координата и нормаль любой другой точки контура может быть выражена в объектной системе координат. Нормаль некоторой точки, имевшая ранее координаты {Nx,Ny} тепереь будет выглядеть так:
nx = Oy.x*Ny – Oy.y*Nx;
ny = Oy.x*Nx + Oy.y*Ny;
Координаты пиксела {Px,Py} также должны быть преобразованы:
px = Oy.x*(Py–Cy) – Oy.y*(Px–Cx);
py = Oy.x*(Px–Cx) + Oy.y*(Py–Cy);
В формулах выше, Сх и Су – координаты центрального пиксела.
Таким образом нормали и положения точек контуров выражаются относительно нормали и положения центрального пиксела, выбранного в качестве опорного пиксела, задающего систему координат объекта. Переход в объектную систему координат для опознания образа необходим по той причине, что положения точек объекта в его собственной системе координат неизменны. Однако нужно помнить, что полученная система координат двумерна, в то время как источником данных был трёхмерный объект. Это значит, что рассматриваемые точки могут иметь любое значение координаты z, т.е. расстояние между двумя пикселями, соответствующими некоторым точкам объекта не может быть корректно отображено как корень из суммы квадратов двух известных координат, поэтому если в объекте оно равно r, то на проекции оно может оказаться любым: если объект повернуть, то расстояние уменьшится, если объект приблизить – увеличится и т.д.
Находящиеся в базе данных объекты представлены в эталонных ориентации и положении, поэтому любое их искажённое представление на картинке рассматривается как отклонение от эталонного. Для упрощения нашей задачи условимся, что эталонное представление образа имеет максимальный размер, и представление его на картинке может быть только меньше по размеру (иначе опознавание не гарантировано). В таком случае меньшее расстояние от центра координат некоторой контрольной точки свидетельствует об увеличении по модулю неизвестной z координаты для этой точки. Если при этом нормаль данной точки соответствует эталонному значению, это говорит о некоторой удалённости всего образа; а если нормаль немного отличается, то о повороте наблюдаемого объекта относительно его эталонного представления.

Очевидно, что можно эти закономерности численно выразить и найти требуемую трансформацию, которая привела эталонный образ в данное представление, после чего можно условится, что данная трансформация применялась ко всем маркерам объекта, что позволит их трансформировать сответствующим образом, наложить на изображение и обнаружить соответствия, но что-то мозгов у меня уже не хватает это всё объять, хоть в начале всё и казалось просто... :(

Второй вариант - выразить допустимые погрешности каждой из величин контрольных точек эталонного образа, и искать на картинке ближайшие точки с характеристиками, укладывающимися в диапазон разброса, и за процент соответствия брать отношение найденных маркеров к общему количеству маркеров образа, после чего оглашать тот, который набрал большее количество очков. Однако это не большой прогресс по сравнению с наложением паттернов.
У вас нет необходимых прав для просмотра вложений в этом сообщении.
Больше знаешь - меньше размышляешь.
Аватара пользователя
Yandersen
Заинтересованный
 
Сообщения: 27
Зарегистрирован: Ср апр 06, 2011 14:47:00
Откуда: Canada

Re: Интеллект как средство достижения целей

Сообщение victorst » Вт апр 23, 2013 5:13:58

2Yandersen: что такое объект или образ на двумерном изображении? Как и в каком виде его представление должно заранее до текущего распознавания появиться в распознающей системе? Ваше мнение?
Аватара пользователя
victorst
Полноправный участник
 
Сообщения: 1073
Зарегистрирован: Вс янв 09, 2005 22:36:18
Откуда: Россия, г.Омск

Re: Интеллект как средство достижения целей

Сообщение Yandersen » Вт апр 23, 2013 6:13:33

С опаской предположу, что в базе данных объект должен быть представлен как набор точек с ассоциированными с ними аттрибутами, причём координаты точек трёхмерны и находятся в объектной системе координат. Центром системы отсчёта пусть будет одна из точек, принадлежащая некоторой грани объекта, ось Ох пусть будет направлена вдоль этой грани, ось Оу - нормаль к грани, ось Оz - результат векторного умножения осей координат.
Занесение объекта в базу данных осуществляется при возможности считать все три координаты каждой точки: при ближнем рассмотрении (бинокулярность зрения в помощь), тактильном контакте (ощупывание), или на основании анализа траекторий движения точек объекта при перемещении вокруг него.
Т.е. по сути задача опознания сводится к реконструкции 3D из 2D: каждый выделенный на изображении пиксель нужно преобразовать в систему координат объекта и найти ему соответствующую контрольную точку. Сколько точек нашлось, таков и процент совпадения для данного образа.
Больше знаешь - меньше размышляешь.
Аватара пользователя
Yandersen
Заинтересованный
 
Сообщения: 27
Зарегистрирован: Ср апр 06, 2011 14:47:00
Откуда: Canada

Re: Интеллект как средство достижения целей

Сообщение victorst » Вт апр 23, 2013 6:39:39

Yandersen писал(а):Т.е. по сути задача опознания сводится к реконструкции 3D из 2D: каждый выделенный на изображении пиксель нужно преобразовать в систему координат объекта и найти ему соответствующую контрольную точку. Сколько точек нашлось, таков и процент совпадения для данного образа.
Сомневаюсь, что у многих птиц, других многих теплокровных, а также у насекомых есть бинокулярное зрение. И про 3D пространство знания в их куцем мозгу видимо хранятся в каком-то коссвенном упрощенном виде.
Поэтому и не только поэтому. я сейчас ставлю для себя задачу монокулярного зрения так: запомнить все что видно на текущем изображении, сравнить с тем, что ранее было увидено в предыдущих изображениях и найти общее и отличия. Причем нужно найти не только пространственные закономерности но и временнЫе. Пока это вся задача. ВООБЩЕ речи про какие-либо объекты, их контура, особенности окраски, наклона и тем более 3D тут нет и в помине. При этом БЗ будет вначале совершенно пуста. Затем на основе статистики получения закономерностей должны сформироваться образы. Насколько абстрактные - предстоит выяснить. Я как раз на пути у этому.
3D я буду рассматривать в следующем программном модуле реконструкции 3D из 2D.
Как вы будете поступать - если не трудно, описывайте в этой теме.
Аватара пользователя
victorst
Полноправный участник
 
Сообщения: 1073
Зарегистрирован: Вс янв 09, 2005 22:36:18
Откуда: Россия, г.Омск

Пред.След.

Вернуться в Статьи от Форумчан об Искусственном Интеллекте

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1




Rambler's Top100 Каталог ресурсов ListTop.Ru Каталог сайтов Союз образовательных сайтов Parenting.ru - Родители семья дети ребенок

     Сайт "Искусственный интеллект" - программирование ИИ от разработчика: общение, статьи, ссылки.