На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
  
> Позитронная антропософия , идеи на счет "настоящего" ИИ
    Итак, решил выложить последнюю (на текущий момент) публикацию (совсем уж небольшую) на тему ИИ. Собственно, в этой публикации, озвучил философские размышления на счет «настоящего» ИИ, и неожиданно пришел к выводу, что несколько переосмыслил всю теорию ИИ.

    Публикация несколько неказистая, незавершенная, но так уж вышло, было довольно сложно ее писать.
      Иван, вы для чего выложили текст в pdf? Чтобы было невозможно цитировать?

      Цитирую по памяти.
      "Создание ИИ достижомо в далёком будущем..."
      Кто вам сказал, что оно вообще достижимо?

      "Создание ИИ начинается не с математиматических расчётов или написания программного кода..."
      Иван, решение гораздо более простых задач, чем создание ИИ, начинается с разработки математической модели.
      Любая задача теории принятия решения решается с помощью той или иной математической модели.


      Хорошие адаптивные модели интеллектуального агента с обратной связью рассматриваются в книге Рассела, Норвига "Искусственный интеллект. Современный подход"

      user posted image
        Цитата
        Иван, вы для чего выложили текст в pdf? Чтобы было невозможно цитировать?


        Просто чтобы сохранить оформление и формат текста. Та же Опера легко читает и открывает pdf, плангин входит в состав новых версий.

        Цитата
        Кто вам сказал, что оно вообще достижимо?


        А я не утверждаю это в жесткой форме. Но просто размышляю на тему такой вероятности...

        Цитата
        Любая задача теории принятия решения решается с помощью той или иной математической модели.


        А вот тут немного не соглашусь. Как Вы к примеру ведите математическую модель выработки симпатии человека к произведению изобразительного искусства? Или к примеру симпатию к человеку. Про любовь молчу, про нее часто любят ссылаться на химию и т.п.

        p.S.: за информацию о книге, огромное спасибо!
          Иван, вы самого главного не поняли, что я сказал.

          Прежде чем решать задачу выработки симпатии/принятия решения/выбора в условиях определённости, неопредёлённости, риска... etc
          вы должны сделать ФОРМАЛЬНУЮ ПОСТАНОВКУ ЗАДАЧИ
          пока нет математической постановки задачи, решать нечего

          Пока вы не формализовали задачу выработки "чувства", не определили "чувство" с помощью некой целевой функции, решать нечего
          ЗЫ. "чувство" будем мерять с помощью некой функции "полезности" ;)
            по Расселу-Норвигу

            Цитата
            Интеллектуальный агент – робот или программа, предназначенные для действия в среде.
            Задача Интеллектуального агента – функционировать под автономным управлением, получать из среды данные путем актов восприятия, существовать в течение продолжительного времени, адаптироваться к изменениям среды и уметь достигать цели, поставленные другими.

            у агента должна быть цель :)
            например, у робота таксиста цель - привезти клиента безопасно, вовремя и получить от него чаевые

            Теперь о среде. Если среда полностью наблюдаемая, то агент знает результат своих действий до того, как он их совершил. В частично наблюдаемой среде агент может только прогнозировать результат своего действия, поэтому выбирает действие, приводящее к лучшему прогнозируемому результату. Важной составляющей рационального поведения являются сбор информации и исследование ситуации в неизвестной среде.

            Агент+среда - это система. У нас должна быть математическая модель этой системы, например, модель фазового пространства, то есть пространства возможных состояний системы. Она (модель) должна состоять из описания внешней среды, датчиков, исполнительных механизмов и показателей производительности агента.

            Что такое показатели производительности агента. Понятие «производительность» в общем случае определить нельзя, но существует общее правило, что показатели производительности следует разрабатывать в соответствии с тем, чего мы хотим добиться в данной среде, а не с тем, как, по мнению проектировщика, должен вести себя агент.
            Попросту говоря, результат действия агента будет меряться какой числовой функцией, рациональный агент будет выбирать действие, максимизирующее его производительность.
            Если более точно, производительность агента принято подсчитывать на основе многих сценариев, сгенерированных для определенного класса среды. Рациональный агент максимизирует свою среднюю ожидаемую производительность по всем выбранным сценариям.

            Далее, существует 4 типа агентов:
            - простые рефлексные агенты;

            - рефлексные агенты, основанные на модели;

            - агенты, действующие на основе цели;

            - агенты, действующие на основе полезности.

            Любого агента из вышеперечисленных типов можно преобразовать в обучающегося агента с обратной связью. Который нам и нужен, для решения сложных задач.

            Добавлено
            про первые три типа вы сами у Рассела-Норвига почитаете, переходим сразу к рациональному агенту, действующему на основе фукнции полезности

            Заметьте, что целей у нас уже нет, мы их оцифровали и выразили функциями-критериями. Далее можно разные модели использовать. У Рассела-Норвига конфликтующие цели, например, скорость и безопасность у робота-таксиста, сворачиваются в одну функцию полезности. Можно и без свёртки делать, модели разные и алгоритмы разные, в теории принятия решений в многокритериальной среде :)
            Цитата
            Агент, обладающий явно заданной оценочной функцией полезности, имеет возможность принимать рациональные решения с помощью стратегии управления, не зависящей от вида конкретной функции.

            И стратегии управления разные возможны. Но главный результат любой стратегии - агент максимизирует значение своей оценочной функции полезности.
            Таким образом, можем заставить агента "любить" картины пуантилистов, если научить его распознавать пуантилизм среди других картин.

            Осталось только сделать агента самобучающимся, посредством обратной связи.
            Цитата
            Идея создавать обучающиеся машины принадлежит Алану Тьюрингу. Обучение позволяет агенту функционировать в неизвестной среде и становится все более компетентным. Начальная конфигурация агента может содержать некоторые данные о среде, заложенные туда проектировщиком, но, по мере приобретения агентом опыта, эти знания могут модифицироваться и пополняться.
            После достаточного опыта существования в среде поведение рационального обучающегося агента может стать независимым от его начальных априорных знаний.

            Вот тут таится опасность. Начинали работать с одним агентом, а закончили с другим.
              для того, чтобы агент стал самообучающимся, должна быть обратная связь от внешнего критика
              ну и у самого агента должен быть компонент, использующий информацию обратной связи от внешнего критика и модифицирующий правила поведения агента (производительный компонент).
              То есть в модель вводится "внешний критик", который оценивает действия агента с точки зрения внешнего стандарта производительности.

              Результаты обратной связи от внешнего критика можно рассматривать как "штрафы" и "премии".
              Например, самообучающийся робот-таксист.
              Его производительный компонент содержит базу знаний и процедур, с помощью которых он выбирает действия во время вождения. Внешний критик наблюдает за действиями робота в среде и передает обучающему компоненту информацию. Например, такси выполняет резкий поворот налево, пересекая три полосы движения. Критик с помощью датчиков получает высказывания других участников дорожного движения дорожного движения, затем передает соответствующую информацию обучающему компоненту. Тот формулирует новое правило, что такое действие является недопустимым и обновляет производительный компонент.
              Если агент перестает получать от пассажиров чаевые, критик информирует его, что, согласно стандарту производительности, это является отрицательным вкладом в его оценку полезности. В этом примере внешний стандарт производительности позволяет рассматривать результаты обратной связи как штрафы или премии.

              user posted image
                Цитата IvanFuture @
                Как Вы к примеру ведите математическую модель выработки симпатии человека к произведению изобразительного искусства?

                вот теперь можно ответить на ваш вопрос

                ничего
                выработкой симпатий у человека к изобразительному искусству занимаются воспитатели детсада/педагоги начальной школы
                мы обсуждаем создание ИИ, как было заявлено в самом начале
                создание ИИ на сегодняшний день возможно в узкой предметной области, значит, надо очертить границы области и сформулировать цель - чего мы хотим
                Обратите внимание, что речь идёт о достижении наших целей, а не о выработке у ИИ симпатий/антипатий

                Нас интересуют картины художников-пуантилистов
                Мы хотим, чтобы агент собрал для нас в интернете такие картины, не по фамилиям художников - мы можем не знать фамилии современных художников-пуантилистов, а по стилю
                Теперь мы должны формализовать-оцифровать понятие "стиль пуантилизм"

                Пуантилизм - живописная манера, основанная на технике письма мелкими точечными мазками почти чистых красок.
                Значит, у нас должно быть два параметра - f1 = степень раздельности мазков и f2 = степень чистоты красок.
                Потом, конечно, потребуются алгоритмы для определения этих параметров, но это потом, сейчас делаем модель.
                Предположим, у нас есть шкалы, в которых мы меряем точечность и чистоту красок, для каждой картины можем определить f1 и f2.
                Сами задаём пороговые значения, начиная с которых можно считать стиль пуантилизмом.
                В процессе работы агент изменит эти настройки посредством обратной связи.
                Агент находит картину, предъявляет внешнему критику (нам), мы либо принимаем, либо отклоняем.
                Классическое обучение на примерах, как, например, у нейросетей.

                Получили агента, который "любит" художников-пуантилистов :D

                [img]http://uploads4.wikipaintings.org/images/theo-van-rysselberghe/the-burning-time-1897.jpg!Blog.jpg[/img]
                  Спасибо, много по теме и толково. Я выскажусь чуть позже...
                  0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                  0 пользователей:


                  Рейтинг@Mail.ru
                  [ Script execution time: 0,0340 ]   [ 16 queries used ]   [ Generated: 26.04.24, 12:01 GMT ]