01.06.2019, Илья Хель Hi-News.ru
Самый большой урок, который можно извлечь из 70 лет исследований ИИ, заключается в том, что общие методы, использующие вычисления, в конечном итоге оказываются наиболее эффективными — и с большим отрывом. Конечной причиной этого является закон Мура. Или, скорее, его обобщение: продолжающееся, экспоненциальное удешевление вычислительных процессоров. Об этом «горьком уроке» рассказал Ричард Саттон, канадский компьютерный ученый. Далее — от первого лица.
Почему исследования искусственного интеллекта были в тупике 70 лет?
Большинство исследований искусственного интеллекта проводились так, как если бы вычисления, доступные агенту, были постоянными (и в данном случае использование человеческих знаний было бы одним из единственных способов повышения производительности). Но через некоторое время — гораздо большее, чем нужно для типичного исследовательского проекта — неизбежно становится доступно гораздо больше вычислений. В поисках улучшений, которые могут помочь в краткосрочном периоде, ученые пытаются использовать максимум человеческих знаний в этой области, но единственное, что имеет значение в долгосрочной перспективе — это нарастающее использование вычислений. Эти два аспекта не должны идти вразрез друг с другом, но на практике идут. Время, потраченное на один из них, не равно времени, потраченному на другой. Есть психологические обязательства по инвестированию в тот или иной подход. А подход, основанный на знаниях человека, имеет тенденцию усложнять методы таким образом, что они становятся менее подходящими для использования преимуществ общих методов, использующих вычисления.
Вывод: нужно сразу отбрасывать попытку решить задачу ИИ «головой», потому что пройдет время и она решится гораздо быстрее и проще — благодаря росту мощности вычислений
Было много примеров, когда исследователи ИИ запоздало понимали этот горький урок. Будет поучительно рассмотреть некоторые из самых выдающихся примеров.
В компьютерных шахматах методы, победившие чемпиона мира Каспарова в 1997 году, основывались на массивном, глубоком поиске. В то время к ним с тревогой относились большинство исследователей компьютерных шахмат, которые использовали методы, основанные на понимании человеком особой структуры шахмат. Когда более простой, основанный на поиске подход со специальным аппаратным и программным обеспечением оказался намного более эффективным, исследователи, отталкивающиеся от человеческого понимания шахмат, не признали поражения. Они сказали: «В этот раз подход грубой силы, может быть, и победил, но это он не станет общей стратегией и уж точно люди не играют в шахматы таким образом. Эти ученые хотели, чтобы методы, основанные на человеческом вкладе, победили, и очень разочаровались, когда этого не произошло.
Вывод: простая грубая сила вычислений возьмет свое, рано или поздно
Аналогичная картина прогресса в исследованиях была замечена в компьютерных го, только с задержкой еще на 20 лет. Первоначально огромные усилия направлялись на то, чтобы избегать поиска, используя человеческие знания или особенности игры, но все эти усилия оказались ненужными или даже хуже, как только поиск применили эффективно и масштабно. Также важно было использовать обучение в процессе самостоятельной игры, чтобы выучить ценностную функцию (как это было во многих других играх и даже в шахматах, только обучение не играло большой роли в программе 1997 года, которая впервые обыграла чемпиона мира). Обучение игре с самим собой, обучение в целом, это как поиск, позволяющий применять огромные массивы вычислений. Поиск и обучение — два самых важных класса техник, задействующих огромные объемы вычислений в исследованиях ИИ. В компьютерном го, как и в компьютерных шахматах, первоначальные усилия исследователей были направлены на использование человеческого понимания (так, чтобы использовать меньше поиска), и лишь много позже был достигнут гораздо больший успех — за счет использования поиска и обучения.
Вывод: поиск и обучение, подпитанные вычислительной мощностью, намного превосходят попытки решить задачу «нестандартным подходом мышления»
В области распознавания речи в 1970-х годах был проведен конкурс, спонсируемый DARPA. Участники представляли различные методы, которые использовали преимущества человеческого знания — знания слов или фонем, человеческого голосового тракта и так далее. По другую сторону баррикад были более новые методы, статистические по своей природе и выполняющие больше вычислений, на основе скрытых моделей Маркова (HMM). И опять же статистические методы победили методы, основанные на знаниях человека. Это привело к серьезным изменениям во всей обработке естественного языка, постепенно внедряющимся в течение десятилетий, пока в итоге статистика и вычисления не начали доминировать в этой области. Недавний рост глубокого обучения в области распознавания речи — это самый последний шаг в этом последовательном направлении. Методы глубокого обучения еще меньше полагаются на человеческие знания и используют еще больше вычислений, наряду с обучением на огромных наборах образцов, и выдают потрясающие системы распознавания речи.
Ричард Саттон, канадский компьютерный ученый-->
Как и в играх, ученые всегда пытались создавать системы, которые будут работать так, как они представляли в своих головах — они пытались поместить это знание в свои системы — но все это выходило крайне непродуктивно, ученые просто тратили время, пока — вследствие закона Мура — становились доступными все более массивные вычисления и находили себе прекрасное применение.
Вывод: одна и та же ошибка повторялась на протяжении десятилетий
Похожая картина была и в области компьютерного зрения. Первые методы воспринимались как поиск неких контуров, обобщенных цилиндров, либо с применением возможностей SIFT (масштабно-инвариантной трансформации признаков). Но сегодня все это выбросили в топку. Современные нейронные сети с глубоким обучением используют только понятие свертки и определенных инвариантов и работают намного лучше.
Это большой урок.
В какую бы область мы ни заглянули, мы везде продолжаем совершать одни и те же ошибки. Чтобы увидеть это и эффективно побороть, нужно понять, почему эти ошибки так привлекательны Мы должны усвоить горький урок, что построение того, как мы думаем, отталкиваясь от того, как мы думаем, не сработает в долгосрочной перспективе. Горький урок, основанный на исторических наблюдениях, показывает, что: 1) исследователи ИИ часто пытались встроить знание в своих агентов; 2) это всегда помогало в краткосрочной перспективе и приносило ученым удовлетворение; 3) но в долгосрочной перспективе все заходило в тупик и тормозило дальнейший прогресс; 4) прорывной прогресс неизбежно приходил с применением противоположного подхода, основанного на масштабировании вычислений за счет поиска и обучения. Успех был горьковатого вкуса и зачастую не усваивался полностью, потому что это успех вычислений, а не успех ориентированных на человека подходов.
Из этого горького урока следует усвоить одно: огромную мощь методов общего назначения, методов, которые продолжают масштабироваться с ростом вычислений, даже когда доступные вычисления становятся очень большими. Два метода, которые, похоже, масштабируются произвольно таким образом — это поиск и обучение.
Второе, что следует извлечь из этого горького урока, состоит в том, что фактическое содержание ума чрезвычайно и неоправданно сложное; нам стоит перестать пытаться найти простые способы осмыслить содержание ума, похожие на простые способы осмысления пространства, объектов, множественных агентов или симметрий. Все они являются частью произвольно сложного внешнего мира. Нам не стоит пытаться от них отталкиваться, потому что их сложность бесконечна; нам стоит строить на мета-методах, которые могут находить и улавливать эту произвольную сложность. Эти методы могут находить хорошие приближения, но поиск их должен осуществляться нашими методами, а не нами. Нам нужны агенты ИИ, которые могут открывать так же, как мы, а не содержать то, что мы открыли. Построение на наших открытиях только усложняет процесс открытия и поиска.
Вывод: нужно довериться вычислениям, а не пытаться калькировать человеческие размышления и попытки объяснить сложные методы открытия и поиска простыми схемами; в долгосрочной перспективе сработает первое, а не последнее.
Комментариев нет:
Отправить комментарий