Почему единый цифровой разум появится еще не скоро

Во многих сферах экономики искусственный интеллект уже практически полностью заменил человека. Нейросети общаются с нами в чат-ботах, пишут и переводят тексты, создают картины. Однако ни у кого до сих пор не получилось создать универсальный искусственный интеллект, который мог бы безупречно выполнять различные задачи. Рассказываем о нюансах обучения нейросетей.

Изображение, сгенерированное нейросетью Midjourney по запросу «робот учится»

Стадии развития искусственного интеллекта

Первый искусственный интеллект (ИИ) был создан в 1951 году Кристофером Стрейчи, британским ученым и программистом. Программа умела играть с человеком в шашки и предсказывать его ходы. В 1965-м Джозеф Вайценбаум, специалист Массачусетского технологического института, создал программу ИИ под названием «Элиза», которую считают прообразом Siri — «умного» помощника в устройствах Apple.

Мощный виток развития искусственный интеллект приобрел в 1990-х годах. Самый известный пример того времени — компьютер IBM Deep Blue. Он получил известность в 1997 году, когда смог обыграть в шахматы чемпиона мира Гарри Каспарова.

Евгений Ильюшин, старший научный сотрудник Института проблем информационной безопасности МГУ, пользуется кривой Гартнера, чтобы определить, в какой фазе зрелости находится тот или иной технологический проект. Она включает в себя пять этапов. На первом о разработке выходят первые публикации. На втором этапе технологию широко обсуждают. Третий этап — выявление недостатков, спад общественного интереса к разработке. На четвертом — недостатки преодолеваются, а интерес к решению возвращается. На пятом этапе общество воспринимает технологию уже как данность со всеми ее достоинствами и недостатками. По оценкам эксперта, нейросети сейчас находятся между четвертой и пятой стадиями.

Евгений Ильюшин отметил, что в интересе к ИИ в последние годы наблюдается некоторый спад. Вместе с тем возникают все новые области применения, благодаря чему алгоритмы могут развиваться дальше. Эксперт считает, что технологии ИИ уже настолько совершенны, что их допустимо использовать в медицине, военной промышленности и других сферах экономики. Но сначала нужно понять, как именно оценивать устойчивость алгоритмов, подчеркивает Ильюшин. То есть понять, насколько они надежны и смогут ли на все 100% заменить человека.

Нейросети-трансформеры

По мнению специалистов, сфера искусственного интеллекта активно развивается благодаря использованию новейшего типа архитектуры нейросетей — трансформера.

Эти нейросети способны сосредотачиваться на нужных данных за счет «механизма внимания»: трансформер выбирает правильный ответ, анализируя контекст входящей информации.

Основными компонентами нейросетей-трансформеров являются декодер и энкодер. Энкодер обрабатывает полученную информацию и перерабатывает ее в числовой набор. Декодер — преобразует числа в новую информацию. Например, при переводе текста с одного языка на другой энкодер переводит его в набор цифр, а декодер эти цифры переводит в текст на нужном языке.

Проще говоря, обычные нейросети обрабатывают информацию последовательно. Переводя текст, они переводят слово за словом, объединяя слова в предложения. Нейросети-трансформеры обрабатывают не только отдельные слова, но и их взаимосвязи. Это позволяет сделать перевод более понятным и «живым».

Нейросети-трансформеры используются при обработке естественного языка в сервисах «Яндекса». Причем эти модели умеют не только переводить, но еще и определять стиль текста, отслеживать его «настроение». Сейчас сфера применения нейросетей расширяется. Они уже умеют генерировать изображения по запросу и даже предсказывать структуру белка в биотехнологических исследованиях.

Эксперты отмечают, что машинное обучение нейросетей и успех в этом процессе связаны с тем, что искусственные нейроны очень «любят учиться». Например, нейросеть GPT-3, способная воссоздавать человеческую речь, от американского разработчика OpenAI обучена по 175 млрд параметров. Каждый из них обозначает какой-то навык. Нейросеть может всего по нескольким входным данным сочинить стихотворение, перевести текст на иностранный язык и так далее. Кроме того, могут использоваться и разнородные синтетические данные. Например, для создания картины — ввести ее текстовое описание.

Проблемы обучения

Пожалуй, главная из них состоит в сложности образовательного процесса. Исследователям приходится пробовать различные архитектуры нейросетей, обучать каждую из них и только потом выбирать ту, которая способна решить поставленную задачу оптимальным способом.

С чем еще связаны проблемы обучения нейросетей?

Чрезвычайно высокий объем информации. Чем большую мощность имеет нейронная сеть, тем большее количество параметров она содержит. А это очень большой массив данных. Например, чтобы освоить один язык, программе распознавания речи нужно изучить терабайты данных. Исследователи работают над сокращением количества параметров, и, возможно, скоро проблема будет решена.

Проблемы с переобучением. Если в наборе данных возникла ошибка, сложная модель будет выдавать ее и в собственных расчетах.

Необходимость определить параметры до того, как начать обучение. Даже их небольшое изменение способно привести к существенному спаду производительности.

Наличие оборудования высокой производительности. Оно необходимо для повышения эффективности и сокращения временных затрат. Но высокопроизводительные квантовые процессоры расходуют большое количество энергоресурсов и очень дорого стоят.

Проблема «черного ящика». Специалисты не всегда знают, как нейронная сеть пришла к какому-либо решению. Нейросеть может генерировать ложные утверждения, а иногда — даже приносить вред. Например, если поставит неверный медицинский диагноз.

Отсутствие многозадачного обучения и гибкости. Нейросеть глубокого обучения способна качественно решить определенную задачу. Но пока сферы ее практического применения весьма ограничены.

Евгений Павловский, ведущий научный сотрудник лаборатории аналитики потоковых данных и машинного обучения Новосибирского госуниверситета, считает, что процесс обучения нейросетей можно упростить с использованием полуконтролируемого обучения. В таком случае алгоритм способен обучаться самостоятельно, пояснил эксперт.

Канадские и американские ученые из Массачусетского технологического института, Корнеллского университета и Университета Макгилла представили нейросеть, которая способна анализировать различные языковые закономерности. При этом для обучения модели использовали учебники лингвистики на 58 языках.

По словам экспертов, скорость, с которой проходит обучение нейросетей, в последние несколько лет очень выросла. Однако есть проблема: вероятности ошибки, которую оценивают в 1%. Это может быть критично, если речь идет о диагностике заболеваний или управлении энергетическими сетями. Специалисты считают: прежде чем поручать ИИ ответственные задачи, нужно убедиться, что модель не обучилась чему-то не тому или просто не доучилась. Эксперты настаивают, что система должна не только принять верное решение, но и объяснить, почему она так сделала.

Общий искусственный интеллект

На сегодняшний день есть две распространенные разновидности нейросетей — сильный ИИ и ИИ общего назначения.

Сильный искусственный интеллект — тот, который в теории способен делать все, что может делать человек. В частности, проходить тест Тьюринга (нужно определить, кто общается с тестируемым, — человек или машина). Кроме того, сильный ИИ осознает себя как отдельную личность, умеет ставить цели и достигать их. Можно сказать, что это искусственный человек, вроде Электроника, персонажа книг советского фантаста Евгения Велтистова.

В свою очередь, ИИ общего назначения можно назвать машиной для достижения конкретных результатов. Это исполнитель, который выполняет поставленные задачи без их анализа. Например, он может перевести текст, продать товары через рассылку, нарисовать картину на заданную тему и так далее.

Антон Колонин, который на протяжении уже более 25 лет проводит исследования в области нейросетей и искусственного общего интеллекта (AGI), говорит, что разработчики так и не пришли к согласию по вопросу, что он должен собой представлять. По мнению одних, его интеллектуальные способности должны быть равны человеческим. Другие считают, что технология должна уметь приспосабливаться к условиям, в которые ее помещают. Среди людей она будет человеком, а среди кошек — кошкой. По мнению третьих, AGI — это технология, которая позволит создавать прикладные решения для совершенно любой задачи.

Расходятся ученые и в вопросе воспроизведения интеллекта человека. Одни считают важным докопаться до самой сути работы интеллекта. Другие уверены, что достаточно изучить ее основные принципы. При этом уже есть версии, как создавать AGI. Согласно первой из них, нужно строить большие нейросети и объединять их различными способами. Вторая гласит, что сами по себе нейросети работать не смогут и нужно будет корректировать их, в том числе применяя математические методы, которые основаны на логике. Есть и третья теория, согласно которой успех заключается в совместном использовании современных методов обучения глубоких нейросетей, а также математических способов.

ЦУР 9

 

Развитие нейросетей и высокоинтеллектуального ИИ поможет решить задачи девятой Цели устойчивого развития (ЦУР) — одной из 17-ти, которые мир должен достичь к 2030 году. В ней ООН призывает развивать качественную и надежную инфраструктуру, чтобы поддержать как развитие экономики, так и благополучие людей. Переоборудование предприятий способно сделать их более устойчивыми благодаря более эффективному использованию ресурсов, а также применению экологически безопасных технологий. ЦУР 9 призывает наращивать технологический потенциал и поддерживать исследования ученых в сфере промышленности. Технологиям ИИ под силу решить эти и многие другие задачи.

Подписывайтесь на наш канал в Telegram

Автор

Виталина Слепухова