В мае 2023 года компания Яндекс представила аналог нашумевшему ChatGPT — нейросеть под названием YaGPT. Разбираемся, как мир заполонили нейросети и что же лучше: отечественная разработка или более раннее изобретение, рожденное в Штатах.
Как мы заговорили о нейросетях
ChatGPT попал в информационное поле в 2022 году и создал настоящий бум на нейросети. Казалось бы, будущее внезапно наступило — оказалось, что искусственный интеллект может писать код, создавать тексты, мало отличимые от написанных человеком, переводить материалы, давать ответы на сложные вопросы и даже вести диалог с живыми пользователями. Неужели ИИ все же быстро захватит мир? Исчезнут менеджеры соцсетей, райтеры, журналисты, писатели, сценаристы, дизайнеры и другие гуманитарии? Опасение за свое будущее даже вылилось в настоящие народные протесты: чего стоили одни только голливудские забастовки сценаристов, которые выступали против использования ИИ в кинопроизводстве.
Какие бывают нейросети
На самом деле, нейронные сети появились еще в 1944 году, благодаря ученым из Чикагского университета. Первую обучаемую нейросеть создал психолог Фрэнк Розенблатт в 1957 году. Однако все они были примитивными и мало что могли.
С развитием интернета нейросети становились все более сложными и многоуровневыми. Множество приложений, которыми мы пользуемся повседневно, уже давно используют нейронные системы в своей работе. Например, Shazam, голосовые помощники и онлайн-переводчики. Но настоящую популярность нейросети обрели как раз с появлением в информационном поле ChatGPT.
Однако одним ChatGPT дело не ограничилось. Интернет заполонили все новые и новые нейросети. Некоторые работали с генерацией изображений (DALL-E, Midjourney, Stable Diffusion). Достаточно ввести текстовое описание и ИИ сделает соответствующие картинки. Не всегда они с первого раза понимают. что вы от них хотите, а иногда «рожают» котят с двумя телами, шестью лапами и одной головой. Но если грамотно построить запрос, можно получить очень приличные картинки, в некоторых даже можно увидеть глубинный смысл.
Отдельное внимание стоит уделить нейросетям, работающим с голосом. Это и Imaginary soundscape, которая создает фоновую музыку к изображению, и VALL-E, правдоподобно озвучивающая текст. В последнее время в Интернете появился тренд на создание песен, в которых, казалось бы, поют знаменитости. Имитирует голос звезд нейросеть Uberduck.ai. А другой сервис Vera Voice заменяет актеров дубляжа и переводит видео на другой язык с сохранением голоса героев. Здесь, конечно, ИИ попадает в серую зону авторских прав и вообще прав человека на свое изображение, голос и т.п. Вопросы эти еще юридически всерьез не урегулированы, но человечество уже задумалось об этом.
Однако отдельное внимание стоит уделить текстовым нейросетям, подобных нашумевшему ChatGPT. Практически каждая крупная компания стала создавать свои аналоги. Google, Microsoft, Writesonic почти сразу разработали свои версии чат-бота. Не обошел тренд стороной и российских айтишников. И вот в мае нынешнего годапоявился отечественный аналог под названием YaGPT от компании Яндекс.
Что лучше: YaGPT или ChatGPT
На самом деле, различий между нейросетями не так уж и много. Начнем с того, что оба сервиса являются разными версиями одной основной архитектуры, нейронной сети GPT (Generative Pre-trained Transformer), разработанной OpenAI. Компания YaLM, принадлежащая Яндексу, немного изменила бот, но архитектура трансформера осталась неизменной.
В качестве эксперимента мы решили попросить сами нейросети сравнить YaGPT и ChatGPT.
Разработка Яндекса дала лаконичный и емкий ответ.
Сравнивая YaGPT 2 и ChatGPT, можно отметить, что обе модели имеют свои преимущества и недостатки. YaGPT 2 лучше справляется с генерацией текстов на русском языке и может обрабатывать другие языки, но не умеет работать с изображениями. ChatGPT же лучше подходит для общения и может выполнять некоторые задачи, такие как решение математических примеров и поиск информации в интернете.
ChatGPT более пространно описал общее и отличное в двух нейросетях:
Сходства между YaGPT 2 и ChatGPT:
- Они оба базируются на архитектуре трансформера, которая является состоянием искусства в области моделей языкового моделирования.
- Оба являются мощными инструментами для генерации текста и обработки естественного языка.
- Они обладают широким разнообразием языковых паттернов и хорошим пониманием контекста.
Различия между YaGPT 2 и ChatGPT:
- История разработки. YaGPT 2 разработан Yandex Research, тогда как ChatGPT разработан OpenAI.
- Открытость и доступность. В отличие от YaGPT 2, ChatGPT является открытым проектом и доступен для широкой аудитории для экспериментов и использования.
- Разница в обучающих данных и доменах. Модели обучаются на различных наборах данных и могут иметь разные области применения и использования.
- Различные размеры и характеристики моделей. YaGPT 2 является одной из наиболее передовых моделей GPT-2, тогда как ChatGPT имеет собственные модификации и улучшения в рамках OpenAI.
Как мы видим, разница между нейросетями очевидна. ChatGPT дал более развернутый ответ, однако не все данные отвечают действительности. Это происходит из-за неактуальной информации — база ChatGPT ограничивается данными до 2021 года, в то время как YaGPT учитывает и современные тексты.
Что еще хотелось бы отметить, так это скорость ответа. YaGPT имеет большую производительность, чем ChatGPT. Если зарубежной нейросети понадобилась почти минута на генерацию текста, то YaGPT ответила примерно за 40 секунд.
Также YaGPT обучалась преимущественно на русскоязычных текстах, так что качество сгенерированного материала отечественной нейросети намного лучше. Так что, если вам нужен русский текст — берите YaGPT, английский — ChatGPT.
А вот в чем YaGPT проигрывает, так это в ведении диалога. ChatGPT специально был обучен для поддержания разговора и лучше анализирует контекст во время беседы. Также YaGPT не умеет выполнять задачи, связанные с принятием решений и выполнением действий, как это делает ChatGPT. Например, она не может работать с кодом или решать математические задачи. Но, собственно, перед ней такие задачи и не ставились.
Если говорить о доступности для русскоязычных пользователей, то преимущества YaGPT тут очевидны, так как OpenAI приостановил использование чат-бота для россиян.
Наша базовая модель уверенно обгоняет в ответах на русском языке ChatGPT 3.5 и в десятках процентов случаев дает более качественный ответ, чем ChatGPT 4. Пока мы ее не догнали, но это вопрос времени.
Если делать прогнозы, то в будущем различий между чат-ботами будет еще меньше. Нейросети обучаемы (учитель для нейросети становится популярной и высокооплачиваемой профессией!), так что недолог миг, когда YaGPT будет с легкостью осваивать написание кодов и решение математических задачек, а ChatGPT будет писать на русском так же хорошо, как на английском. Дело времени и пары миллионов обработанных текстов.