Лучшие фотографии Магадана за неделю
19 апреля, 15:00
Российские предприниматели смогут получить помощь в продвижении товаров и услуг
21 апреля, 22:35
В Магадане появились новые комплексы фотовидеофиксации нарушений ПДД
21 апреля, 21:00
Российский экологический оператор сообщил о газификации экопромышленного парка в Миассе
21 апреля, 18:47
Колымский инклюзивный театр стал победителем этапа Всероссийского фестиваля
21 апреля, 17:46
В Магаданской области стартовала профилактическая акция "Стоп: мошенник!"
21 апреля, 17:01
Александр Воронцов провел в Магадане совещание по пробации
21 апреля, 16:09
Продукты ВТБ стали доступны во всех флагманских отделениях Почта Банка
21 апреля, 16:05
Магадан присоединился к всероссийской патриотической акции "Летопись сердец"
21 апреля, 15:21
В Магаданском музее откроется выставка о героях прошлого и настоящего
21 апреля, 15:12
На Колыме на минувшей неделе госавтоинспекторы выявили 764 нарушения ПДД
21 апреля, 14:56
Замруководителя СК по Магадану проведет прием для жителей Ягодного округа
21 апреля, 14:14
Литературная Премия имени Арсеньева помогает писать историю Дальнего Востока
21 апреля, 13:20
Трое бывших мастеров по ремонту окон задержаны в Хабаровске за кражи денег у пенсионеров
21 апреля, 13:15
Магаданцам рассказали о регулируемых тарифах на муниципальных маршрутах
21 апреля, 13:11
В Магадане прошел конкурс профессионального мастерства "Педагогический дебют"
21 апреля, 12:42

Сбер представил новую версию нейросети Kandinsky 2.1

Модель понимает запросы на 101 языке и умеет рисовать в различных стилях
5 апреля 2023, 13:20 Общество
Милый кот слушает музыку в наушниках пресс-служба Сбербанка
Милый кот слушает музыку в наушниках
Фото: пресс-служба Сбербанка
Нашли опечатку?
Ctrl+Enter

Новая генеративная модель Сбера — Kandinsky 2.1 (18+) — способна всего за несколько секунд создавать высококачественные изображения по их текстовому описанию на естественном языке. Она также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting). Модель понимает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях.

Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

Новая модель Kandinsky 2.1 унаследовала веса предыдущей версии, обученной на 1 млрд пар "текст — изображение", и была дополнительно обучена на 170 млн пар "текст — изображение" высокого разрешения. Затем она дообучалась на отдельно собранном датасете из 2 млн пар качественных изображений. В данный сет попали картинки с описаниями в таких традиционно сложных для нейросетей областях, как тексты и лица людей.

Нейросеть также была усовершенствована за счёт новой обученной модели автоэнкодера, которая используется в том числе в качестве декодера векторных представлений изображений. Это кардинально улучшило генерацию изображений в высоком разрешении: лица, сложные объекты и так далее. Благодаря этому новая модель содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0.

Кроме того, Kandinsky 2.1 использует не только закодированное текстовое описание, но и специальное представление изображения моделью CLIP. В таком виде нейросеть формирует представление картинки на основе текстовой информации и подаёт его на вход основной генеративной модели.

Модель умеет визуализировать любой контент и может применяться в различных отраслях. К примеру, в банковской сфере её можно использовать для создания персонализированных маркетинговых решений, ярких образов продуктов, привлечения и удержания внимания клиентов.

1 / 3

Александр Ведяхин, первый заместитель Председателя Правления Сбербанка:

"Обучая Kandinsky 2.1, мы учли мнения пользователей и реализовали смелую гипотезу, изучив самые передовые концепции. В результате мы разработали мощное универсальное решение для широкого круга задач на уровне лучших мировых аналогов. Оно открывает колоссальные возможности как для бизнеса, так и для населения. По сути, это ещё один важный шаг к AGI — сильному искусственному интеллекту. Думаю, у каждого найдётся задача для Kandinsky 2.1, и поэтому улучшенная модель, как и её предыдущая версия, находится в открытом доступе: протестировать её может любой желающий, причём бесплатно".

Оценить возможности нейросети можно на промо-странице модели, при помощи команды "Запусти художника" на умных устройствах Sber и в мобильном приложении Салют(6+) и на платформе ML Space в хабе предобученных моделей и датасетов DataHub. Модель также доступна для использования на платформе Fusion Brain и в Telegram-боте.

Sber AI — подразделение Сбера, отвечающее за развитие технологий искусственного интеллекта и их внедрение в различные сферы жизни и бизнеса.

16842
31
60

Электронный ресурс (Сайт) использует cookies и метрические программы. Продолжая посещение настоящего сайта, пользователь соглашается на смешанную обработку, сбор, использование, хранение, уточнение (обновление, изменение), обезличивание, блокирование, уничтожение своих персональных данных владельцем Электронного ресурса в соответствии с Политикой обработки персональных данных и Согласием на обработку персональных данных Пользователей.
На сайте используются рекомендательные технологии