Система искусственного интеллекта теперь поддерживает работу с изображениями как источником информации и обрабатывает в четыре раза больше данных за один запрос. Также модель научилась распознавать печатный и рукописный текст, формулы, графики, таблицы и анализировать данные, которые в них содержатся.
Нейросетевая модель GigaChat Pro обрела новую модальность. Теперь в качестве запроса пользователь может загрузить иллюстрацию, чтобы сервис использовал её как дополнительный контекст. Модель определит, сколько людей на фото, во что они одеты, даст совет по стилю одежды и многое другое.
Или, например, студенты могут сфотографировать часть учебного материала или конспекта, загрузить изображение и в несколько кликов получить короткое содержание текста, его ключевую тему и сформировать план дальнейшей работы с ним.
Функциональность доступна и бизнес-клиентам через API. Компании могут использовать искусственный интеллект в ещё большем числе сценариев.
«Мультимодальность расширяет способы и сферы применения больших языковых моделей, она же – ключевой тренд развития генеративного искусственного интеллекта. Теперь GigaChat умеет распознавать изображения, и это не просто ещё один важный шаг в развитии нашего сервиса – он открывает широкий спектр новых возможностей для наших пользователей», – рассказал старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев.
Первоисточник: https://www.belpressa.ru/
Источник: belgorod-news.net