Нейросеть Ferret от Apple обучили принимать в качестве запросов изображения

Американская корпорация Apple выпустила мультимодальную языковую модель Ferret, которая работает как с текстами, так и с изображениями. Выход нейросети не сопровождался анонсами от компании, однако она привлекла внимание специалистов по искусственному интеллекту.

Фото: Александр Коряков, Коммерсантъ

Фото: Александр Коряков, Коммерсантъ

Нейросеть анализирует изображение и определяет, какие на нем находятся предметы, после чего очерчивает их рамками. Ferret считает части картинки запросом, а ответ предоставляется в текстовой форме. Пользователи могут, например, попросить нейросеть распознать животное на фотографии, после чего она предоставит развернутый ответ и уточнит информацию по другим действиям или объектам. Ferret является нейросетью открытого формата — вероятно потому, что Apple не захотела выпускать коммерческого конкурента ChatGPT.

Ранее Apple выпустила обновление операционной системы iOS 17.2, которое исправило ряд ошибок, а также добавило поддержку пространственной видеосъемки для гарнитуры Vision Pro и приложение «Дневник». Также компания тестирует новую функцию, благодаря которой можно будет получить скидки на новые подписки при условии, что пользователь уже подписан на одну из них.

Евгений Федуненко

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...