Post a job
Work type
fulltime
1 month ago

Разработчик мультимодальных VLM

глубокое обучение компьютерное зрение нейросети языковые модели
Разработчик мультимодальных VLM ❤️

Мультимодальные модели — один из трендов в области глубокого обучения. Мы, команда компьютерного зрения, строим мультимодальные визуально-текстовые модели (visual language models, VLM).

Какие задачи вас ждут:
• Обучать модели работать с изображениями и видео
• Создавать дата-пайплайны, которые обрабатывают все данные интернета
• Оптимизировать large-scale-обучение моделей и ускорять их инференс
• Адаптировать модели к продуктовым требованиям

Мы ждём, что вы:
• Понимаете, как работают современные архитектуры нейросетей
• Знакомы с большими языковыми моделями
• Следите за последними достижениями в областях компьютерного зрения и обработки естественного языка (понимаете, чем ViT отличается от ConvNeXt)

📩 Откликайтесь на вакансию на нашем сайте

#общие_сервисы #ML