Яндекс запустил Лабораторию Толоки — она автоматически решает популярные задачи по обработке данных. Лаборатория создана на базе Яндекс.Толоки и пригодится тем, кому важно быстро решить задачу и кто не готов тратить время на запуск проекта на этой платформе.
Для работы с Лабораторией не нужны никакие специальные знания. Заказчик только заполняет небольшую форму, даёт ссылку на данные и объясняет, что с ними делать. Остальное — создание интерфейса, настройка проекта и поиск исполнителей — происходит с помощью автоматизированных процессов. Когда всё будет готово, заказчик получит результаты разметки.
Сейчас Лаборатория выполняет три вида разметки данных — классификацию изображений, классификацию текста и выделение объектов на картинке. Размеченные данные помогают решать самые разные задачи в маркетинге, продажах, образовании, машинном обучении и других сферах. Например, с помощью классификации изображений можно определить эмоции человека на снимке — смеётся он, равнодушен или грустит. С помощью классификации текста — сгруппировать комментарии пользователей по тональности, скажем, разделить их на позитивные, негативные и нейтральные. А выделение областей изображений, помимо прочего, позволяет найти на фотографиях людей, которые выгуливают собаку. Позже появятся автоматические решения и для других видов задач.
«Мы стремимся, чтобы технологиями Толоки могли пользоваться как можно больше людей — и чтобы это было легко, — говорит руководитель Яндекс.Толоки Ольга Мегорская. — Если у человека есть такая возможность, он самостоятельно разберётся в Толоке и запустит проект. Если задача сложная, а разбираться времени нет — обратится к сертифицированным партнёрам. А со стандартными и наиболее популярными типами разметки поможет Лаборатория».
Заполнить заявку на обработку данных можно в Лаборатории. Минимальный объём задачи — 500 текстов или изображений, цена начинается с 12 000 рублей и зависит от сложности разметки.
Яндекс.Толока — это открытая краудсорсинговая платформа, где зарегистрировано более семи миллионов человек, которые выполняют задания по сбору и разметке данных для разных заказчиков. Каждый день исполнители выполняют больше 13 миллионов заданий по разметке данных, которые потом используются как эталонные данные для машинного обучения, а также помогают в задачах модерации и генерации контента.