Находясь на нашем сайте, Вы даете согласие на обработку файлов cookie.

Часто задаваемые вопросы

Начало работы

Как создать аккаунт?
Просто кликните на "Начало работы" или "Попробовать бесплатно" на нашем сайте и заполните короткую форму. В течение 24 часов мы подтвердим ваш аккаунт, и у вас появится возможность войти в систему.
Как построить первую предиктивную модель?
После входа в систему вы будете переправлены в список моделей (проектов). Если это ваш первый вход в систему, единственной доступной опцией будет «Создать модель». Нажмите на эту кнопку и загрузите набор данных для обучения. Вы будете переправлены на вкладку «Обучение», где вам будет предложено выбрать переменную для предсказания. Выберите нужный столбец из выпадающего списка. При необходимости измените параметры обучения (метрику валидации модели), удалите столбцы, загрузите данные проверки. Нажмите «СТАРТ». Через несколько секунд вы увидите уведомление о начале обучения.

После завершения обучения вы можете воспользоваться одной из трех опций:
  1. Оценка — просмотр релевантных метрик валидации модели.
  2. Интерпретация — ознакомьтесь с матрицей, которая показывает степень влияния переменных на результаты модели.
  3. Прогнозирование — загрузите новые данные (тестовый набор данных), чтобы предсказать целевую переменную с помощью построенной модели.

После завершения прогноза вы сможете скачать CSV-файл.
Для чего нужна услуга «Заполнение пропущенных значений» и как ею пользоваться?
«Заполнение пропущенных значений» в наборе данных – это сервис, который помогает найти, спрогнозировать и заполнить все пустые значения в ваших данных с помощью алгоритмов машинного обучения на основе уже имеющихся данных.

Количество построенных моделей будет равно количеству столбцов с недостающими данными. После того, как все пустые значения будут заполнены, данные будут преобразованы обратно в исходный формат (в том виде, в каком они были загружены) и возвращены без пропусков значений.

Чтобы заполнить пропуски в вашем наборе данных, выберите параметр «Заполнение пропущенных значений» в раскрывающемся меню «Тип машинного обучения» и нажмите «СТАРТ». После заполнения недостающих данных вам будет предложено загрузить набор данных.

Данная опция не включает в себя расчет предиктивной модели.

Требования

Какие данные можно использовать для построения модели машинного обучения?
В настоящее время мы поддерживаем табличные данные в формате csv и excel с кодировкой «UTF-8» или «ISO-8859-1». Загружаемые наборы данных должны соответствовать нескольким требованиям: более 1 столбца, более 100 строк. Данные для обучения и данные, используемые для прогнозов, должны иметь тот же формат.

Сотрудничество

Могут ли возможности Nova ML дополнять сторонние аналитические сервисы?
В настоящее время мы работаем над API, который обеспечит доступ ко всем возможностям платформы сторонним разработчикам. Это значит, что стороннее программное обеспечение сможет отправлять данные/настройки на нашу платформу. Мы автоматически развернем необходимую инфраструктуру, обработаем ваши данные, построим модель, отправим результаты аналитики/прогноза обратно разработчику. Таким образом, серверная часть платформы будет привязана к внешнему интерфейсу третьей стороны.

Конфиденциальность

Кто имеет доступ к загруженным данным?
Тезис: Провайдер услуг может получить доступ к любым данным, загруженным на любой сторонний сервер.

Мы не будем пытаться убедить вас, что не можем получить доступ к вашим данным, но мы ввели строгие правила, предоставляющие широкие права доступа лишь ограниченному числу наших разработчиков. Наша политика конфиденциальности не позволяет сотрудникам открывать/загружать какие-либо данные пользователя. Единственная информация, которая может быть извлечена — это логи обучения, используемые для отладки и исправления ошибок, что делает наш сервис стабильным. Это отражено в нашем соглашении о конфиденциальности.

P.S. В настоящее время мы работаем над корпоративной версией — программным обеспечением, которое пользователь сможет установить на локальный компьютер и получить все преимущества автоматизированной платформы Nova ML, не отправляя данные в облако.

Что происходит под капотом?

Какие форматы данных может обрабатывать алгоритм Nova ML?
Мы поддерживаем все форматы табличных данных: текстовые и числовые, а также формат даты и времени. Ваши данные будут проанализированы и соответствующим образом преобразованы. Нерелевантная информация будет исключена из конвейера машинного обучения или преобразована соответствующим образом.
Нужно ли очищать свои данные перед загрузкой?
Нет, Вам не нужно ничего делать с данными, просто загрузите их, а мы сделаем все остальное.
Что делать, если данные содержат столбцы даты и времени?
Замечательно! Дата и время обычно являются значимой информацией, с которой NovaML умеет работать.
Используется ли генерация новых информативных переменных?
Генерация новых информативных переменных — неотъемлемая часть хорошего проекта машинного обучения. Обычно это длительный и сложный процесс. К счастью, с Nova ML он полностью автоматизирован.
Какие модели машинного обучения используются?
Мы тестируем все виды различных моделей и их вариаций, чтобы увидеть, какая из них подходит лучше. Назовем некоторые: Decision Trees, Random Forest, XGBoost, Linear/Logistic regression, SVM,и т д. Наш собирательный метод объединит некоторую их часть и создаст по-настоящему мощные фичи.
Как оценивается качество модели?
Наша стратегия валидации включает разные уровни: от одинарной валидации до десятикратной перекрестной валидации. Во время этого процесса модель обучается на одной части набора данных и используется для прогнозирования другой его части. Поскольку доступны эталонные данные (целевая переменная), мы измеряем ошибку между спрогнозированными и известными значениями — затем она переносится в количественную характеристику.
Можно ли использовать собственные метрики?
В настоящее время мы поддерживаем только стандартные метрики. Используемые нами метрики покроют 95% ваших потребностей. Несмотря на это, мы работаем над возможностью использования пользовательских метрик, что позволит точно определить формулу потерь.
Связаться с нами