Ɗǿᵯɇᵴŧǿᵴ
Модератор

КОМУ ПОДХОДИТ
- РУКОВОДИТЕЛЯМ
Внедрение передовых технологий – это ключ к стабильному росту, повышению прибыли и отрыву от конкурентов
- РАЗРАБ
Cсылка доступна только для пользователей!ТЧИКАМ
Активное взаимодействие, нетворкинг и получение полезных контактов в удобном формате
- АНАЛИТИКАМ
Наш курс обработки и анализа данных поможет работе с BigData, рассказывая о максимально подходящих и действенных методиках
- СТУДЕНТАМ
Поможем выбрать техническую специализацию, сэкономить время и набраться вдохновения для исследования новых задач
1. Фрактальность функции потерь, эффект двойного спуска и степенные законы в глубинном обучении - фрагменты одной мозаики.
Дмитрий Ветров Профессор-исследователь НИУ ВШЭ (Факультет компьютерных наук), глава Лаборатории машинного обучения, SAIC MOSCOW.
За последние годы в глубинных нейронных сетях был обнаружен ряд необычных эффектов (двойной спуск, связность мод, "минные поля" в рельефе функции потерь, и др.), показавших, что сообщество плохо понимает, что происходит в процессе обучения нейронных сетей. В ходе доклада мы попробуем увязать ряд эффектов в единую гипотезу и обсудим результаты экспериментов, которые косвенно ее подтверждают.
2. Инфраструктура извлечения факторов в проде
Михаил Трофимов ML Engineer в Praxis Pioneering
Часто при разработке продукта возникает несколько команд, реализующих ML в проде. У каждой стоит задача подсчета факторов, сбора сэмплов, обучения моделей, выкатка моделей в прод, доставка факторов в прод, синхронизация оффлайна и онлайна. Зачастую, каждая команда решает эти задачи независимо, что приводит в конечном итоге к замедлению разработки. В своем докладе я расскажу, как общая инфрастуктура факторов може ускорить разработку, зачем это вообще надо и какие проблемы возникают при ее построении.
3. «Питонись на отличненько»
Михаил СвешниковML Architect в Zyfra
Питон известен своим низким порогом входа и на нем действительно очень просто писать код. Однако это не значит, что на нем просто писать ХОРОШИЙ код. Я расскажу, что же это за зверь такой – хороший код на питоне, а так же покажу полезные приемы, которые помогут вам проще и быстрее писать на питоне и вообще поднимут ваше питон кунг-фу на новый уровень. Доклад будет интересен и тем, кто только собирается учить питон, и тем кто уже в познании питона настолько преисполнился, будто бы уже 100 триллионов миллиардов лет пишет код на триллионах и триллионах таких же языков.
4. Новинки CatBoost: поддержка эмбеддингов, обучение на SPARK и это еще не всё!
Станислав Кириллов Руководитель группы ML систем Яндекса
Как многим известно, градиентный бустинг на решающих деревьях остается SoTA на задачах, представимых в виде таблиц с признаками разной природы. До недавних пор CatBoost поддерживал 3 типа значений в колонках таких таблиц - вещественные признаки, категориальные и тексты.
Сегодня мы хотим презентовать возможность обучения на эмбеддингах объектов - вещественных векторах, показывающих положение объекта в каком-то семантическом пространстве.
Например, классическими примером эмбеддингов для текстов является word2vec, более новым - эмбеддинги трансформеров (BERT, GPT, etc). Мы расскажем о том, как именно CatBoost работает с такими векторами и как их использование может повысить качество ваших моделей.
Вторая важная новость, о которой мы расскажем - поддержка обучения на SPARK кластерах. Мы покажем, как реализована поддержка SPARK и как ей воспользоваться.
Ну и, конечно, это еще не все классные новости - еще мы расскажем о новых ускорениях и улучшениях, которые произошли с CatBoost за последние полгода.
5. Инструменты визуализиации в NLP: от графов знаний до BERT
Валентин Малых Senior Research Scientist в Noah’s Ark Lab
Кажется, что нет более далекой области от визуализации, чем обработка текстов. Но на самом деле визуализации и тут могут во многом помочь. Я расскажу про работу с графами знаний, а также про то, какие можно получить знания изучая паттерны внимания модели BERT
6. “Классическое” машинное обучение на табличных данных
Александр Фонарев Основатель компании Rubbles, data scientist, Ph.D. в области data science, лектор
В последние годы прикладное машинное обучение всё больше разделяется на два основных блока. Первый и наиболее хайповый — deep learning для обработки изображений, текста, звука и т. п. Второй, более старый, но не менее важный для бизнеса — “классический” ml для задач со табличными (структурированными) данными, использующийся для предсказания временных рядов, построения рекомендательных систем, предсказания поломок оборудования и многих других задач. В докладе мы погрузимся во второй блок: обсудим алгоритмы работы со структурированными данным, типизацию задач в этой области, практические кейсы, особенности индустрии сегодня и её развитие завтра.
7. Эмбеддинги графов без учителя
Антон Цицулин Аспирант университета Бонна, студент-исследователь в Google
В последние годы всё больше ML пайплайнов строится на эмбеддингах – вещественных векторах довольно малой размерности, отражающие семантические свойства объектов. Мы довольно хорошо научились извлекать их из текстов, картинок, звука, но для графов доступных коробочных решений пока нет. Графы – хитрый вид данных, который возникает, когда нам даны только связи разных объектов между собой. Например, дружба или подписки в соцсетях, покупки товаров и другие действия пользователей – лишь одни из примеров отношений, которые удобно моделировать графами. Я расскажу, как получать эмбеддинги для графов, про графовые нейросети и то, как их обучать без учителя.
8. Что такое "быстрый код"?
Николай Марков Principal Architect в компании Aligned Research Group
Какие именно особенности железа и кода заставляют его выполняться быстрее и эффективнее решать задачу? Стоит ли овчинка выделки? В докладе мы поговорим о том, как именно достигается высокая скорость выполнения кода, поковыряем распределенные вычисления, JIT, железки и векторизацию.
9. Как устроен умный робот, улучшающий колл-центры Яндекс
Татьяна Савельева Head of unstructured data analysis в Yandex.Taxi
В своем докладе расскажу про наш продукт для автоматизации и улучшения коллцентров. Как автоматизировать 80% первой линии поддержки так, чтобы робот был неотличим от человека, как понять какой текст лучше присылать пользователю, как раздавать промокодыс большей пользой для клиента и многое другое.
10. Почему бизнес не хочет внедрять современные технологии?
Евгений Лимаренко CIO группа компаний Gulliver&Co
Знакомая ситуация: приходишь в компанию или к коллегам в Коммерческий департамент, рассказываешь о крутом решении которую с парнями придумал и даже собрал MVP, а они смотрят, киваю головой и отказываются? Я расскажу вам, почему так происходит, как мыслят сотрудники бизнес подразделений и что нужно сделать, а что делать не надо, чтобы они хотели с вами работать.
11. Open Source In the Wild
Максим Кочуров Инженер-исследователь в NTechLab
Все из нас (ну точно многие) пользуются библиотеками Numpy, Pandas, sklearn и так далее. Мир опен сорса очень огромен, там просиходят большие (и неочень) события, свои местечковые конференции, принимаются решения, которые влияют на нашу разработку.
Однако знакомы с этой "кухней" далеко не все. Стандарты разработки многих продуктов обычно высоки. Кажется, что попасть в опен сорс сложно или почти невозможно. Не понятно с чего начать. Куда писать? Куда коммитить и как это делать? А вообще, зачем оно вообще нужно, вливаться в этот опен сорс, это же работа за бесплатно?
Другие проблемы, которые уже несколько уровнем выше, возникают и куда более серьезны для развития проекта. Как взаимодействовать с пользователями? Как развивать комьюнити? Как добиваться узнаваемости и расширять пользовательскую базу?
Проблемы взаимодействия с другими проектами тоже не остаются в стороне. Это бывают отношения пользователь-проект или проект-проект. В каждом из случаев есть нюансы. Как повлиять на развитие проекта? Как добавить недостающую фичу? Как поправить багу в любимой библиотеке? И самое главное, почему все так долго, и можно ли побыстрее?
В опен сорс я попал со студенческой скамьи на наивном энтузиазме, но это продолжает переворачивать жизнь по сей день. Я постараюсь ответить на перечисленные вопросы опираясь на свой опыт, ретроспективные выводы спустя несколько лет участия в нескольких крупных проектах.
12. Сколько стоит неэффективный Data Science или чему учить команду DS?
Михаил Рожков Creator Machine Learning REPA
Применение Data Science (DS) в бизнесе обычно связывают с тем value, которое смогут принести модели после их внедрение в процесс или продукт. При этом часто упускают из виду, что работа DS команды это сложный процесс, который требует значительных ресурсов и компетенций команды. В докладе обсудим, как можно оценить эффект от внедрения инструментов автоматизации и инженерных практик в Data Science. Доклад поможет компаниям найти точки роста DS команд и приоритезировать программы обучения и развития.
13. Рабочий Вариант: как большие данные меняют мир массового найма
Алексей Романов Expert Data Scientist в BigData МТС
Искусственный интеллект в массовом найме — очень модная тема, и бизнес плотоядно облизывается, глядя на перспективы анализа больших данных в этой области.
Однако с точки зрения Data Science работа в HR очень специфична: люди не тексты и не картинки, они капризны и часто непредсказуемы.
В своём докладе я дам общий обзор комплекса DS-задач, которые возникают в области массового найма, и разберу более пристально наиболее каверзные из них
14. Метрики в DS-проектах
Алексей Могильников ML Lead в Сбербанке, Chief Methodologist в LeanDS
Прикладное машинное обучение должно нести ценность бизнесу. В момент разработки модели не ясно как можно оценить потенциальную пользу модели и выбрать ожидаемые значения метрик на кросс-валидации или отложенной выборке такие, чтобы разработка модели имела смысл и ценность её была ощутима. В докладе будет показан подход к решению этой задачи и будет продемонстрировано как можно рассчитывать ценность, которую модель приносит бизнесу.
Тариф - Онлайн трансляция + видеозаписи двух потоков
Онлайн-участие
Видеозаписи двух потоков конференции
Презентации всех спикеров конференции
Бонус: видеозаписи Конференции от 30/06/2020 в подарок
Подробнее:
 📥 Скрытое содержимое! Войдите или Зарегистрируйтесь
Скачать
 📥 Скрытое содержимое! Войдите или Зарегистрируйтесь
Guevara
Администратор
Это многотомный архив вида «nazvanie.001», «nazvanie.002», «nazvanie.003» и тд. - то его нужно собрать Total Commaned'ом. Для этого скачайте все части архива в одно место (папка, диск), запустите Total Comander, откройте в нем папку где находятся все файлы, далее поместите курсор на первый частичный файл «nazvanie.001» и выберите "Собрать файлы"Прошу расказать как открыть файлы формата .spa на Windows? В этом формате выложены материалы, и я не могу их открыть.
Я скачал все файлы и в тотал командере запустил на файле с расширением .spa, оно его проработало но файлы с расширением spa_part2 и другие не подхватывает, только пишет вставте следующий диск или укажите другой каталог.Это многотомный архив вида «nazvanie.001», «nazvanie.002», «nazvanie.003» и тд. - то его нужно собрать Total Commaned'ом. Для этого скачайте все части архива в одно место (папка, диск), запустите Total Comander, откройте в нем папку где находятся все файлы, далее поместите курсор на первый частичный файл «nazvanie.001» и выберите "Собрать файлы"
Guevara
Администратор
Все файлы должны быть в одной папке. Можно попробывать открыть винраромЯ скачал все файлы и в тотал командере запустил на файле с расширением .spa, оно его проработало но файлы с расширением spa_part2 и другие не подхватывает, только пишет вставте следующий диск или укажите другой каталог.
Пожалуйста перепроверьте все ли файлы выложены. Если файлы генерировались автоматически, то возникает вопрос что есть 4 файла с расшырениями spa, spa_part2, spa_part3, spa_part4. Соответственно отсутсвуют файлы с расширением spa_part0 и spa_part1Все файлы должны быть в одной папке. Можно попробывать открыть винраром
Guevara
Администратор
Пожалуйста перепроверьте все ли файлы выложены. Если файлы генерировались автоматически, то возникает вопрос что есть 4 файла с расшырениями spa, spa_part2, spa_part3, spa_part4. Соответственно отсутсвуют файлы с расширением spa_part0 и spa_part1
 📥 Скрытое содержимое! Войдите или Зарегистрируйтесь
Guevara
Администратор
Организатор на данный момент не выходит на связь. Может быть заболел. Пока ждем.Сылка ведёт к весенней и летней конференции, а в тексте описана конференция осеняя. Можно ли ссылку на осеннюю конференцию. Спасибо
Есть надежда, что организатор выйдет на связьОрганизатор на данный момент не выходит на связь. Может быть заболел. Пока ждем.
Похожие темы
# Программирование
[Иван Аникин, Владимир Бугаевский] [Слёрм] Data Scientist (2024)
- Ответы
- 0
- Просмотры
- 287
# Программирование
[Яндекс.Практикум] Математика для анализа данных (Аналитика, Data Science)
- Ответы
- 0
- Просмотры
- 206
# Программирование
[Stepik] Погружение в Data Science и машинное обучение (2024)
- Ответы
- 0
- Просмотры
- 378
# Программирование
[Ержан Елемесов] [Udemy] Data Science от Проблемы до Решения (2024)
- Ответы
- 0
- Просмотры
- 290
# Программирование
[Артем Груздев, М. Лабонн] [ДМК] Графовые нейронные сети на Python (2024)
- Ответы
- 0
- Просмотры
- 336
- Ответы
- 0
- Просмотры
- 168
- Ответы
- 0
- Просмотры
- 125
Поделиться: