22 часа практики Наука о Данных - одна из областей информатики, которые процветали больше в последнее десятилетие и является основой многих удобств, которые интернет предлагает нам сегодня. Это тесно связано с популярными понятиями, такими как
искусственный интеллект, автоматизированное обучение, большие данные, прогнозы, глубокое обучение и многое другое. Это область, где большие компании как Google, Facebook, Amazon, Apple, IBM, Microsoft и другие инвестируют большие деньги.
В этом модуле студенты окажутся в положении
настоящего ученого - аналитика, которому необходимо решить проблему. Они будут следовать указаниям инструктора, и осуществлять шаги предпринимаемые Data Scientist - от получение данных и описание проблемы до ее решении.
После прохождения модуля ученики
научатся:
- Разным методам структурирования данных
- Разным типами данных с преимуществами и недостатками
- Как можно исследовать набор данных и какие критерии можно учитывать
- Простым алгоритмам прогнозирования (дерево решений, Random Forest, SVM, KNN)
- Понятию статистики для интерпретации результатов
- Простым алгоритмам кластеризации / группировки (K-Means, DBScan) с преимуществами, недостатками
- Способы представления результатов и простые типы графиков
- Soft skills: работать с информацией, управлять вниманием и понимать свою задачу в коллективной работе