Главная Теги Data Science

Тема: Data Science

Руководство по библиотеки NUMPY

Руководство по использованию Python-библиотеки NUMPY

Предок NumPy, Numeric, был разработан Джимом Хугунином. Также был создан пакет Numarray с дополнительной функциональностью. В 2005 году Трэвис Олифант выпустил пакет...
Как выучить Python с нуля

Как выучить Python с нуля для Data Science (или любых других целей)

Существуют миллионы сайтов, обещающих научить Python с нуля. Но вы наверняка знаете, насколько сложно начать и как еще сложнее не останавливаться. Возможно,...
Pandas на практических примерах

Pandas на практических примерах

Это дополнение к "Основы Pandas". Вместо теоретического вступления в миллион особенностей Pandas — 2 примера: Данные с космического телескопа «Хаббл». Датасет о заработной плате...
#8 Python для Data Science — import и встроенные модули

#8 Python для Data Science — import и встроенные модули

В предыдущих материалах этого руководства мы обсудили базовые концепции Python: переменные, структуры данных, встроенные функции и методы, циклы for и инструкции if. Это все...
#7 Python для Data Science — основы синтаксиса Python

#7 Python для Data Science — основы синтаксиса Python

Для новичков в программировании синтаксис оказывается одной из самых сложных вещей. Он очень строг и может казаться противоречивым. Поэтому в этом материале собраны основы...
#6 Python для Data Science — объединение цикла f'or и инструкции if

#6 Python для Data Science — объединение цикла for и инструкции if

В прошлый раз вы узнали, как работают инструкции if и циклы for в Python. В этот раз стоит поговорить о том, как объединять их....
#5 Python для Data Science — разбор цикла for

#5 Python для Data Science — разбор цикла for

Помните, как в предыдущей части инструкции if в Python сравнивались с тем, как принимает решения мозг человека, основываясь на неких условиях в повседневной жизни?...
#4 Python для Data Science — инструкции if в Python

#4 Python для Data Science — инструкции if в Python

Инструкции if (если) используются в повседневной жизни постоянно, пусть она и не написана на Python. Если горит зеленый, тогда можно переходить дорогу; в противном...
Основы Pandas №3 // Важные методы форматирования данных

Основы Pandas №3 // Важные методы форматирования данных

Это третья часть руководства по pandas, в которой речь пойдет о методах форматирования данных, часто используемых в проектах data science: merge, sort, reset_index и...
#3 Python для Data Science — встроенные функции и методы Python

#3 Python для Data Science — встроенные функции и методы Python

Функции — одно из главных преимуществ языка Python как минимум при использовании их в проектах Data Science. Это третья часть серии материалов «Python для...

«Data science» или «Наука о данных» достаточно широкое понятие. Проще всего описать, что это такое, перечислив конкретные области:

Исследование и анализ данных.

  • Pandas; NumPy; SciPy; и стандартные библиотеки Python.

Визуализация данных. Здесь просто — Беру данные и превращаю их во что-то красочное.

  • Matplotlib; Seaborn; Datashader; другие.

Классическое машинное обучение. Концептуально, мы могли бы определить это как любую задачу обучения с учителем и буз, которая не является глубоким обучением(см. Ниже). Scikit-learn — это универсальный инструмент для реализации классификации, регрессии, кластеризации и уменьшения размерности, в то время как StatsModels разрабатывается менее активно, но все же обладает рядом полезных функций.

  • Scikit-Learn, StatsModels.

Глубокое обучение. Это подмножество машинного обучения, которое получило вторую жизнь и обычно реализуется с Keras, среди других библиотек.

  • Keras, TensorFlow и много других.

Хранение данных и фреймворки для больших данных. Большие данные лучше всего описать как данные, которые в буквальном смысле слишком велики для размещения на одной машине или не могут быть обработаны целиком. Привязки Python к технологиям Apache играют здесь большую роль.

  • Apache Spark; Apache Hadoop; HDFS; Даск; h5py / pytables.

Обработка. Включает подтемы, такие как обработка естественного языка и манипулирование изображениями с такими библиотеками, как OpenCV.

  • NLTK; Spacy; OpenCV / CV2; scikit-изображения; Cython.

В этом разделе собраны примеры и руководства по изучению Data science с использованием Python с нуля.

Это также поможет вам изучить основные методы анализа данных с использованием Python.

Python data course

Новое

Популярно сейчас