Главная Теги Data Science

Тема: Data Science

Как строить графики с Pyplot / plt 2

Как строить графики с Pyplot / plt 2

Модуль pyplot — это коллекция функций в стиле команд, которая позволяет использовать matplotlib почти так же, как MATLAB. Каждая функция pyplot работает с объектами...
Установка matplotlib и архитектура графиков

Установка matplotlib и архитектура графиков / plt 1

matplotlib — это библиотека, предназначенная для разработки двумерных графиков (включая 3D-представления). За последнее время она широко распространилась в научных и инженерных кругах (http://matplotlib.org): Среди всех...
Модули Keras: типы и примеры / keras 7

Модули Keras: типы и примеры / keras 7

Модули Keras предоставляют различные классы и алгоритмы глубокого обучения. Дальше о них и пойдет речь. Модули Keras В Keras представлены следующие модули: Бэкенд Утилиты Обработка изображений ...
Трансформация данных в pandas ч.2 / pd 12

Трансформация данных в pandas ч.2 / pd 12

Манипуляция строками Python — это популярный язык, который благодаря своей простоте часто используется для обработки строк и текста. Большая часть операций может быть выполнена даже...
Кастомные слои Keras / keras 6

Кастомные слои Keras / keras 6

Нейронная сеть — это стек из слоев. Каждый из них получает входящие данные, делает вычисления и передает результат следующему. В Keras есть много встроенных...
Трансформация данных в pandas ч.1 / pd 11

Трансформация данных в pandas ч.1 / pd 11

Процесс подготовки данных для анализа включает сборку данных в Dataframe с возможными добавлениями из других объектов и удалением ненужных частей. Следующий этап — трансформация....
Слои Keras: параметры и свойства / keras 5

Слои Keras: параметры и свойства / keras 5

Слои являются основными элементами, необходимыми при создании нейронных сетей. Последовательные слои отвечают за архитектуру модели глубокого обучения. Каждый из них выполняет вычисления на основе...
Глубокое обучение в Keras / keras 4

Глубокое обучение в Keras / keras 4

Это руководство посвящено глубокому обучению и важным алгоритмам в Keras. Разберем сферы применение алгоритма и его реализацию в Keras. Глубокое обучение — это подраздел машинного...
Подготовка данных в pandas / pd 10

Подготовка данных в pandas / pd 10

Прежде чем приступать к работе с данными, их нужно подготовить и собрать в виде структуры, так чтобы они поддавались обработке с помощью инструментов из...
Pickle — сериализация объектов Python / pd 9

Pickle — сериализация объектов Python / pd 9

Модуль pickle предоставляет мощный алгоритм сериализации и десериализации структур данных Python. Pickling — это процесс, при котором иерархия объекта конвертируется в поток байтов. Это позволяет...

«Data science» или «Наука о данных» достаточно широкое понятие. Проще всего описать, что это такое, перечислив конкретные области:

Исследование и анализ данных.

  • Pandas; NumPy; SciPy; и стандартные библиотеки Python.

Визуализация данных. Здесь просто — Беру данные и превращаю их во что-то красочное.

  • Matplotlib; Seaborn; Datashader; другие.

Классическое машинное обучение. Концептуально, мы могли бы определить это как любую задачу обучения с учителем и буз, которая не является глубоким обучением(см. Ниже). Scikit-learn — это универсальный инструмент для реализации классификации, регрессии, кластеризации и уменьшения размерности, в то время как StatsModels разрабатывается менее активно, но все же обладает рядом полезных функций.

  • Scikit-Learn, StatsModels.

Глубокое обучение. Это подмножество машинного обучения, которое получило вторую жизнь и обычно реализуется с Keras, среди других библиотек.

  • Keras, TensorFlow и много других.

Хранение данных и фреймворки для больших данных. Большие данные лучше всего описать как данные, которые в буквальном смысле слишком велики для размещения на одной машине или не могут быть обработаны целиком. Привязки Python к технологиям Apache играют здесь большую роль.

  • Apache Spark; Apache Hadoop; HDFS; Даск; h5py / pytables.

Обработка. Включает подтемы, такие как обработка естественного языка и манипулирование изображениями с такими библиотеками, как OpenCV.

  • NLTK; Spacy; OpenCV / CV2; scikit-изображения; Cython.

В этом разделе собраны примеры и руководства по изучению Data science с использованием Python с нуля.

Это также поможет вам изучить основные методы анализа данных с использованием Python.

Python data course

Новое

Популярно сейчас