Главная Теги Data Science

Тема: Data Science

Основные функции Pandas / pd 4

Основные функции Pandas / pd 4

Функции для элементов Библиотека Pandas построена на базе NumPy и расширяет возможности последней, используя их по отношению к новым структурам данных: Series и Dataframe. В...
Возможности объектов Index в pandas

Возможности объектов Index в pandas / pd 3

В отличие от других структур данных в Python pandas не только пользуется преимуществами высокой производительности массивов NumPy, но и добавляет в них индексы. Этот выбор...
Структуры данных в pandas

Структуры данных в pandas / pd 2

Ядром pandas являются две структуры данных, в которых происходят все операции: Series Dataframes Series — это структура, используемая для работы с последовательностью одномерных данных, а...
Введение в библиотеку pandas: установка и первые шаги

Введение в библиотеку pandas: установка и первые шаги / pd 1

Библиотека pandas в Python — это идеальный инструмент для тех, кто занимается анализом данных, используя для этого язык программирования Python. В этом материале речь сначала...
Чтение и запись данных массивов в файлы

Чтение и запись данных массивов в файлы / np 9

Важный аспект NumPy, которому пока не уделялось внимание — процесс чтения данных из файла. Это очень важный момент, особенно когда нужно работать с большим...
Структурирование массивов NumPy

Структурирование массивов NumPy / np 8

В предыдущих примерах вы видели только одно- или двухмерные массивы. Но NumPy позволяет создавать массивы, которые будут более сложными не только в плане размера,...
Важные особенности библиотеки NumPy

Важные особенности библиотеки NumPy / np 7

В этом разделе описываются общие понятия, лежащие в основе библиотеки NumPy. Разница между копиями и представлениями при возвращении значений. Также рассмотрим механизм “broadcasting”, который...
Объединение и разделение массивов

Операции с массивами / np 6

Часто требуется создать новый массив на основе уже существующих. В этом разделе речь пойдет о процессе создания массивов за счет объединения или разделения ранее...
Условия и булевы массивы, размерность матрицы

Условия и булевы массивы, размерность матрицы / np 5

До этого момента индексы и срезы использовать для извлечения подмножеств. В этих методах используются числовые значения. Но есть альтернативный путь получения элементов — с...
Индексы, срезы и итерация

Индексы, срезы и итерация / np 4

В прошлых разделах вы узнали, как создавать массив и выполнять операции с ним. В этом — речь пойдет о манипуляции массивами: о выборе элементов...

«Data science» или «Наука о данных» достаточно широкое понятие. Проще всего описать, что это такое, перечислив конкретные области:

Исследование и анализ данных.

  • Pandas; NumPy; SciPy; и стандартные библиотеки Python.

Визуализация данных. Здесь просто — Беру данные и превращаю их во что-то красочное.

  • Matplotlib; Seaborn; Datashader; другие.

Классическое машинное обучение. Концептуально, мы могли бы определить это как любую задачу обучения с учителем и буз, которая не является глубоким обучением(см. Ниже). Scikit-learn — это универсальный инструмент для реализации классификации, регрессии, кластеризации и уменьшения размерности, в то время как StatsModels разрабатывается менее активно, но все же обладает рядом полезных функций.

  • Scikit-Learn, StatsModels.

Глубокое обучение. Это подмножество машинного обучения, которое получило вторую жизнь и обычно реализуется с Keras, среди других библиотек.

  • Keras, TensorFlow и много других.

Хранение данных и фреймворки для больших данных. Большие данные лучше всего описать как данные, которые в буквальном смысле слишком велики для размещения на одной машине или не могут быть обработаны целиком. Привязки Python к технологиям Apache играют здесь большую роль.

  • Apache Spark; Apache Hadoop; HDFS; Даск; h5py / pytables.

Обработка. Включает подтемы, такие как обработка естественного языка и манипулирование изображениями с такими библиотеками, как OpenCV.

  • NLTK; Spacy; OpenCV / CV2; scikit-изображения; Cython.

В этом разделе собраны примеры и руководства по изучению Data science с использованием Python с нуля.

Это также поможет вам изучить основные методы анализа данных с использованием Python.

Python data course

Новое

Популярно сейчас