Главная Теги Data Science

Тема: Data Science

Базовые операции NumPy

Базовые операции NumPy / np 3

Вы уже знаете, как создавать массив NumPy и как определять его элементы. Теперь пришло время разобраться с тем, как применять к ним различные операции. Арифметические...
Ndarray: создание массива и типы данных

NumPy Ndarray: создание массива, генерация и типы данных / np 2

Основной элемент библиотеки NumPy — объект ndarray (что значит N-размерный массив). Этот объект является многомерным однородным массивом с заранее заданным количеством элементов. Однородный —...
Машинное обучение на практике с Python и Keras

Машинное обучение на практике с Python и Keras

Что такое машинное обучение и почему это важно? Машинное обучение — это область искусственного интеллекта, использующая статистические методы, чтобы предоставить компьютерным системам способность «учиться» (то...
Библиотека NumPy / Введение и установка

Введение и установка библиотеки NumPy / np 1

Немного истории В ранние годы существования Python разработчикам необходимо было проводить сложные вычисления, особенно когда язык использовался в научном сообществе. Первой попыткой упростить задачу...
Где брать данные для анализа

Где брать данные для анализа

Для поддержки растущей необходимости в данных в интернете сегодня доступно множество источников. Они предлагают информацию всем, кто в ней нуждаются. Такая информация называется открытыми...
Количественный и качественный анализ данных

Количественный и качественный анализ данных

Анализ данных полностью сосредоточен на данных. В зависимости от их происхождения можно проводить различия. Когда анализируемые данные строго числовые или имеют структуру категорий, тогда речь...
Процесс анализа данных

Процесс анализа данных

Анализ данных можно описать как процесс, состоящий из нескольких шагов, в которых сырые данные превращаются и обрабатываются с целью создать визуализации и сделать предсказания...
Статистические типы данных

Статистические типы данных

Данные можно поделить на две категории: Качественные (номинальные и порядковые); Количественные (дискретные и непрерывные); Качественные данные — это значения наблюдений, которые можно разделить на группы...
Превращение сырых данных в знания

Превращение сырых данных в знания

Еще один важный момент — сфера компетенции данных. Ее источник — биология, физика, финансы, испытания материалов, статистика населения и т. д. На самом деле,...
Какие знания нужны для анализа данных

Какие знания нужны для анализа данных

Анализ данных — дисциплина, которая подходит для изучения проблем, возникающих в самых разных сферах. Более того, она включает разные инструменты и методологии, требующие знания...

«Data science» или «Наука о данных» достаточно широкое понятие. Проще всего описать, что это такое, перечислив конкретные области:

Исследование и анализ данных.

  • Pandas; NumPy; SciPy; и стандартные библиотеки Python.

Визуализация данных. Здесь просто — Беру данные и превращаю их во что-то красочное.

  • Matplotlib; Seaborn; Datashader; другие.

Классическое машинное обучение. Концептуально, мы могли бы определить это как любую задачу обучения с учителем и буз, которая не является глубоким обучением(см. Ниже). Scikit-learn — это универсальный инструмент для реализации классификации, регрессии, кластеризации и уменьшения размерности, в то время как StatsModels разрабатывается менее активно, но все же обладает рядом полезных функций.

  • Scikit-Learn, StatsModels.

Глубокое обучение. Это подмножество машинного обучения, которое получило вторую жизнь и обычно реализуется с Keras, среди других библиотек.

  • Keras, TensorFlow и много других.

Хранение данных и фреймворки для больших данных. Большие данные лучше всего описать как данные, которые в буквальном смысле слишком велики для размещения на одной машине или не могут быть обработаны целиком. Привязки Python к технологиям Apache играют здесь большую роль.

  • Apache Spark; Apache Hadoop; HDFS; Даск; h5py / pytables.

Обработка. Включает подтемы, такие как обработка естественного языка и манипулирование изображениями с такими библиотеками, как OpenCV.

  • NLTK; Spacy; OpenCV / CV2; scikit-изображения; Cython.

В этом разделе собраны примеры и руководства по изучению Data science с использованием Python с нуля.

Это также поможет вам изучить основные методы анализа данных с использованием Python.

Python data course

Новое

Популярно сейчас