Главная Теги Pandas

Тема: Pandas

Функция Pandas value_counts() — количество каждого значения в колонке

8 примеров использования value_counts из Pandas

Прежде чем начинать работать над проектом, связанным с данными, нужно посмотреть на набор данных. Разведочный анализ данных (EDA) — очень важный этап,...
Чтение и запись файлов Excel (XLSX) в Python

Чтение и запись файлов Excel (XLSX) в Python

Pandas можно использовать для чтения и записи файлов Excel с помощью Python. Это работает по аналогии с другими форматами. В этом материале...
Трансформация данных в pandas ч.2 / pd 12

Трансформация данных в pandas ч.2 / pd 12

Манипуляция строками Python — это популярный язык, который благодаря своей простоте часто используется для обработки строк и текста. Большая часть операций может быть выполнена даже...
Трансформация данных в pandas ч.1 / pd 11

Трансформация данных в pandas ч.1 / pd 11

Процесс подготовки данных для анализа включает сборку данных в Dataframe с возможными добавлениями из других объектов и удалением ненужных частей. Следующий этап — трансформация....
Подготовка данных в pandas / pd 10

Подготовка данных в pandas / pd 10

Прежде чем приступать к работе с данными, их нужно подготовить и собрать в виде структуры, так чтобы они поддавались обработке с помощью инструментов из...
Pickle — сериализация объектов Python / pd 9

Pickle — сериализация объектов Python / pd 9

Модуль pickle предоставляет мощный алгоритм сериализации и десериализации структур данных Python. Pickling — это процесс, при котором иерархия объекта конвертируется в поток байтов. Это позволяет...
# Чтение и запись данных 2 (Excel, Json, SQL, MongoDB) / pd 8

Чтение и запись данных (Excel, Json, SQL, MongoDB) / pd 8

Чтение и запись в файлы Microsoft Excel Данные очень легко читать из файлов CSV, но они часто хранятся в табличной форме в формате Excel. pandas предоставляет...
Чтение и запись данных (cvs, txt, HTML, XML)

Чтение и запись данных (cvs, txt, HTML, XML) / pd 7

Вы уже знакомы с библиотекой pandas и ее базовой функциональностью по анализу данных. Также знаете, что в ее основе лежат два типа данных: Dataframe...
Иерархическое индексирование и уровни признаков / pd 6

Иерархическое индексирование и уровни признаков / pd 6

Иерархическое индексирование — это важная особенность pandas, поскольку она позволяет иметь несколько уровней индексов в одной оси. С ее помощью можно работать с данными...
Not a Number — все о NaN / pd 5

Not a Number — все о NaN / pd 5

В предыдущих разделах вы видели, как легко могут образовываться недостающие данные. В структурах они определяются как значения NaN (Not a Value). Такой тип довольно...

Библиотека python Pandas — высокоуровневый инструмент управления данными разработанный Уэсом МакКинни. Это надстройка библиотеки Numpy, и его ключевая структура данных называется DataFrame. DataFrames позволяют хранить и манипулировать табличными данными в строках наблюдений и столбцах переменных.

Мы собрали все примеры и уроки по Pandas в этом разделе.

Новое