Превращение сырых данных в знания

572

Еще один важный момент — сфера компетенции данных. Ее источник — биология, физика, финансы, испытания материалов, статистика населения и т. д. На самом деле, пусть у аналитиков есть подготовка в области статистики, они должны уметь задокументировать источник данных. Это помогает лучше понимать механизмы, которые их сгенерировали.

Данные — это не просто строки или цифры. Они являются выражениями или измерениями наблюдаемых параметров. Таким образом лучшее понимание источника данных может улучшить качество интерпретации. Но часто это дорого обходится, поэтому куда практичнее найти консультантов или ключевых фигур. Им можно задать правильные вопросы.

Понимание природы данных

Объект исследования анализа данных — это, собственно, данные. Они — ключевой игрок во всех процессах. Представляют собой сырой материал для обработки. Благодаря этому процессу и анализу появляется возможность извлекать разную информацию, чтобы увеличить уровень знаний изучаемой системы — той, которая является источником данных.

Когда данные становятся информацией

Данные — события, произошедшие в мире.

Все, что можно категоризировать и измерить, можно и конвертировать в данные.

После сбора их изучают и анализируют, чтобы понять природу событий и, в большинстве случаев, сделать прогнозы или хотя бы принять осмысленные решения.

Когда информация становится знанием

О знании можно говорить тогда, когда информация превращается в набор правил, которые помогают лучше понимать определенные механизмы и таким образом делать предсказания о развитии определенных событий.

Тест на знание python

Что вернет следующий код?
Как нельзя назвать функцию?
Какой будет результат выполнения кода — print(+-1) ?
Если выполнить код ниже, каков будет результат?
Какой будет результат выполнения этого кода?
Александр
Я создал этот блог в 2018 году, чтобы распространять полезные учебные материалы, документации и уроки на русском. На сайте опубликовано множество статей по основам python и библиотекам, уроков для начинающих и примеров написания программ. Пишу на популярные темы: веб-разработка, работа с базами данных, data sciense и другие...