#7 Python для Data Science — основы синтаксиса Python

Для новичков в программировании синтаксис оказывается одной из самых сложных вещей. Он очень строг и может казаться противоречивым. Поэтому в этом материале собраны основы синтаксиса Python, которые важны даже для профессионалов. Здесь же упомянуты лучшие практики форматирования, которые помогут делать код опрятным.

Это основы. Ссылки на более сложные вещи будут в конце материала.

3 важных правила о синтаксисе Python

#1. Разрывы строк имеют значение

В отличие от SQL, в Python разрывы имеют значение. В 99% случаев если добавить разрыв туда, где его быть не должно, появится ошибка. Странно? Зато точку с запятой в конце каждой строки добавлять не нужно.

Поэтому вот правило №1 в Python: одно выражение на строку.

Есть и исключения. Выражения могут быть разбиты на несколько строк, если они записаны:

  • в скобках (например, функции или методы),
  • в квадратных скобках (например, списки),
  • в фигурных скобках (например, словари).

Это называется неявным объединением строк и очень помогает при работе с более крупными структурами данных.

Неявное объединение строк

Также можно разбивать любое выражение на несколько строк, если написать обратную черту (\) в конце строки. Обратное также допустимо — ввести несколько выражений на одной строке, добавляя точку с запятой (;) после каждого. Но эти способы не используются слишком часто. Применять их нужно только при сильной необходимости. (Например, с выражениями, которые состоят из более чем 80 символов).

одна строка — много выражений

одно выражение на несколько строк

#2. Отступы важны

Ненавидите отступы? Вы не одиноки в этом. Многие начинающие Python-программисты не любят это понятие. У людей, которые только знакомятся с азами программирования, именно из-за отступов возникает больше всего ошибок в коде. Но вы привыкнете. А если ответственно проходили примеры из прошлых частей руководства, то, возможно, уже привыкли.

Зачем нужны отступы? Простыми словами, это способ показать, какие части кода связаны между собой — например, где начало и конец инструкции if или цикла for. В других языках, где отступов нет, для этих целей используются другие методы: в Javascript блоки кода окружают дополнительные скобки, а в bash — ключевые слова. В Python используются отступы и по мнению многих — это самый элегантный способ решения проблемы.

И это правило №2 в Python: убедитесь, что используете отступы правильно и последовательно.

Примечание: об этих же правилах речь шла в руководствах, посвященных циклам for и инструкциям if.

В Python используются отступы

И вот еще: если вы смотрели сериал «Кремниевая долина», то наверняка слышали о споре «отступы против пробелов»:

Так отступы или пробелы? Вот что говорится в Руководстве по стилю Python:

Табы или пробелы?
Пробелы являются предпочтительным методом отступа.
Табы должны использоваться исключительно для соответствия с кодом, который уже имеет отступы табуляцией.

Все понятно!

#3. Чувствительность к регистру

Python чувствителен к регистру. Есть разница в том, чтоб ввести and (правильно) или AND (не сработает). Как показывает практика, большинство ключевых слов в Python пишутся с маленькой буквы. Известное исключение (из-за которого у многих новичков возникают проблемы) — булевы значения. Их нужно вводить только так: True и False. (Не TRUE или true).

Правило №3 в Python: Python чувствителен к регистру.

Другие практики Python

Есть и другие необязательные особенности Python, которые сделают код более приятным и читаемым.

1. Используйте комментарии

В код Python можно добавлять комментарии. Для этого нужно всего лишь добавить символ #. Все, что будет написано после символа #, не исполнится.

# Это комментарий перед циклом for.
for i in range(0, 100, 2):
    print(i)

#2. Названия переменных

Традиционно переменные нужно писать буквами в нижнем регистре, разделяя их символами нижнего подчеркивания (_). Также не рекомендуется использовать переменные длиной в один символ. Понятные и легко различимые переменные помогают и другим программистам, когда те разбираются в вашем коде.

my_meaningful_variable = 100

#3. Используйте пустые строки

Если вы хотите визуально разделить блоки кода (например, есть скрипт на 100 строк, состоящий из 10-12 блоков), используйте пустые строки. Или даже несколько. Это никак не повлияет на сам код.

Используйте пустые строки

#4. Добавляйте пробелы вокруг операторов и оператора присваивания

Чтобы получить более чистый код, рекомендуется использовать пробелы вокруг знаков =, математических и операторов сравнения (>, <, +, - и так далее). Без этих пробелов код все равно будет работать: но чем он чище, тем проще его читать и тем проще использовать повторно.

number_x = 10
number_y = 100
number_mult = number_x * number_y

#5. Максимальная длина строки — 79 символов

Если в вашей строке больше 79 символов, рекомендуется разбить код на несколько с помощью знака \. Python его проигнорирует и прочитает так, будто бы это одна строка.
(В некоторых же случаях можно использовать неявное объединение строк).

одно выражение на несколько строк


#6. Будьте последовательны

Одно из самых важных правил — оставайтесь последовательны. Даже если всегда следовать правилам выше, в определенных ситуациях придется придумывать собственные. Главное — неукоснительно придерживаться уже их. При идеальном сценарии спустя 6 месяцев вы откроете код и быстро поймете, для чего он нужен. Если вы будете без причины менять правила оформления или способ именования переменных, создадите ненужную головную боль для будущего себя.

Дзен Python — приятное пасхальное яйцо

Что еще могло бы быть в конце этой статьи, как не пасхальное яйцо?

Если ввести import this в Jupyter Notebook, то выведутся 19 «заповедей» Python:

>>> import this
The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!

Используйте их с умом!

Выводы

Следуйте этим советам, а если хотите узнать еще больше о синтаксисе Python и лучших практиках, обратитесь к следующим материалам:

В последней части речь пойдет о библиотеках Python.