Курс Python → Очистка данных в Python

Для дальнейшей обработки данных в Python часто приходится выполнять различные манипуляции с датафреймами. Одним из способов очистки данных является удаление ненужных столбцов, создание новых столбцов на основе существующих данных или удаление строк, не соответствующих определенным условиям.

Например, если у нас есть датафрейм с несколькими столбцами, нам может потребоваться удалить столбцы с определенными именами. Для этого можно воспользоваться методом drop, указав нужные столбцы в параметре columns. Новый датафрейм с отброшенными столбцами будет возвращен в качестве результата.


new_df = df.drop(columns=['Id', 'Name']).copy()

Также часто требуется проверить значения в столбце на определенное условие и сохранить только те строки, которые соответствуют этому условию. Например, если мы хотим сохранить только строки, в которых значение столбца Type равно ‘frozen’ или ‘green’, можно воспользоваться логическим индексированием.


filtered_df = df[df['Type'].isin(['frozen', 'green'])].copy()

Таким образом, путем комбинации различных методов работы с датафреймами в Python можно эффективно очищать данные от ненужной информации и подготавливать их для дальнейшего анализа или использования.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Генераторы в Python
  2. Удаление дубликатов из списка
  3. Игра Виселица на Python
  4. Конкатенация строк в Python
  5. Работа с URL-адресами в Python
  6. Профилирование данных с Pandas
  7. Получение идентификатора объекта в памяти
  8. Доступ к локальным переменным
  9. Работа с аргументами командной строки
  10. Объявление переменных в Python
  11. PUT запрос для обновления данных
  12. Генераторы в Python
  13. Работа со строками
  14. Работа с контекстным менеджером Pool
  15. Сортировка с помощью key
  16. Проверка элементов списка условием
  17. Разделение списка на гнппы
  18. Параллельные вычисления в Python
  19. Проверка условий в Python
  20. Удаление первого элемента списка
  21. Удаление и повторная вставка ключа в OrderedDict
  22. Генераторы данных
  23. Многострочные комментарии в Python
  24. Метод __iand__ для пользовательских классов
  25. Установка и использование howdoi
  26. Получение размера объекта с sys.getsizeof()
  27. Python groupby() из itertools: работа с повторяющимися элементами
  28. Метод join() для объединения элементов в строку.
  29. Перевод эмодзи и эмотиконов.
  30. Метод pos в Python
  31. Преобразование списка в словарь через генератор
  32. Декораторы в Python
  33. Создание .exe файла с pyinstaller
  34. Установка и использование Python-dateutil
  35. Добавление элемента к кортежу
  36. Работа с WindowsPath()
  37. Модуль os: работа с файлами и папками
  38. Работа с zip-архивами в Python
  39. Исключение NotImplementedError
  40. Получение текущей директории
  41. Python UserString — создание подклассов строк
  42. Создание именованных кортежей в Python
  43. Метод join() для объединения элементов строки
  44. Управление контекстом с помощью декоратора contextmanager
  45. Список методов и атрибутов
  46. Счетчик в Python: most_common()

Marketello читают маркетологи из крутых компаний