Курс Python → Очистка данных в Python

Для дальнейшей обработки данных в Python часто приходится выполнять различные манипуляции с датафреймами. Одним из способов очистки данных является удаление ненужных столбцов, создание новых столбцов на основе существующих данных или удаление строк, не соответствующих определенным условиям.

Например, если у нас есть датафрейм с несколькими столбцами, нам может потребоваться удалить столбцы с определенными именами. Для этого можно воспользоваться методом drop, указав нужные столбцы в параметре columns. Новый датафрейм с отброшенными столбцами будет возвращен в качестве результата.


new_df = df.drop(columns=['Id', 'Name']).copy()

Также часто требуется проверить значения в столбце на определенное условие и сохранить только те строки, которые соответствуют этому условию. Например, если мы хотим сохранить только строки, в которых значение столбца Type равно ‘frozen’ или ‘green’, можно воспользоваться логическим индексированием.


filtered_df = df[df['Type'].isin(['frozen', 'green'])].copy()

Таким образом, путем комбинации различных методов работы с датафреймами в Python можно эффективно очищать данные от ненужной информации и подготавливать их для дальнейшего анализа или использования.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Протокол управления контекстом
  2. Руководство по использованию Colorama
  3. Оператор in и not in в Python
  4. Метод join для наборов
  5. Monkey Patching в Python
  6. Оператор распаковки в Python
  7. Оптимизация параметров в Python
  8. Запрос пароля с помощью getpass
  9. Расчет времени выполнения
  10. Метод join() для объединения элементов в строку.
  11. Атрибуты массивов в Numpy
  12. Объединение Python и Shell
  13. Работа с асинхронными задачами в Python
  14. Метод сравнения объектов в Python
  15. Область видимости переменных в Python
  16. Поиск наиболее частого элемента
  17. Работа с коллекциями Python
  18. Оператор += для объединения строк
  19. Измерение времени выполнения кода
  20. Комментарии в Python
  21. Переопределение метода __pow__
  22. Анонимные функции в Python
  23. Доступ к локальным переменным
  24. Работа с буфером обмена на Python
  25. Python Метод sleep() из time
  26. Обратный список чисел
  27. Освобождение памяти в Python
  28. Установка и использование библиотеки google
  29. Удаление пробелов методом translate()
  30. Numpy: разбиение массивов
  31. Лямбда-функции в Python
  32. Использование двоеточия в Python
  33. Замена подстроки
  34. Оценка выражений генератора в Python
  35. Явный импорт переменных
  36. Работа с файлами и директориями в Python.
  37. Выборка чисел
  38. ChainMap избыточные ключи
  39. Переворот строки с использованием цикла
  40. Множественное назначение в Python
  41. Отправка HTTP-запросов с User-Agent
  42. Оптимизация памяти в Python
  43. Функция rsplit() в Python
  44. Работа с кортежами
  45. Оператор Walrus в Python 3.8

Marketello читают маркетологи из крутых компаний