Курс Python → Очистка данных в Python

Для дальнейшей обработки данных в Python часто приходится выполнять различные манипуляции с датафреймами. Одним из способов очистки данных является удаление ненужных столбцов, создание новых столбцов на основе существующих данных или удаление строк, не соответствующих определенным условиям.

Например, если у нас есть датафрейм с несколькими столбцами, нам может потребоваться удалить столбцы с определенными именами. Для этого можно воспользоваться методом drop, указав нужные столбцы в параметре columns. Новый датафрейм с отброшенными столбцами будет возвращен в качестве результата.


new_df = df.drop(columns=['Id', 'Name']).copy()

Также часто требуется проверить значения в столбце на определенное условие и сохранить только те строки, которые соответствуют этому условию. Например, если мы хотим сохранить только строки, в которых значение столбца Type равно ‘frozen’ или ‘green’, можно воспользоваться логическим индексированием.


filtered_df = df[df['Type'].isin(['frozen', 'green'])].copy()

Таким образом, путем комбинации различных методов работы с датафреймами в Python можно эффективно очищать данные от ненужной информации и подготавливать их для дальнейшего анализа или использования.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Деление в Python
  2. Оператор морж в Python 3.8
  3. Запуск внешнего кода в Jupyter
  4. Замена текста с помощью sub
  5. Создание обратного итератора
  6. Метод setdefault() в Python
  7. Принцип одной функции
  8. Библиотека sh: использование команд bash в Python
  9. Проверка вхождения подстроки
  10. Блок try-except-else
  11. Разделение строк в Python
  12. Проверка на истинность объектов в Python
  13. Проектирование Singleton с метаклассом
  14. Искажение имен в Python
  15. Извлечение аудио из видео
  16. Модуль array: создание и использование массивов
  17. Python: отсутствие точек с запятыми
  18. Метод split() в Python
  19. Иерархия классов в Python
  20. Работа с модулем random
  21. Переворот списка в Python
  22. Вложенные генераторы в Python
  23. Оценка выражений генератора в Python
  24. Экспорт данных с помощью writefile
  25. Цикл while в Python
  26. Передача словаря через **kwargs
  27. Python itertools combinations() — группировка элементов
  28. Логирование в Python
  29. Метод get для словаря
  30. Переопределение метода __eq__
  31. Генерация чисел с range()
  32. Сортировка в Python
  33. Функция product() в Python
  34. Срезы в Python
  35. Вывод букв строки в Python
  36. Символ подчеркивания в Python
  37. Непрерывная проверка в Python
  38. Освобождение памяти в Python
  39. Логирование с Logzero
  40. Профилирование с Pandas
  41. Именование столбцов в Python с pandas
  42. Функция rsplit() в Python
  43. Анонимные функции в Python
  44. Переопределение метода
  45. Метод __iand__ для пользовательских классов
  46. F-строки в Python
  47. Обработка аргументов Python

Marketello читают маркетологи из крутых компаний