Курс Python → Очистка данных в Python

Для дальнейшей обработки данных в Python часто приходится выполнять различные манипуляции с датафреймами. Одним из способов очистки данных является удаление ненужных столбцов, создание новых столбцов на основе существующих данных или удаление строк, не соответствующих определенным условиям.

Например, если у нас есть датафрейм с несколькими столбцами, нам может потребоваться удалить столбцы с определенными именами. Для этого можно воспользоваться методом drop, указав нужные столбцы в параметре columns. Новый датафрейм с отброшенными столбцами будет возвращен в качестве результата.


new_df = df.drop(columns=['Id', 'Name']).copy()

Также часто требуется проверить значения в столбце на определенное условие и сохранить только те строки, которые соответствуют этому условию. Например, если мы хотим сохранить только строки, в которых значение столбца Type равно ‘frozen’ или ‘green’, можно воспользоваться логическим индексированием.


filtered_df = df[df['Type'].isin(['frozen', 'green'])].copy()

Таким образом, путем комбинации различных методов работы с датафреймами в Python можно эффективно очищать данные от ненужной информации и подготавливать их для дальнейшего анализа или использования.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Сортировка и разворот списка
  2. Область видимости переменных в Python
  3. Метод сравнения объектов в Python
  4. Сравнение объектов в Python
  5. Цикл for в Python
  6. Обработка ошибок в Python
  7. IPython и Jupyter Notebook: руководство
  8. Преобразование списка в словарь через генератор
  9. Удаление дубликатов в pandas
  10. UserList в Python: Описание и примеры использования
  11. Оптимизация гиперпараметров в Python
  12. Создание и операции с дробями
  13. Конкатенация списков в Python
  14. Метод classmethod
  15. Объединение, распаковка и деструктуризация
  16. Виртуальное окружение Python
  17. Шаблоны и наследование в Flask
  18. Библиотека sh: удобные команды терминала
  19. Метод count в Python: почему count(», ») возвращает 4?
  20. Лямбда-функции в Python
  21. Таймер обратного отсчета
  22. Использование эмодзи в Python
  23. Работа с Colorama
  24. Библиотека sh: использование команд bash в Python
  25. Импорт модулей в Python 3.12
  26. Скрытие вывода данных
  27. Использование функции enumerate()
  28. Конвертация текстовых чисел с помощью Numerizer
  29. Создание коллекций из выражения-генератора
  30. Замеры производительности в Python
  31. Группировка элементов Python
  32. Расчет времени выполнения кода
  33. Создание словаря через dict comprehension
  34. Перезапуск ячейки в Jupyter Notebook с dostoevsky
  35. Оператор (*) в Python
  36. Профилирование с cProfile
  37. Оператор Walrus в Python 3.8
  38. Операции с числами в Python
  39. Работа с collections.Counter
  40. Подсказки при вводе данных в Python
  41. Многоточие в Python
  42. Метод repr() в Python
  43. Проверка переменных окружения в Python

Marketello читают маркетологи из крутых компаний