Курс Python → Очистка данных в Python

Для дальнейшей обработки данных в Python часто приходится выполнять различные манипуляции с датафреймами. Одним из способов очистки данных является удаление ненужных столбцов, создание новых столбцов на основе существующих данных или удаление строк, не соответствующих определенным условиям.

Например, если у нас есть датафрейм с несколькими столбцами, нам может потребоваться удалить столбцы с определенными именами. Для этого можно воспользоваться методом drop, указав нужные столбцы в параметре columns. Новый датафрейм с отброшенными столбцами будет возвращен в качестве результата.


new_df = df.drop(columns=['Id', 'Name']).copy()

Также часто требуется проверить значения в столбце на определенное условие и сохранить только те строки, которые соответствуют этому условию. Например, если мы хотим сохранить только строки, в которых значение столбца Type равно ‘frozen’ или ‘green’, можно воспользоваться логическим индексированием.


filtered_df = df[df['Type'].isin(['frozen', 'green'])].copy()

Таким образом, путем комбинации различных методов работы с датафреймами в Python можно эффективно очищать данные от ненужной информации и подготавливать их для дальнейшего анализа или использования.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Преобразование текста в речь с Python
  2. Замена переменных в Python
  3. Разрешение имен в Python
  4. Асинхронный код в Python
  5. Работа с JSON данными в Python
  6. Строковое представление объектов
  7. Множественное наследование в Python
  8. Отладка производительности Python
  9. Получение обратного списка чисел
  10. Работа с кортежами в Python
  11. Форматирование строк в Python
  12. Сортировка в Python
  13. Проверка типа данных
  14. Генераторные функции в Python
  15. Особенности запятых в Python
  16. Генераторы в Python
  17. Удаление URL-адресов в Python
  18. Выбор редактора кода.
  19. Бесконечные списки в Python
  20. Объединение словарей в Python
  21. Функция __init__ в Python
  22. Разбиение текста в Python
  23. Замена текста с re.sub()
  24. Возврат нескольких значений
  25. Контроль точности вывода чисел
  26. Декоратор Ajax required
  27. Работа с Requests для HTTP-запросов
  28. Асинхронное выполнение задач в Python
  29. Сортировка и разворот списка
  30. Сглаживание списка
  31. Работа с путями в Python
  32. Аннотации типов в Python
  33. Абстракции словарей и множеств в Python
  34. Установка и использование pyshorteners
  35. Блок else в Python
  36. Работа с множествами в Python
  37. Многострочные строки в Python
  38. Дефолтные параметры в Python
  39. Комментарии в Python.
  40. Множества и frozenset
  41. Печать в одной строке
  42. Поиск подстроки в строке
  43. Мониторинг работы программы Py-spy
  44. Преобразование списка в словарь через генератор
  45. Изменяемые и неизменяемые объекты
  46. Оператор морж в Python 3.8
  47. Работа с collections в Python.

Marketello читают маркетологи из крутых компаний