Курс Python → Очистка данных в Python

Для дальнейшей обработки данных в Python часто приходится выполнять различные манипуляции с датафреймами. Одним из способов очистки данных является удаление ненужных столбцов, создание новых столбцов на основе существующих данных или удаление строк, не соответствующих определенным условиям.

Например, если у нас есть датафрейм с несколькими столбцами, нам может потребоваться удалить столбцы с определенными именами. Для этого можно воспользоваться методом drop, указав нужные столбцы в параметре columns. Новый датафрейм с отброшенными столбцами будет возвращен в качестве результата.


new_df = df.drop(columns=['Id', 'Name']).copy()

Также часто требуется проверить значения в столбце на определенное условие и сохранить только те строки, которые соответствуют этому условию. Например, если мы хотим сохранить только строки, в которых значение столбца Type равно ‘frozen’ или ‘green’, можно воспользоваться логическим индексированием.


filtered_df = df[df['Type'].isin(['frozen', 'green'])].copy()

Таким образом, путем комбинации различных методов работы с датафреймами в Python можно эффективно очищать данные от ненужной информации и подготавливать их для дальнейшего анализа или использования.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Методы обработки строк в Python
  2. Оптимизация строк в Python
  3. Работа с модулем glob в Python
  4. Особенности множеств в Python
  5. Библиотека itertools: объединение списков
  6. Python reversed() функция
  7. Игра «Угадывание чисел»
  8. Поиск HTML-элементов с BeautifulSoup
  9. Управление мышью и клавиатурой с Pyautogui
  10. Обновление шаблона base.html
  11. Подсказки при вводе данных в Python
  12. Проверка на истинность объектов в Python
  13. Выбор редактора кода.
  14. Python Тесты и Гайды
  15. Сравнение строк в Python
  16. Цикл while в Python
  17. Создание списка через цикл
  18. Создание графики с черепахой
  19. Реверс строки в Python
  20. Concrete Paths в Python
  21. Импорт объектов из модулей
  22. Метод setitem в Python
  23. Принципы Zen of Python
  24. Многострочные строки в Python
  25. Python Calendar Usage
  26. Синхронизация потоков с time.sleep()
  27. Удаление первого элемента списка
  28. Извлечение аудио из видео
  29. Создание словарей в Python
  30. Сравнение def и lambda в Python
  31. Принципы LSP и ISP в Python
  32. Избегайте использования goto
  33. Использование функции enumerate()
  34. Простой калькулятор Python
  35. Цикл for в Python
  36. Оператор continue в Python
  37. Работа с срезами в Numpy
  38. Утечки переменных цикла в Python 3.x
  39. Импорт с альтернативным именем
  40. 9 уловок для чистого кода
  41. Проектирование Singleton с метаклассом
  42. Обмен данными с asyncio.Queue
  43. Генерация чисел с range()
  44. Python Translator: создание локальных переводчиков
  45. Проверка элементов списка условием
  46. Сортировка в Python
  47. Присвоение значений переменным в Python

Marketello читают маркетологи из крутых компаний