Курс Python → Обработка данных в Python

Для дальнейшей обработки данных в Python существует несколько методов, которые позволяют очистить данные от лишней информации и подготовить их для анализа. Один из таких методов — отбрасывание ненужных столбцов в датафрейме. Например, если у нас есть датафрейм с данными и нам не нужны столбцы с именами Id и Name, мы можем использовать метод drop() для удаления этих столбцов и создания новой копии датафрейма.


import pandas as pd

# Создаем датафрейм df с данными
df = pd.DataFrame({'Id': [1, 2, 3],
                   'Name': ['Alice', 'Bob', 'Charlie'],
                   'Age': [25, 30, 35]})

# Отбрасываем столбцы Id и Name
new_df = df.drop(['Id', 'Name'], axis=1)
print(new_df)

Еще один способ обработки данных — фильтрация строк по определенному условию. Например, если мы хотим оставить только те строки, где значение в столбце Type равно ‘frozen’ или ‘green’, мы можем использовать метод loc[] для фильтрации данных и сохранения только нужных строк.


# Фильтруем строки по значению столбца Type
filtered_df = df.loc[df['Type'].isin(['frozen', 'green'])]
print(filtered_df)

Таким образом, обработка данных в Python включает в себя различные методы работы с датафреймами, такие как удаление столбцов, создание новых столбцов из существующих данных и фильтрация строк по определенным условиям. Эти методы позволяют подготовить данные для дальнейшего анализа и обработки в вашем проекте.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Оптимизация памяти в Python
  2. Определение объема памяти объекта
  3. Транспонирование 2D-массива с помощью zip
  4. Функции range() в Python
  5. Python union() функция — объединение множеств
  6. Стать Python-разработчиком
  7. Повторение элементов в Python
  8. Работа с getopt
  9. Лямбда-функции в Python
  10. Подписка на SelectelNews в Twitter
  11. Профилирование кода
  12. Метод __complex__ в Python
  13. Enum в Python
  14. Объединение словарей в Python
  15. Операции с кортежами
  16. Проверка запуска скрипта или импорта модуля
  17. Настройка Cron
  18. Протокол управления контекстом
  19. Метод get() для словарей
  20. Работа с комплексными числами
  21. Объединение строк с помощью метода join
  22. Контекстный менеджер в Python
  23. Поиск подстроки в строке
  24. Типы возвращаемых значений в Python
  25. Множественное наследование в Python
  26. Использование *args
  27. Оператор del в Python
  28. Создание списка через цикл
  29. Работа с контекстными менеджерами
  30. Защита данных в Python
  31. Сокращение ссылок с pyshorteners
  32. Python reversed() функция
  33. Метод __index__ в Python
  34. Преобразование текста в нижний регистр
  35. Обработка ошибок ввода данных
  36. Кортежи в Python: особенности и преимущества
  37. Декораторы в Python
  38. Получение частей дроби
  39. Модуль itertools: эффективная работа с итераторами
  40. Проверка надежности пароля на Python
  41. Python-dateutil — работа с датами
  42. Генератор чисел Фибоначчи
  43. Моржовый оператор в Python 3.8
  44. Транспонирование 2D-массива с помощью zip
  45. Чтение и запись TOML-конфигов
  46. Добавление элементов в список

Marketello читают маркетологи из крутых компаний