Курс Python → Обработка данных в Python

Для дальнейшей обработки данных в Python существует несколько методов, которые позволяют очистить данные от лишней информации и подготовить их для анализа. Один из таких методов — отбрасывание ненужных столбцов в датафрейме. Например, если у нас есть датафрейм с данными и нам не нужны столбцы с именами Id и Name, мы можем использовать метод drop() для удаления этих столбцов и создания новой копии датафрейма.


import pandas as pd

# Создаем датафрейм df с данными
df = pd.DataFrame({'Id': [1, 2, 3],
                   'Name': ['Alice', 'Bob', 'Charlie'],
                   'Age': [25, 30, 35]})

# Отбрасываем столбцы Id и Name
new_df = df.drop(['Id', 'Name'], axis=1)
print(new_df)

Еще один способ обработки данных — фильтрация строк по определенному условию. Например, если мы хотим оставить только те строки, где значение в столбце Type равно ‘frozen’ или ‘green’, мы можем использовать метод loc[] для фильтрации данных и сохранения только нужных строк.


# Фильтруем строки по значению столбца Type
filtered_df = df.loc[df['Type'].isin(['frozen', 'green'])]
print(filtered_df)

Таким образом, обработка данных в Python включает в себя различные методы работы с датафреймами, такие как удаление столбцов, создание новых столбцов из существующих данных и фильтрация строк по определенным условиям. Эти методы позволяют подготовить данные для дальнейшего анализа и обработки в вашем проекте.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Работа с deque из collections
  2. Анализ текста на русском языке с помощью Pymystem3
  3. Установка библиотек в Python
  4. Преобразование данных в Python
  5. Логирование в Python
  6. Создание комплексных чисел
  7. Получение значений из словарей
  8. Переворот строки с использованием цикла
  9. Явный импорт в Python
  10. Фильтрация списка от «ложных» значений
  11. Измерение времени выполнения кода
  12. Подсказки при вводе данных в Python
  13. Замена подстроки
  14. Работа с массивами в Numpy
  15. Эффективная конкатенация строк в Python
  16. Получение ID процесса
  17. Отладка утечек памяти в Python
  18. TON Smart Challenge #2: участие и подготовка
  19. Оператор is в Python
  20. Python и Монти Пайтон
  21. Срезы в Numpy
  22. Удаление ресурса в Python
  23. Генераторы в Python
  24. Измерение времени выполнения кода
  25. Модуль Operator в Python
  26. Импортирование в Python
  27. Лямбда-функции в Python
  28. Поиск самого длинного слова в списке с использованием max()
  29. Оператор break в Python
  30. Сериализация данных в JSON с помощью json.dumps
  31. Работа с множествами в Python
  32. Печать списка с помощью метода join
  33. Обработка исключений в Python 3
  34. Переопределение метода __rshift__
  35. Проверка существования переменной с оператором :=
  36. Округление чисел с помощью round
  37. Генерация строк с .join()
  38. Создание словаря с значением по умолчанию
  39. TypedDict для kwargs в Python 3.12
  40. Необязательные аргументы в Python
  41. Перезагрузка оператора в Python
  42. Генераторы в Python
  43. Python: изменяемые и неизменяемые коллекции
  44. Структура данных deque в Python
  45. Объединение списков в строку
  46. Подписка на @SelectelNews

Marketello читают маркетологи из крутых компаний