10 лучших строковых методов в Pandas

Pandas Изучение

Pandas — это библиотека Python с открытым исходным кодом, которая в основном используется для манипулирования данными и широко популярна в областях машинного обучения и науки о данных. В этой статье мы изучим различные строковые методы, которые может предложить библиотека Pandas.

Библиотека Pandas очень полезна для манипулирования строками, поскольку она предоставляет нам различные удобные строковые методы. Это экономит время и делает нашу программу эффективной. Теперь давайте познакомимся с различными строковыми методами, которые может предложить библиотека Pandas.

Метод Описание
1) upper() Преобразует строку в верхний регистр
2) lower() Преобразует строку в нижний регистр
3) isupper() Проверяет, является ли символ заглавным или нет
4) islower() Проверяет, является ли символ строчным или нет
5) len() Определяет длину строки.
6) startswith() Возвращает true, если элемент начинается с шаблона
7) split() Разбивает строку по определенному индексу или символу
8) find() Возвращает индекс, по которому найдена данная строка
9) strip() Удаляет пробелы из каждой строки с обеих сторон.
10) replace() Заменяет часть строки другой.

В связи с тем, что вы поняли приведенные выше строковые методы, предоставляемые Pandas, давайте теперь продолжим с несколькими примерами, в которых используются вышеуказанные методы.

Мы будем использовать приведенный ниже фрейм данных для иллюстрации.

Python3

import pandas as pd
sports = pd.Series(['Virat', 'azam', 'fiNch', 'ShakiB', 'STOKES', 'KAne'])
print(sports)

Вывод:

0     Virat
1      azam
2     fiNch
3    ShakiB
4    STOKES
5      KAne
dtype: object

1.) DataFrame.upper()

Преобразуйте каждую строку в верхний регистр.

Python3

print("Upper Case:")
print(s.str.upper())

Вывод:

Upper Case:
0     VIRAT
1      AZAM
2     FINCH
3    SHAKIB
4    STOKES
5      KANE
dtype: object

2.) DataFrame.lower()

Преобразуйте каждую строку в нижний регистр.

Читайте также:  Web3: новая сеть для нового мира

Python3

print("Lower Case:")
print(s.str.lower())

Вывод:

Lower Case:
0     virat
1      azam
2     finch
3    shakib
4    stokes
5      kane
dtype: object

3.) DataFrame.isupper()

Он возвращает логические значения в зависимости от того, находится ли каждый символ в строке в верхнем регистре или нет.

Python3

print("Checks whether string is in Upper Case:")
print(s.str.isupper())

Вывод:

Checks whether string is in Upper Case:
0    False
1    False
2    False
3    False
4     True
5    False
dtype: bool

4.) DataFrame.islower()

Он возвращает логические значения в зависимости от того, находится ли каждый символ в строке в нижнем регистре или нет.

Python3

print("Checks whether string is in Lower Case:")
print(s.str.islower())

Вывод:

Checks whether string is in Lower Case:
0    False
1     True
2    False
3    False
4    False
5    False
dtype: bool

5.) DataFrame.len()

Эта функция возвращает длину каждой строки.

Python3

print("Length of strings:")
print(s.str.len())

Вывод:

Length of strings:
0    5
1    4
2    5
3    6
4    6
5    4
dtype: int64

6.) DataFrame.startswith()

Он возвращает логические значения в зависимости от того, начинается ли строка с определенной последовательности символов или нет.

Python3

print("Checks whether string starts with certain substring:")
print(s.str.startswith('a'))

Вывод:

Checks whether string is numeric:
0    False
1    False
2    False
3    False
4    False
5    False
dtype: bool

7.) DataFrame.split()

Эта функция помогает разбить строку сразу по определенному символу или символам.

Python3

print("Splits string by character 'a':")
print(s.str.split('a'))

Вывод:

Checks whether string is numeric:
0     [Vir, t]
1     [, z, m]
2      [fiNch]
3    [Sh, kiB]
4     [STOKES]
5       [KAne]
dtype: object

8.) DataFrame.find()

Эта функция находит индекс вхождения определенной последовательности символов.

Python3

print("Find the index of the searched character or substring:")
print(s.str.find('a'))

Вывод:

Find the index of the searched character or substring:
0    3
1    0
2   -1
3    2
4   -1
5   -1
dtype: int64

9.) DataFrame.strip()

Это помогает удалить лишние конечные пробелы в начале и в конце.

Читайте также:  Тенденции UI и UX-дизайна в 2022 году

Python3

print("Remove extra space from the starting and the end of the string:")
print(s.str.strip())

Вывод:

Remove extra space from the starting and the end of the string:
0     Virat
1      azam
2     fiNch
3    ShakiB
4    STOKES
5      KAne
dtype: object

10.) DataFrame.replace()

Эта функция помогает иногда удалять определенные последовательности символов, которые присутствуют во всех строках и являются нежелательными.

Python3

print("Replace a particular substring by desired pattern:")
print(s.str.replace('a', ''))

Вывод:

Замените определенную подстроку желаемым шаблоном:

Replace a particular substring by desired pattern:
0      Virt
1        zm
2     fiNch
3     ShkiB
4    STOKES
5      KAne
dtype: object

Оцените статью
bestprogrammer.ru
Добавить комментарий

Adblock
detector