Pandas — это библиотека Python с открытым исходным кодом, которая в основном используется для манипулирования данными и широко популярна в областях машинного обучения и науки о данных. В этой статье мы изучим различные строковые методы, которые может предложить библиотека Pandas.
Библиотека Pandas очень полезна для манипулирования строками, поскольку она предоставляет нам различные удобные строковые методы. Это экономит время и делает нашу программу эффективной. Теперь давайте познакомимся с различными строковыми методами, которые может предложить библиотека Pandas.
Метод | Описание | |
1) | upper() | Преобразует строку в верхний регистр |
2) | lower() | Преобразует строку в нижний регистр |
3) | isupper() | Проверяет, является ли символ заглавным или нет |
4) | islower() | Проверяет, является ли символ строчным или нет |
5) | len() | Определяет длину строки. |
6) | startswith() | Возвращает true, если элемент начинается с шаблона |
7) | split() | Разбивает строку по определенному индексу или символу |
8) | find() | Возвращает индекс, по которому найдена данная строка |
9) | strip() | Удаляет пробелы из каждой строки с обеих сторон. |
10) | replace() | Заменяет часть строки другой. |
В связи с тем, что вы поняли приведенные выше строковые методы, предоставляемые Pandas, давайте теперь продолжим с несколькими примерами, в которых используются вышеуказанные методы.
Мы будем использовать приведенный ниже фрейм данных для иллюстрации.
Python3
import
pandas as pd
sports
=
pd.Series([
'Virat'
,
'azam'
,
'fiNch'
,
'ShakiB'
,
'STOKES'
,
'KAne'
])
(sports)
Вывод:
0 Virat 1 azam 2 fiNch 3 ShakiB 4 STOKES 5 KAne dtype: object
1.) DataFrame.upper()
Преобразуйте каждую строку в верхний регистр.
Python3
(
"Upper Case:"
)
(s.
str
.upper())
Вывод:
Upper Case: 0 VIRAT 1 AZAM 2 FINCH 3 SHAKIB 4 STOKES 5 KANE dtype: object
2.) DataFrame.lower()
Преобразуйте каждую строку в нижний регистр.
Python3
(
"Lower Case:"
)
(s.
str
.lower())
Вывод:
Lower Case: 0 virat 1 azam 2 finch 3 shakib 4 stokes 5 kane dtype: object
3.) DataFrame.isupper()
Он возвращает логические значения в зависимости от того, находится ли каждый символ в строке в верхнем регистре или нет.
Python3
(
"Checks whether string is in Upper Case:"
)
(s.
str
.isupper())
Вывод:
Checks whether string is in Upper Case: 0 False 1 False 2 False 3 False 4 True 5 False dtype: bool
4.) DataFrame.islower()
Он возвращает логические значения в зависимости от того, находится ли каждый символ в строке в нижнем регистре или нет.
Python3
(
"Checks whether string is in Lower Case:"
)
(s.
str
.islower())
Вывод:
Checks whether string is in Lower Case: 0 False 1 True 2 False 3 False 4 False 5 False dtype: bool
5.) DataFrame.len()
Эта функция возвращает длину каждой строки.
Python3
(
"Length of strings:"
)
(s.
str
.
len
())
Вывод:
Length of strings: 0 5 1 4 2 5 3 6 4 6 5 4 dtype: int64
6.) DataFrame.startswith()
Он возвращает логические значения в зависимости от того, начинается ли строка с определенной последовательности символов или нет.
Python3
(
"Checks whether string starts with certain substring:"
)
(s.
str
.startswith(
'a'
))
Вывод:
Checks whether string is numeric: 0 False 1 False 2 False 3 False 4 False 5 False dtype: bool
7.) DataFrame.split()
Эта функция помогает разбить строку сразу по определенному символу или символам.
Python3
(
"Splits string by character 'a':"
)
(s.
str
.split(
'a'
))
Вывод:
Checks whether string is numeric: 0 [Vir, t] 1 [, z, m] 2 [fiNch] 3 [Sh, kiB] 4 [STOKES] 5 [KAne] dtype: object
8.) DataFrame.find()
Эта функция находит индекс вхождения определенной последовательности символов.
Python3
(
"Find the index of the searched character or substring:"
)
(s.
str
.find(
'a'
))
Вывод:
Find the index of the searched character or substring: 0 3 1 0 2 -1 3 2 4 -1 5 -1 dtype: int64
9.) DataFrame.strip()
Это помогает удалить лишние конечные пробелы в начале и в конце.
Python3
(
"Remove extra space from the starting and the end of the string:"
)
(s.
str
.strip())
Вывод:
Remove extra space from the starting and the end of the string: 0 Virat 1 azam 2 fiNch 3 ShakiB 4 STOKES 5 KAne dtype: object
10.) DataFrame.replace()
Эта функция помогает иногда удалять определенные последовательности символов, которые присутствуют во всех строках и являются нежелательными.
Python3
(
"Replace a particular substring by desired pattern:"
)
(s.
str
.replace(
'a'
, ''))
Вывод:
Замените определенную подстроку желаемым шаблоном:
Replace a particular substring by desired pattern: 0 Virt 1 zm 2 fiNch 3 ShkiB 4 STOKES 5 KAne dtype: object