12個Python數據處理常用內置函數
在python數據分析中,經常需要對字符串進行各種處理,例如拼接字符串、檢索字符串等。下面我將對python中常用的內置字符串操作函數進行介紹。
1.計算字符串的長度-len()函數
- str1='我愛python'
- length=len(str1)
- print(length)
len()函數在計算字符串的長度時,不區分英文、數字和漢字,所有字符都按一個字符計算。
有時,我們需要獲取字符串實際所占的字節,即計算python默認編碼UTF-8下的實際字節長度,可以這樣做:
- str1='我愛python'
- length=len(str1.encode())
- print(length)
12
和UTF-8編碼下一個漢字占3個字節相吻合
2.分割字符串
split()方法可以實現字符串分割,也就是把一個字符串按照指定的分割符分割為字符串列表。具體語法格式如下
- str.split(sep,maxsplit)
參數說明:
- str:表示要分割的字符串
- sep:指定的分割符
- maxsplit:用于指定分割的次數
3.統計某字符出現的次數
count()方法用于檢索某字符串在另一字符串中出現的次數,語法格式如下:
- str.count(str1)
參數說明:
- str:表示原字符串
- str1:表示要檢索的字符串
4.檢索某字符串是否存在(find)
find()方法用于檢索是否包含指定的子字符串。如果檢索的字符串不存在,則返回-1,否則返回首次出現該子字符串的索引。其語法格式如下:
- str.find(str1)
參數說明:
- str:表示原字符
- str1:表示要檢索的子字符串
5.檢索某字符串是否存在(index)
index()與find()方法類似,也是用于檢索是否包含指定的子字符串。只不過index()方法在指定字符串不存在是會拋出異常。具體語法如下:
- str.index(str1)
參數說明:
- str:表示原字符
- str1:表示要檢索的子字符串
6.檢索字符串是否已指定字符串開頭
這里用到startswith()方法,如果是則返回True,否則返回False,具體語法如下:
- str.startswith(str1)
參數說明:
- str:表示原字符
- str1:表示要檢索的子字符串
7.檢索字符串是否已指定字符串結尾
這里用到endswith()方法,如果是則返回True,否則返回False,具體語法如下:
- str.endswith(str1)
參數說明:
- str:表示原字符
- str1:表示要檢索的子字符串
8.大寫字母轉小寫字母
lower()方法用于價格字符串中的大寫字母轉換為小寫字母,語法格式如下:
- str.lower()
9.小寫字母轉換為大寫字母
upper()方法用于價格字符串中的小寫字母轉換為大寫字母,語法格式如下:
- str.upper()
10.刪除空格和特殊字符
strip()方法用于去掉字符串左、右兩側的空格和特殊字符,語法格式如下:
- str.strip([chars])
參數說明:
- str:表示原字符
- chars:為可選參數,用于指定要取出的字符,可以指定多個。如果chars為“@”,則取出左、右兩側包括的“@”“。”。如果不指定chars參數,默認去除空格、制表符“\t”、回車符“\r”、換行符“\n”等
11.去掉字符串左側的字符
lstrip()方法用于去掉字符串左側的空格和特殊字符,語法格式如下:
- str.lstrip([chars])
參數說明:
- str:表示原字符
- chars:為可選參數,用于指定要取出的字符,可以指定多個。如果chars為“@”,則取出左、右兩側包括的“@”“。”。如果不指定chars參數,默認去除空格、制表符“\t”、回車符“\r”、換行符“\n”等
12.去掉字符串右側的字符
rstrip()方法用于去掉字符串右側的空格和特殊字符,語法格式如下:
- str.rstrip()
參數說明:
- str:表示原字符
- chars:為可選參數,用于指定要取出的字符,可以指定多個。如果chars為“@”,則取出左、右兩側包括的“@”“。”。如果不指定chars參數,默認去除空格、制表符“\t”、回車符“\r”、換行符“\n”等
本文轉載自微信公眾號「python數據分析之禪」,作者小dull鳥 。轉載本文請聯系python數據分析之禪公眾號。