python 查找子字符串

admin
行业动态
2024-03-17
4268

在Python中，查找子字符串是一个非常常见的操作，Python提供了多种方法来执行这个任务，包括使用内置的字符串方法，正则表达式，甚至一些外部库，以下是一些主要的方法：

python 查找子字符串第1张

1、使用内置的字符串方法：

str.find(sub): 如果子字符串存在，返回子字符串的开始索引值，否则返回1。

str.index(sub): 与find()类似，但是如果子字符串不存在，会抛出一个异常。

str.count(sub): 返回子字符串在字符串中出现的次数。

str.replace(old, new): 把字符串中的 old（旧字符串）替换成 new(新字符串)。

2、使用正则表达式：

re.search(pattern, string): 扫描整个字符串并返回第一个成功的匹配。

re.findall(pattern, string): 返回所有成功的匹配。

3、使用Python的第三方库，例如fuzzywuzzy库，可以用来做模糊匹配。

下面是这些方法的具体代码示例：

使用内置的字符串方法
s = "Hello, world!"
print(s.find("world"))  # 输出：7
print(s.index("world"))  # 输出：7
print(s.count("l"))  # 输出：3
s = s.replace("world", "Python")  # 输出：Hello, Python!
使用正则表达式
import re
s = "Hello, 123 world!"
match = re.search("d+", s)
if match:
    print("first occurrence of number:", match.group())  # 输出：first occurrence of number: 123
print("all occurrences of number:", re.findall("d+", s))  # 输出：all occurrences of number: ['123']
使用第三方库fuzzywuzzy进行模糊匹配
from fuzzywuzzy import fuzz
s1 = "Hello world"
s2 = "hello world"
print(fuzz.ratio(s1, s2))  # 输出：90

需要注意的是，以上方法在处理大型文本或需要高性能的情况下可能会有所不同，正则表达式在处理复杂的模式匹配时可能非常强大，但也可能比其他方法慢，内置的字符串方法通常更快，但功能较为基础，选择哪种方法取决于具体的应用场景和需求。