温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

用Python的fuzzy、wuzzy模块进行字符串模糊匹配

发布时间:2020-07-22 05:47:29 来源:网络 阅读:1802 作者:nineteens 栏目:编程语言

      Python提供fuzzywuzzy模块,不仅可用于计算两个字符串之间的相似度,而且还提供排序接口能从大量候选集中找到最相似的句子。

  (1)安装

  pip install fuzzywuzzy

  (2)接口说明

  两个模块:fuzz, process,fuzz主要用于两字符串之间匹配,process主要用于搜索排序。

  fuzz.ratio(s1,s2)直接计算s2和s2之间的相似度,返回值为0-100,100表示完全相同;

  fuzz.partial_ratio(S1,S2)部分匹配,如果S1是S2的子串依然返回100;

  fuzz.token_sort_ratio(S1,S2)只比较S1,S2单词是否相同,不考虑词语之间的顺序;

  fuzz.token_set_ratio(S1,S2)相比fuzz.token_sort_ratio不考虑词语出现的次数;

  process.extract(S1, ListS,limit=n),表示从列表ListS中找出Top n与S1最相似的句子;

  process.extractOne(S1,ListS),返回最相似的一个

  (3)使用

  from fuzzywuzzy import fuzz

  a = 'a b c'

  b = ' a c b '

  c = 'a c'

  fuzz.ratio(a, c)

  >> 75

  fuzz.ratio(b, c)

  >> 60无锡知名的妇科医院 http://www.wxbhnkyy39.com/

  fuzz.partial_ratio(a, c)

  >> 67

  fuzz.partial_ratio(b, c)

  >> 100

  fuzz.token_sort_ratio(a, c)

  >> 75

  fuzz.token_sort_ratio(b, c)

  >> 75

  fuzz.token_set_ratio(a, c)

  >> 100

  fuzz.token_set_ratio(b, c)

  >> 100


向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI