设为首页 加入收藏

TOP

Levenshein distance最小编辑距离算法实现
2015-07-20 17:52:01 来源: 作者: 【 】 浏览:1
Tags:Levenshein distance 最小 编辑 距离 算法 实现

Levenshein distance,中文名为最小编辑距离,其目的是找出两个字符串之间需要改动多少个字符后变成一致。该算法使用了动态规划的算法策略,该问题具备最优子结构,最小编辑距离包含子最小编辑距离,有下列的公式。

\

其中d[i-1,j]+1代表字符串s2插入一个字母,d[i,j-1]+1代表字符串s1删除一个字母,然后当xi=yj时,不需要代价,所以和上一步d[i-1,j-1]代价相同,否则+1,接着d[i,j]是以上三者中最小的一项。<??http://www.2cto.com/kf/ware/vc/" target="_blank" class="keylink">vcD4KPHA+y+O3qMq1z9ajqFB5dGhvbqOpo7o8L3A+CjxwPrzZyejBvbj219a3+7Sut9ax8M6qczGjrHMyo6zG5LOktsi31rHwzqpto6xuo6zK18/IyerH69K7uPajqG0mIzQzOzGjqSqjqG4mIzQzOzGjqbTz0KG1xL7Y1fOjrMi7uvO9q7Xa0rvQ0LrNtdrSu8HQs/XKvLuvo6xkW2ksMF09aaOsZFswLGpdPWqjrL3T18W+zbC01dW5q8q9x/Oz9r7Y1fPW0Mbky/vUqsvYo6y94cr4uvOjrMG9uPbX1rf7tK7WrrzktcSx4LytvuDA677NysdkW24sbV21xCYjMjA1NDA7o6y0+sLryOfPwqO6PC9wPgo8cD48cHJlIGNsYXNzPQ=="brush:java;">#!/usr/bin/env python # -*- coding: utf-8 -*- __author__ = 'xanxus' s1, s2 = raw_input('String 1:'), raw_input('String 2:') m, n = len(s1), len(s2) colsize, matrix = m + 1, [] for i in range((m + 1) * (n + 1)): matrix.append(0) for i in range(colsize): matrix[i] = i for i in range(n + 1): matrix[i * colsize] = i for i in range(n + 1)[1:n + 1]: for j in range(m + 1)[1:m + 1]: cost = 0 if s1[j - 1] == s2[i - 1]: cost = 0 else: cost = 1 minValue = matrix[(i - 1) * colsize + j] + 1 if minValue > matrix[i * colsize + j - 1] + 1: minValue = matrix[i * colsize + j - 1] + 1 if minValue > matrix[(i - 1) * colsize + j - 1] + cost: minValue = matrix[(i - 1) * colsize + j - 1] + cost matrix[i * colsize + j] = minValue print matrix[n * colsize + m]

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到: 
上一篇UVA 1399 - Puzzle(AC自动机+DP) 下一篇Codeforces Round #257 (Div. 2) ..

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容: