内容字号:默认大号超大号

段落设置:段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

C#实现的字符串相似度对比类

2016-07-21 15:24 出处:电脑高手网整理 人气: 评论(0

   本类适用于比较2个字符的相似度,代码如下:

  ?

        using System;

  using System.Collections.Generic;

  using System.Text;

  public class StringCompute

  {

  #region 私有变量

  ///

  /// 字符串1

  ///

  private char[] _ArrChar1;

  ///

  /// 字符串2

  ///

  private char[] _ArrChar2;

  ///

  /// 统计结果

  ///

  private Result _Result;

  ///

  /// 开始时间

  ///

  private DateTime _BeginTime;

  ///

  /// 结束时间

  ///

  private DateTime _EndTime;

  ///

  /// 计算次数

  ///

  private int _ComputeTimes;

  ///

  /// 算法矩阵

  ///

  private int[,] _Matrix;

  ///

  /// 矩阵列数

  ///

  private int _Column;

  ///

  /// 矩阵行数

  ///

  private int _Row;

  #endregion

  #region 属性

  public Result ComputeResult

  {

  get { return _Result; }

  }

  #endregion

  #region 构造函数

  public StringCompute(string str1, string str2)

  {

  this.StringComputeInit(str1, str2);

  }

  public StringCompute()

  {

  }

  #endregion

  #region 算法实现

  ///

  /// 初始化算法基本信息

  ///

  /// 字符串1

  /// 字符串2

  private void StringComputeInit(string str1, string str2)

  {

  _ArrChar1 = str1.ToCharArray();

  _ArrChar2 = str2.ToCharArray();

  _Result = new Result();

  _ComputeTimes = 0;

  _Row = _ArrChar1.Length + 1;

  _Column = _ArrChar2.Length + 1;

  _Matrix = new int[_Row, _Column];

  }

  ///

  /// 计算相似度

  ///

  public void Compute()

  {

  //开始时间

  _BeginTime = DateTime.Now;

  //初始化矩阵的第一行和第一列

  this.InitMatrix();

  int intCost = 0;

  for (int i = 1; i < _Row; i++)

  {

  for (int j = 1; j < _Column; j++)

  {

  if (_ArrChar1[i - 1] == _ArrChar2[j - 1])

  {

  intCost = 0;

  }

  else

  {

  intCost = 1;

  }

  //关键步骤,计算当前位置值为左边+1、上面+1、左上角+intCost中的最小值

  //循环遍历到最后_Matrix[_Row - 1, _Column - 1]即为两个字符串的距离

  _Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);

  _ComputeTimes++;

  }

  }

  //结束时间

  _EndTime = DateTime.Now;

  //相似率 移动次数小于最长的字符串长度的20%算同一题

  int intLength = _Row > _Column ? _Row : _Column;

  _Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);

  _Result.UseTime = (_EndTime - _BeginTime).ToString();

  _Result.ComputeTimes = _ComputeTimes.ToString();

  _Result.Difference = _Matrix[_Row - 1, _Column - 1];

  }

  ///

  /// 计算相似度(不记录比较时间)

  ///

  public void SpeedyCompute()

  {

  //开始时间

  //_BeginTime = DateTime.Now;

  //初始化矩阵的第一行和第一列

  this.InitMatrix();

  int intCost = 0;

  for (int i = 1; i < _Row; i++)

  {

  for (int j = 1; j < _Column; j++)

  {

  if (_ArrChar1[i - 1] == _ArrChar2[j - 1])

  {

  intCost = 0;

  }

  else

  {

  intCost = 1;

  }

  //关键步骤,计算当前位置值为左边+1、上面+1、左上角+intCost中的最小值

  //循环遍历到最后_Matrix[_Row - 1, _Column - 1]即为两个字符串的距离

  _Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);

  _ComputeTimes++;

  }

  }

  //结束时间

  //_EndTime = DateTime.Now;

  //相似率 移动次数小于最长的字符串长度的20%算同一题

  int intLength = _Row > _Column ? _Row : _Column;

  _Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);

  // _Result.UseTime = (_EndTime - _BeginTime).ToString();

  _Result.ComputeTimes = _ComputeTimes.ToString();

  _Result.Difference = _Matrix[_Row - 1, _Column - 1];

  }

  ///

  /// 计算相似度

  ///

  /// 字符串1

  /// 字符串2

  public void Compute(string str1, string str2)

  {

  this.StringComputeInit(str1, str2);

  this.Compute();

  }

  ///

  /// 计算相似度

  ///

  /// 字符串1

  /// 字符串2

  public void SpeedyCompute(string str1, string str2)

  {

  this.StringComputeInit(str1, str2);

  this.SpeedyCompute();

  }

  ///

  /// 初始化矩阵的第一行和第一列

  ///

  private void InitMatrix()

  {

  for (int i = 0; i < _Column; i++)

  {

  _Matrix[0, i] = i;

  }

  for (int i = 0; i < _Row; i++)

  {

  _Matrix[i, 0] = i;

  }

  }

  ///

  /// 取三个数中的最小值

  ///

  ///

  ///

  ///

  ///

  private int Minimum(int First, int Second, int Third)

  {

  int intMin = First;

  if (Second < intMin)

  {

  intMin = Second;

  }

  if (Third < intMin)

  {

  intMin = Third;

  }

  return intMin;

  }

  #endregion

  }

  ///

  /// 计算结果

  ///

  public struct Result

  {

  ///

  /// 相似度

  ///

  public decimal Rate;

  ///

  /// 对比次数

  ///

  public string ComputeTimes;

  ///

  /// 使用时间

  ///

  public string UseTime;

  ///

  /// 差异

  ///

  public int Difference;

  }

  调用方法:

  ?

       // 方式一

  StringCompute stringcompute1 = new StringCompute();

  stringcompute1.SpeedyCompute("对比字符一", "对比字符二"); // 计算相似度, 不记录比较时间

  decimal rate = stringcompute1.ComputeResult.Rate; // 相似度百分之几,完全匹配相似度为1

  // 方式二

  StringCompute stringcompute2 = new StringCompute();

  stringcompute2.Compute(); // 计算相似度, 记录比较时间

  string usetime = stringcompute2.ComputeResult.UseTime; // 对比使用时间

相关栏目

相关文章



分享给小伙伴们:

评论

发表评论愿您的每句评论,都能给大家的生活添色彩,带来共鸣,带来思索,带来快乐。

签名: 验证码: 点击我更换图片

评论列表

    Copyright © 2002-2016 dngsw.cn 电脑高手网 版权所有

    粤ICP备13005586号-3