運営者情報

運営してるひと: @sters9

       

妻と猫と横浜あたりに住んでいる。最近は Go や Kubernetes や GCP をしています。 PHP や JavaScript もすこし。

プライバシーポリシー

tools.gomiba.co

アーカイブ

2021/02 (12) 2021/01 (8)

2020/05 (2) 2020/04 (2) 2020/02 (2) 2020/01 (1)

2019/12 (3) 2019/11 (2) 2019/10 (5) 2019/09 (3) 2019/07 (6) 2019/06 (4) 2019/04 (3) 2019/01 (2)

2018/12 (6) 2018/10 (4) 2018/09 (6) 2018/08 (7) 2018/07 (16) 2018/06 (7) 2018/05 (7) 2018/04 (5) 2018/03 (3) 2018/02 (10) 2018/01 (6)

2017/12 (8) 2017/11 (6) 2017/10 (10) 2017/09 (12) 2017/08 (12) 2017/07 (3) 2017/06 (1) 2017/01 (4)

2016/12 (5) 2016/10 (3) 2016/09 (1) 2016/07 (2) 2016/06 (1) 2016/04 (1) 2016/02 (1) 2016/01 (2)

2015/12 (1) 2015/10 (1) 2015/09 (3) 2015/06 (1) 2015/01 (1)

2014/08 (2) 2014/07 (3) 2014/05 (1) 2014/01 (7)

2013/12 (2) 2013/11 (4) 2013/10 (1) 2013/09 (1) 2013/08 (3) 2013/07 (4) 2013/06 (5) 2013/05 (2) 2013/04 (7) 2013/03 (1)

あいまいな VLOOKUP 関数。レーベンシュタイン距離を添えて。

この記事は公開されてから1年以上経過しており、情報が古くなっている可能性があります。

完全に一致するものを探す VLOOKUP 関数ではなく、ある程度あいまいな VLOOKUP 関数がほしい状況になったので、やってみた件。

レーベンシュタイン距離を使うとお手軽にあいまい検索っぽいことができそうなので、これを利用する。 すげーざっくり言うと 2 つの文字列を比べて、片方から見た時に何文字変更したら一緒になりますか?ってもの。 レーベンシュタイン距離 - Wikipedia

Google Spreadsheet で使いたかったので Google App Script なのだけど VBA に移したら Excel でも同様に利用できるはず。Excel だと配列を返して出力はできないが。

function fuzzyVlookup(targetList, searchItem, showDistance, showNth) {
  showDistance = showDistance || 0;
  showNth = showNth || 1;

  searchItem = searchItem.toString().split("");

  var results = targetList.map(function(targetItem, idx) {
    targetItem = targetItem.toString().split("");

    if(targetItem.join("") == "") {
      return null;
    }

    if(searchItem.join("") == targetItem.join("")) {
      return {distance:0, idx:idx};
    }

    var leven = [];
    for (var i = 0; i <= targetItem.length; i++) {
      leven[i] = [];
      leven[i][0] = i;
    }
    for (var i = 0; i <= searchItem.length; i++) {
      leven[0][i] = i;
    }

    for (var i = 1; i <= targetItem.length; i++ ) {
      for (var j = 1; j <= searchItem.length; j++ ) {
        var cost = targetItem[i - 1] == searchItem[j - 1] ? 0 : 1;

        leven[i][j] = Math.min(
          leven[i - 1][j] + 1,
          leven[i][j - 1] + 1,
          leven[i - 1][j - 1] + cost
        );
      }
    }

    return {
      distance: leven[targetItem.length][searchItem.length],
      idx: idx,
    };

  }).filter(function(x) {
    return x !== null;
  }).sort(function(a, b) {
    return a.distance - b.distance;
  });

  if (results.length === 0) {
    throw new Error("要素が見つかりませんでした");
  }

  results = results.slice(0, showNth).map(function(x){
    var str = targetList[x.idx][0];
    if (showDistance === 1) {
      str += " dist=" + x.distance;
    }
    return str;
  });

  return [results];
}

↓こんな感じで使える。良好。