運営者情報

運営してるひと: @sters9

       

妻と猫と横浜あたりに住んでいる。最近は Go や Kubernetes や GCP をしています。 PHP や JavaScript もすこし。

プライバシーポリシー

tools.gomiba.co

アーカイブ

2021/07 (2) 2021/06 (5) 2021/05 (10) 2021/04 (1) 2021/03 (8) 2021/02 (12) 2021/01 (8)

2020/05 (2) 2020/04 (2) 2020/02 (2) 2020/01 (1)

2019/12 (3) 2019/11 (2) 2019/10 (5) 2019/09 (3) 2019/07 (6) 2019/06 (4) 2019/04 (3) 2019/01 (2)

2018/12 (6) 2018/10 (4) 2018/09 (6) 2018/08 (7) 2018/07 (16) 2018/06 (7) 2018/05 (7) 2018/04 (5) 2018/03 (3) 2018/02 (10) 2018/01 (6)

2017/12 (8) 2017/11 (6) 2017/10 (10) 2017/09 (12) 2017/08 (12) 2017/07 (3) 2017/06 (1) 2017/01 (4)

2016/12 (5) 2016/10 (3) 2016/09 (1) 2016/07 (2) 2016/06 (1) 2016/04 (1) 2016/02 (1) 2016/01 (2)

2015/12 (1) 2015/10 (1) 2015/09 (3) 2015/06 (1) 2015/01 (1)

2014/08 (2) 2014/07 (3) 2014/05 (1) 2014/01 (7)

2013/12 (2) 2013/11 (4) 2013/10 (1) 2013/09 (1) 2013/08 (3) 2013/07 (4) 2013/06 (5) 2013/05 (2) 2013/04 (7) 2013/03 (1)

sters/hugo-utilitiesを作った(作っている)

これはなに

  • sters自身がHugoを使っているときに、こういうのあったら便利なんでは、と作ったまとめ(予定)
  • 例えば、各記事は自由に書けるので、タグが微妙にぶれたりするので…
    • 似ているタグを探すものとか
    • 記事の内容からタグを推測するとか

なぜつくったのか

  • Hugoは結局のところコンテンツをシュッとやってくれるだけで、そのコンテンツ管理は各自に委ねられる。
  • そのときコンテンツ管理を気合だけで統一感をもってやっていくことが難しく、機械的なサポートがほしいなあ〜〜と。

どうやってつくったのか

  • Go!
  • 以前作ったごく簡単なパースするパッケージ sters/simple-hugo-content-parse を使ってコンテンツをパースしている。
    • あとは雰囲気でえいや。
  • 似ているタグを探すのにはレーベンシュタイン距離を使ってみた。
    • agnivade/levenshtein: Go implementation to calculate Levenshtein Distance.
    • なぜレーベンシュタイン距離かというと こんにちはこんちは のようなものを、単なるContainsのようなチェックでは判別できないため。
    • 単純なしきい値では明らかにそれを出すのはおかしい、みたいなものが多かったので、文字列の長さに対してある程度一緒であれば出す、という実装にしている。
    • もうちょっといい判定にしたほうがいい気がするけど、まあ…
      • 一応アイデアはあって、1-gramで行うレーベンシュタイン距離ではなく、2-gramで行う、とか。
      • 2文字のペアとして見たときに、レーベンシュタイン距離を見る。