重新实施 Porter stemming algorithm 在 Python 中。
在我的快速测试中,这个实现比从官方页面链接的异常的Python快3.5倍。
whoosh.lang.porter.
stem
使用波特词干算法从英语单词中删除后缀。
>>> stem("fundamentally") "fundament"