Whoosh 是由 Matt Chaput . 它开始是一个快速和糟糕的搜索服务器,用于 Houdini 3D动画软件包。副作用软件慷慨地允许Matt打开代码的源代码,以防它可能对任何其他需要非常灵活或纯粹的Python搜索引擎(或两者)的人有用。.
whoosh是一个快速、纯粹的python搜索引擎库。
whoosh的主要设计动力是它是纯Python。您应该能够使用任何可以使用Python、没有编译器或Java所需的WHOSOH。
Like one of its ancestors, Lucene, Whoosh is not really a search engine, it's a programmer library for creating a search engine [1] .
实际上,“Whoosh”的重要行为都不是硬编码的。文本索引、每个字段中每个术语存储的信息级别、搜索查询的解析、允许的查询类型、评分算法等都是可定制、可替换和可扩展的。
[1] | 当然,可以在whoosh的基础上构建一个全包搜索引擎,就像nutch和solr使用lucene一样。 |
whoosh可以为自由格式或结构化文本编制索引,然后根据简单或复杂的搜索条件快速查找匹配的文档。
您可以查看 Whoosh Bitbucket page 并获得有关 Whoosh mailing list .