使用字典

CHM格式中使用全文检索,为了提高检索的准确性。doc2help在生成过程中可以使用字典对文档内容进行分词,从而提高检索的准确性。

如果不使用字典,将直接使用单字切分方法进行分词。实践发现,精确度一般也不错,但可能会多检索出一些不相关的内容。

注意

如果字典本身很大,word文档本身也很大,则在使用字典情况下进行文档生成,时间消耗可能比较长。在CPU为迅驰1.86G,内存1G的配置下,使用有30万词条的字典,解析6万个汉字的word文档,大概需要3分钟左右。

字典分词对纯英文文档无效。英文单词将直接按照单词组成进行切分,无需字典。