原文:相似文档查找算法之 simHash 简介及其 java 实现