Skip to content

Releases: jsksxs360/Word2Vec

V1.3 常规更新

10 Dec 06:29
Compare
Choose a tag to compare
  1. 修正句子相似度计算函数 sentenceSimilarity,计算时忽略模型中未包含的词语。
  2. 修正 loadJavaModel 方法中 loadModel 变量赋值错误导致无法加载模型的问题。感谢 @lijian2033
  3. 添加快速句子相似度计算函数 fastSentenceSimilarity,直接将句子中的词向量求和作为句向量,然后再计算两个句向量的 cosine 值。

若需要使用分词工具类 Segment,需要引入 ansj_seg-5.0.2-all-in-one.jar

V1.2.2 常规更新

11 Mar 12:05
Compare
Choose a tag to compare
  1. 当出现模型中未包含的词语(或模型加载失败)时,词语相似度调整为 0。
  2. 句子相似度计算中,calMaxSimilarity() 函数返回值允许为负值。

说明

若需要使用分词工具类 Segment,需要引入 ansj_seg-5.0.2-all-in-one.jar

V1.2.1 好吧,我智障了

11 Mar 09:55
Compare
Choose a tag to compare

非常抱歉,之前的 V1.2 提供了一个“假的”jar 包。使用 Eclipse 打包时,自认为将项目依赖的 ansj 分词 jar 包包含进去就可以使用了,之后也未做测试,结果运行时出现了找不到类的情况,实在是太不好意思了。这个版本没有任何代码更新,只是重新打了一个独立的 jar 包。依赖的 ansj 分词 jar 包也一并提供,使用时,只需要都引入项目就可以了。

V1.2 新年快乐

23 Jan 03:37
Compare
Choose a tag to compare
  1. 之前的句子相似度计算方法 sentenceSimilarity() 存在问题,已替换为原来的 easySentenceSimilarity() 方法。如果你之前使用过该方法,请务必更新。
  2. 更新分词工具类 Segment,原来使用的 HanLP 便携版效果较差,已更换为 Ansj 中文分词。
  3. 从该版本开始,只提供包含分词工具的 jar 包,原有的 core 版本不再提供。

V1.1

19 Nov 04:07
Compare
Choose a tag to compare

更新说明

  1. 添加新的句子相似度计算函数,支持自定义词语在比较中的权值。
  2. 修复代码中的细小问题,去除所有警告提示。
  3. 修正句子相似度函数名为 sentenceSimilarity()

二进制文件说明:

  • Word2Vec-1.1.jar : 包含 HanLP 便携版,提供简易的分词功能。
  • Word2Vec-1.1-core.jar : 仅包含核心代码(建议使用)。在计算句子相似度时,用户需要自己负责分词,或者直接提供句子包含的词语列表。

V1.0.1 常规维护

11 Nov 15:10
Compare
Choose a tag to compare
  1. 添加 getSimilarWords 函数,用来获取指定词语的近义词。
  2. 删除 jar 包中测试类

V1.0 首发版

01 Nov 13:20
Compare
Choose a tag to compare

Word2Vec 是谷歌 word2vec 的 java 实现版本,支持在 java 环境下训练模型,也支持读取由谷歌 c 语言版 word2vec 训练产生的模型,同时实现了常用的词语相似度和句子相似度计算。