Skip to content

Latest commit

 

History

History
20 lines (16 loc) · 1.01 KB

README.md

File metadata and controls

20 lines (16 loc) · 1.01 KB

chinese_text_matching

使用colab运行了一些文本匹配的模型代码。这里主要是做相似度匹配,也就是对sentences1和sentences2,如果是相似的,就是1,如果是不相似的,就是0,转化成了分类问题。

参考

主要参考了以下三个github

模型

  • 基于表示的模型:DSSM模型、CDSSM模型、ARC-I模型
  • 基于交互的模型:ATRC-II模型、MatchPyramid模型、mvlstm模型
  • Attention有关的模型:BiMPM模型、ESIM模型
  • Bert模型

数据

数据来源于https://github.com/terrifyzhao/text_matching 中使用的数据。因为是中文,因此输入的是子向量,嵌入使用keras的Embedding随机生成的,没有使用训练好的子向量。

模型

主要是为了学习模型的代码,因此没有进行相似的调参,有一些模型的实现与matchZoo不同,做了简化。