AINLP公众号 公众号文章分类存档,每天同步更新,欢迎关注AINLP公众号:
如何学习NLP和相关学习资源
如何学习自然语言处理:NLP领域经典《自然语言处理综论》英文版第三版更新
数学之美中盛赞的 Michael Collins 教授,他的NLP课程要不要收藏?
词向量
玩转腾讯词向量:Game of Words(词语的加减游戏)
NLP中的词向量对比:word2vec/glove/fastText/elmo/GPT/bert
预训练语言模型
BERT基础
【重温序列模型】再回首DeepLearning遇见了LSTM和GRU
Transformer (变形金刚,大雾) 三部曲:RNN 的继承者
AAAI21最佳论文Runners Up!Transformer的归因探索!
AAAI21最佳论文Informer:效果远超Transformer的长序列预测神器!
放弃幻想,全面拥抱Transformer:自然语言处理三大特征抽取器(CNN/RNN/TF)比较
预训练在自然语言处理的发展: 从Word Embedding到BERT模型
从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史
BERT_Paper_Chinese_Translation: BERT论文中文翻译版
NAACL2021论文:UniDrop:一种简单而有效的Transformer提升技术
BERT源码
BERT应用
Bert时代的创新(应用篇):Bert在NLP各领域的应用进展
【Github】BERT-NER-Pytorch:三种不同模式的BERT中文NER实验
还在用[CLS]?从BERT得到最强句子Embedding的打开方式!
【ACL2020】tBERT: 结合主题模型和BERT实现语义相似度分析
BERT实战
模型压缩实践系列之——bert-of-theseus,一个非常亲民的bert压缩方法
我不懂BERT系列——有关RealFormer的一些有趣现象
【Github】BERT-train2deploy:BERT模型从训练到部署
BERT之外
Reformer: The Efficient Transformer
BERT/注意力机制/Transformer/迁移学习NLP资源大列表:awesome-bert-nlp
中文预训练ALBERT模型来了:小模型登顶GLUE,Base版模型小10倍速度快1倍
RoBERTa for Chinese:大规模中文预训练RoBERTa模型
中文语言理解基准测评(chineseGLUE)来了,公开征集数据集进行中
CLUECorpus2020:可能是史上最大的开源中文语料库以及高质量中文预训练模型集合
GPT-3的最强落地方式?陈丹琦提出小样本微调方法,比普通微调提升11%
ICLR 2021 | 微软DeBERTa超越人类,造就SuperGLUE上的新王者
SOTA来啦!BERT又又又又又又魔改了!DeBERTa登顶GLUE~
【关于自训练 + 预训练 = 更好的自然语言理解模型 】 那些的你不知道的事
深入解读首个万亿级语言模型 Switch Transformer
中文分词/词性标注
五款中文分词工具在线PK: Jieba, SnowNLP, PkuSeg, THULAC, HanLP
中文分词工具在线PK新增:FoolNLTK、LTP、StanfordCoreNLP
中文分词工具评估:chinese-segmentation-evaluation
命名实体识别
ICLR2021 | 唯一录取的NER论文:NER数据存在漏标怎么办?
文本分类/情感分析
韩家炜课题组重磅发文:文本分类只需标签名称,不需要任何标注数据!
清华THUNLP多标签分类论文笔记:基于类别属性的注意力机制解决标签不均衡和标签相似问题
用模型“想象”出来的target来训练,可以提高分类的效果!
文本摘要
抛开模型,探究文本自动摘要的本质——ACL2019 论文佳作研读系列
文本自动摘要任务的“不完全”心得总结番外篇——submodular函数优化
文本摘要(text summarization)最新研究热点、发展趋势,里程碑论文推荐
2015-2019年摘要模型(Summarization Model)发展综述(一)
2015-2019年摘要模型(Summarization Model)发展综述(二)
真正理解指针生成网络——Summarization with Pointer-Generator Networks
主题挖掘
文本匹配
问答系统/对话系统/聊天机器人
基于RASA的task-orient对话系统解析(二)——对话管理核心模块
基于RASA的task-orient对话系统解析(三)——基于rasa的会议室预定对话系统实例
从互联网爬虫、自动驾驶到对话机器人,什么是Semantic(语义)?
赛尔原创@AAAI 2021 | 数据增强没效果?试试用Cluster-to-Cluster生成更多样化的新数据吧
赛尔原创@AAAI 2021 | 纠结于联合学习中的建模方法?快来看看图网络显式建模!
赛尔笔记 | 新分类!全总结!最新Awesome-SLU-Survey资源库开源!
EMNLP 2020 | 大道至简,后浪选手DPR暴打前浪BM25
【SIGIR2020】信息检索对话中混合主动性和协同性的分析
Facebook刷新开放域问答SOTA:模型训模型!Reader当Teacher!
文本生成
【ICLR2021】CoCon:一种自监督的可控文本生成方法
Facebook大公开:解决NLG模型落地难题!工业界的新一波春天?
Data-to-Text(一):财经快讯和体育快讯是怎么生成的?
阅读理解
陈丹琦博士论文翻译:神经阅读理解与超越(Neural Reading Comprehension and Beyond)
机器翻译
Philipp Koehn大神的神经网络机器翻译学习资料:NMT Book
自然语言推理
推荐算法/推荐系统
推荐系统之Exploitation & Exploration
推荐领域又一经典paper,分分钟搞清楚Attention机制
推荐实践(4):从KNNBasic() 了解整个算法部分的结构梳理
推荐实践(6):accuracy()--surprise 支持哪些指标测量呢?
推荐实践(7):trainset.Trainset() 通过调整数据集让代码更优雅
支持多值带权重、稀疏、共享embedding权重的DSSM召回实现(tensorflow2)
多目标学习(MMOE/ESMM/PLE)在推荐系统的实战经验分享
小白都能懂的推荐算法入门(三),FM、类别特征以及Embedding
没什么是一次排序解决不了的,如果有,那就One more time
计算广告/广告系统
CTR学习笔记&代码实现2-深度ctr模型 MLP->Wide&Deep
特征交互新路线|阿里 Co-action Network论文解读
搜索引擎/搜索系统
浅谈Learning to Rank中的RankNet和LambdaRank算法
关系抽取
【论文】Awesome Relation Classification Paper(关系分类)(PART I)
【论文】Awesome Relation Classification Paper(关系分类)(PART II)
【论文】Awesome Relation Extraction Paper(关系抽取)(PART III)
【论文】Awesome Relation Extraction Paper(关系抽取)(PART IV)
【论文】Awesome Relation Extraction Paper(关系抽取)(PART V)
实体关系抽取新范式!TPLinker:单阶段联合抽取,并解决暴漏偏差
事件抽取
知识图谱
对比学习
图神经网络
MM'19 | MMGCN 面向短视频推荐的多模态图神经网络
强化学习
多任务学习
竞赛之路
AI Challenger 2018 文本挖掘类竞赛相关代码及解决方案汇总
AI Challenger_2018英中文本机器翻译_参赛小结
AI Challenger 2018 冠军 PPT 分享---细粒度情感分析赛道
AI Challenger 2018 冠军代码分享---细粒度情感分析赛道
AI Challenger 2018 第4名PPT分享---细粒度情感分析赛道
提供一个10分钟跑通 AI Challenger 细粒度用户评论情感分析的fastText Baseline
【Github】2019年达观信息提取比赛第九名代码和答辩PPT
CCF BDCI2019 金融信息负面及主体判定 冠军方案解析
【Github】Data Competition Top Solution: 数据竞赛top解决方案开源整理
求职面试相关
EE转CS,拿了多个行业offer,最终选择NLP算法岗的同学的秋招总结
【Github】NLPer-Interview: NLP 算法工程师相关的面试题
【Github】ML-NLP:机器学习、NLP面试中常考到的知识点和代码实现
算法工程师之路
实战经验分享
系统架构
机器学习基础
论文笔记
Meta-Learning:Learning to Learn and Applications
可解释性论文阅读笔记1-Tree Regularization
可解释性论文阅读笔记2-Leveraging Language Models
使用Python复现SIGKDD2017的PAMAE算法(并行k-medoids算法)
From Word Embeddings To Document Distances 阅读笔记
树模型奠基性论文解读| GBM: Gradient Boosting Machine
不要浪费没有标注的数据!超强文本半监督方法MixText来袭!
在PPoPP 2021会议上中了一篇分布式训练论文——DAPPLE
课程笔记
【Hello NLP】CS224n笔记[2]:Word2Vec算法推导&实现
【Hello NLP】CS224n学习笔记[3]:共现矩阵、SVD与GloVe词向量
【Hello NLP】CS224n笔记[4]:自然语言中的依存分析(Dependency Parsing)
【Hello NLP】CS224n笔记[5]:语言模型(LM)和循环神经网络(RNNs)
【Hello NLP】CS224n笔记[7]:机器翻译和seq2seq
【CS224N课程笔记】词向量II: GloVe, 评估和训练
开源项目及资源
复旦大学自然语言处理实验室发布模型鲁棒性评测平台TextFlint
安利一个开源的好工具Label Studio, 闭环数据标注和模型训练
【Github】nlp-paper: 按主题分类的自然语言处理文献大列表
CLUEDatasetSearch:搜索所有中文数据集,附常用英文数据集
NLP 2018 Highlights:2018自然语言处理技术亮点汇总
NLP Chinese Corpus项目:大规模中文自然语言处理语料
Awesome-Chinese-NLP:中文自然语言处理相关资料
上百种预训练中文词向量:Chinese-Word-Vectors
【Github】nlp-journey: NLP相关代码、书目、论文、博文、算法、项目资源链接
NeuralNLP-NeuralClassifier:腾讯开源深度学习文本分类工具
【Github】Chinese-poetry: 最全中华古诗词数据库
【Github】ML-NOTE:注重数学推导的机器学习算法整理
【Github】GPT2-Chinese:中文的GPT2训练代码
【Github】nlp-tutorial:TensorFlow 和 PyTorch 实现各种NLP模型
【Github】nlp-roadmap:自然语言处理路相关路线图(思维导图)和关键词(知识点)
【Github】TextCluster:短文本聚类预处理模块 Short text cluster
【数据集】OCR_DataSet:有关OCR的数据集并统一标注格式
公开课、开源书籍或者学习笔记等
自然语言处理经典《Speech and Language Processing》第三版最新版下载(含第二版)
2019斯坦福CS224n深度学习自然语言处理课程视频和相关资料分享
CS224N 2019最全20视频分享:斯坦福大学深度学习自然语言处理课程资源索引
CMU-2020最新《神经网络自然语言处理》课程视频+课件+代码分享(附下载)
宅家追课正当时,李宏毅老师2020新课深度学习与人类语言处理正式开放上线
86岁MIT教授Gilbert Strang的线性代数小课:2020新视野下的线性代数
Springer面向公众开放电子书籍,附65本数学、编程、机器学习、深度学习、数据挖掘、数据科学等书籍链接及打包下载
新书下载 | 面向机器学习的数学(Mathematics for Machine Learning)
【新书】从Word2Vec到BERT的自然语言处理嵌入进展,附下载
400页《TensorFlow 2.0 深度学习算法实战》中文版教材免费下载(附随书代码+pdf)
2020最新版《神经网络与深度学习》中文版更新完毕,pdf开放下载
中国科学技术大学计算机学院课程资源:USTC-CS-Courses-Resource
NLP相关工具及在线测试(公众号对话测试)
五款中文分词工具在线PK: Jieba, SnowNLP, PkuSeg, THULAC, HanLP
中文分词工具在线PK新增:FoolNLTK、LTP、StanfordCoreNLP
斯坦福大学NLP组Python深度学习自然语言处理工具Stanza试用
NLP开源工具介绍系列一:Python工具NLTK详解及在线测试
自动对联,作诗机及其他文本生成器
夸夸聊天机器人及其他技能
其他相关文章
Meta Learning 3: 少样本文本分类 InductionNet
大幅减少GPU显存占用:可逆残差网络(The Reversible Residual Network)
Gilbert Strang教授的MIT公开课:数据分析、信号处理和机器学习中的矩阵方法
Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
Hands-on Machine Learning with Scikit-Learn and TensorFlow 学习笔记
Calibration: 一个工业价值极大,学术界却鲜有研究的问题!
【科普】 AI是什么?AI可以做什么?AI会取代人的工作吗?
“神奇的”标签增强技术(Label Enhancement)
NeurIPS 2020 | 没有乘法的神经网络,照样起飞?
一文看懂贝叶斯优化/Bayesian Optimization
再谈 L2:与 Weight Decay 还有 Batch Norm 不说其实也可以的故事
Siamese network 孪生神经网络--一个简单神奇的结构
关于AINLP
AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLP君微信(id:ainlper),备注工作/研究方向+加群目的。