文本分类炼丹术合集,包括模型、论文、代码和各种炼丹术。 模型 文本分类系列01:由浅到深再到实践-综述篇 https://zhuanlan.zhihu.com/p/596112080 这里只列出一些经典的模型,具体可以看paper list。 传统方法(通常在小数据集上表现不错): NB:使用了样本属性独立性的假设,所以如果样本属性有较强的关联时其效果不好; KNN:非参数化,无须训练,但计算和存储成本与训练集大小成正比 SVM:效果很好,在集成学习和NN之前几乎在分类领域处于统治地位,但在样本数较大时的存储和计算成本过高 决策树:可解释性好,甚至可以基于决策路径直接来写规则 集成方法:xgboost/lightgbm等,常见于比赛 深度学习方法: ReNN:递归神经网络 MLP:多层感知机 RNN:循环神经网络 CNN:卷积神经网络 Attention:注意力机制 GNN:图神经网络 Transformers:bert家族 paper list Text classification paper list. 文本分类论文列表 综述 Deep Learning--based Text Classification: A Comprehensive Review:https://arxiv.org/pdf/2004.03705.pdf A Survey on Text Classification: From Shallow to Deep Learning:https://arxiv.org/pdf/2008.00364.pdf?utm_source=summari papers代码 OpenTextClassification项目为羡鱼智能【xianyu.ai】发起的OpenNLP计划的第一个正式的开源项目,欢迎关注和共建! Open text classification for you, Start your NLP journey! 项目主页: https://github.com/catqaq/OpenTextClassification https://github.com/catqaq/OpenTextClassification/blob/master/README.md 炼丹术 文本分类系列01:由浅到深再到实践-综述篇 https://zhuanlan.zhihu.com/p/596112080 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? https://www.zhihu.com/question/265357659 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? - 欧泽彬的回答 - 知乎 https://www.zhihu.com/question/265357659/answer/580469438 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? - 李rumor的回答 - 知乎 https://www.zhihu.com/question/265357659/answer/1714619843 深度学习文本分类模型综述+代码+技巧:https://zhuanlan.zhihu.com/p/349086747 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? - 包包大人的回答 - 知乎 https://www.zhihu.com/question/265357659/answer/582711744 工业界文本分类避坑指南:https://zhuanlan.zhihu.com/p/201239352 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? - pymars的回答 - 知乎 https://www.zhihu.com/question/265357659/answer/293544685 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? - 呜呜哈的回答 - 知乎 https://www.zhihu.com/question/265357659/answer/292934517 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? - 夕小瑶的回答 - 知乎 https://www.zhihu.com/question/265357659/answer/578944550 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? - 杨小小的回答 - 知乎 https://www.zhihu.com/question/265357659/answer/294881227 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? - 多头注意力的回答 - 知乎 https://www.zhihu.com/question/265357659/answer/2843361993 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? - 简枫的回答 - 知乎 https://www.zhihu.com/question/265357659/answer/579190746 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? - 本马的回答 - 知乎 https://www.zhihu.com/question/265357659/answer/579665964 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? - 知乎 https://www.zhihu.com/question/265357659/answer/293109871 在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? - 知乎用户p71fSl的回答 - 知乎 https://www.zhihu.com/question/265357659/answer/581571487 目前深度学习用在短文本分类最好的模型有哪些? https://www.zhihu.com/question/50888062 目前深度学习用在短文本分类最好的模型有哪些? - 李rumor的回答 - 知乎 https://www.zhihu.com/question/50888062/answer/1714628626 短文本分类和长文本分类的模型如何进行选择? https://www.zhihu.com/question/326770917 短文本分类和长文本分类的模型如何进行选择? - 无敌小想法的回答 - 知乎 https://www.zhihu.com/question/326770917/answer/698646465 短文本分类和长文本分类的模型如何进行选择? - 热茶与烫酒的回答 - 知乎 https://www.zhihu.com/question/326770917/answer/2584117581 Bert等出来后,文本分类是否还要尝试fasttext,textcnn等模型? https://www.zhihu.com/question/388894020 Bert等出来后,文本分类是否还要尝试fasttext,textcnn等模型? - andromeda的回答 - 知乎 https://www.zhihu.com/question/388894020/answer/1168218114 Bert等出来后,文本分类是否还要尝试fasttext,textcnn等模型? - 风控算法小白的回答 - 知乎 https://www.zhihu.com/question/388894020/answer/2623617224 【关于 文本分类 trick】那些你不知道的事:https://zhuanlan.zhihu.com/p/461927255 【论文解读】文本分类上分利器:Bert微调trick大全:https://zhuanlan.zhihu.com/p/386603816 文本 × 分类:让 BERT 适配短句分类任务:https://zhuanlan.zhihu.com/p/148501319 文本分类时如何让模型侧重部分文本?:https://www.zhihu.com/question/541482396 文本分类时如何让模型侧重部分文本? - 刘聪NLP的回答 - 知乎 https://www.zhihu.com/question/541482396/answer/2566100276 文本分类时如何让模型侧重部分文本? - 爱睡觉的KKY的回答 - 知乎 https://www.zhihu.com/question/541482396/answer/2626863300 文本分类时如何让模型侧重部分文本? - Henry.Yy的回答 - 知乎 https://www.zhihu.com/question/541482396/answer/2759539281 文本分类时如何让模型侧重部分文本? - 致Great的回答 - 知乎 https://www.zhihu.com/question/541482396/answer/2764384445