学习NLP不用愁了。
算力、环境配置谷歌提供,Colab套件对NLP全场景支持。
有了算力,还差教程,现在NLP学习合集大全套来了。
网站名直译过来就是——超强NLP合集!
181个超全资源合集,各个类型全都有,总有一款适合你。
光说不练假把式,既然是资源,就是让人用的,满满干货,无套路。
使用资源只需要三步:
1、打开网站,选择、搜索自己感兴趣的内容,比如搜索NLP领域最火的BERT。
2、可以按描述内容选择自己感兴趣的模型,打开最后一列的Colab链接。
得益于谷歌的慷慨,无需担心环境配置,直接进去学习即可。
这里以第一个BERT搜索结果为例👇。
3、在进入Colab之后,和本地notebook文件使用方法是一样的,检查好配置之后,就可以按照目录进行学习,实时交互反馈结果。
这也是这份合集的意义,不再是干巴巴的说教,而是图文并茂可运行的实例,练起来!
当然,BERT只是其中一种类型,如果还没看够,下面是我们梳理的一些分类,可供选用。
1、按所用模型分类,可分为ANN、AxCell、BERT、CNN、GPT-2、LSTM等;
2、按任务类型分类,可分为分类、对话系统、词嵌入、语言模型、机器翻译、问答系统、情感分析等;
3、按所用框架分类,可分为PyTorch、TensorFlow、Keras等。
基本上涵盖了现在NLP发展的全景,不论是框架还是模型、任务,你都能在这里找到适合自己学习的对象。
此外,你也可以为抗击疫情出份力。
可以BERT来了解疫情期间人们的情绪变化,内容丰富,目录清晰,上手即可操作。
比如说OpenAI刚更新的GPT模型,当然,受限于时间,现在只有GPT-2模型,但了解一下GPT本身也是好的。
其中有一位国人作者,15 亿参数 GPT2 中文预训练模型,可以对GPT2本身有直观了解。
并且和谷歌drive一起使用,数据集存放也非常方便,全部流程只需点击两次。
模型本身已经被训练完毕,只需要加载训练使用即可,就这么简单,适合想直接使用的研究。
在作者发布之后,Reddit一片感谢贴,毕竟这么简单无套路的资源合集,可以说很良心了。
而且这个搜集资源的小网站也是个好去处,481个数据集,从几M到上G,从CSV格式到JSON格式,应有尽有,可以马克一下作为资源站收藏。
还有,他们还开发了一款名为RABBIT的文本分类器,可以实时对媒体报道进行分类,帮助我们更好分辨媒体报道的倾向性。
妈妈再也不用担心我被“FAKE NEWS”骗了。
⚠️使用教程和下载数据集都要大路畅通哟~
仅仅教程收藏是没用的,一定要自己上手试试哟~
参考链接:
https://www.reddit.com/r/MachineLearning/comments/gvsh51/p_181_nlp_colab_notebooks_found_here/
https://notebooks.quantumstat.com
— 完 —
本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。
如今高考,得语文者得天下。而语文学习不能一蹴而就,日积月累才是大方向。
这个暑假,全国第一位登上《百家讲坛》的中学语文名师,“线下一课难求”王翔老师首次推出音频课:《经典名句格言90讲》。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「在看」吧 !