QbitAI量子位

文章数:2420 被阅读:32645379

账号入驻

BERT小学生级上手教程,从原理到上手全有图示,还能直接在线运行

2019-12-06
    阅读数:
作者 Jay Alammar
伊瓢 编译
量子位 出品 | 公众号 QbitAI

BERT,作为自然语言处理领域的C位选手,总是NLPer们逃不过的一环。

但是,如果是经验匮乏、基础薄弱的选手,想玩转BERT还是有点难的。

现在,科技博主Jay Alammar创作了一篇《第一次使用BERT的图形化指南》,用非常简单清晰的方式介绍了如何上手BERT,从BERT的原理到实际操作的过程都有图示,甚至图比代码都多。量子位为大家编译搬运如下~

这篇文章主要以用BERT的变体对句子进行分类为例,介绍了BERT的使用方式。

最后的传送门处还有Colab的地址。

数据集:SST2

首先,我们需要用到SST2数据集,里面的句子来自于一些电影评论。

如果评论者对电影表示肯定赞赏,就会有“1”的标签;

如果评论者不喜欢这个电影,发表了负面评论,就会有“0”的标签。

数据集里的电影评论是用英文写的,大概长这样: 

句子

标签

a stirring , funny and finally transporting re imagining of beauty and the beast and 1930s horror films

一部激动人心、有趣的、最后传达出对美女与野兽和1930年代恐怖片的重新想象的电影

1

apparently reassembled from the cutting room floor of any given daytime soap

显然是从随便哪个日间肥皂剧里剪一剪拼贴起来的

0

they presume their audience won't sit still for a sociology lesson

他们认为他们的观众不会安静的坐下听社会学的课

0

this is a visually stunning rumination on love , memory , history and the war between art and commerce

这是关于爱情、回忆、历史以及艺术与商业之争的视觉上令人惊叹的反省

1

jonathan parker 's bartleby should have been the be all end all of the modern office anomie films

乔纳森·帕克的剧作应当是所有现代办公室失范电影的终结

1


句子情感分类模型

现在,借助SST2影评数据集,我们需要创建一个自动对英文句子进行分类的模型。

如果判断是肯定的、正面的,就标注1;如果判断是否定的、负面的,就标注0。

大致的逻辑是这样的:

输入一句话,经过电影评论句子分类器,输出积极或消极的结果。

这个模型实际上是两个模型组成的。

DistilBERT负责处理句子,提取信息,然后传递给下一个模型,这是


最新有关QbitAI的文章

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: TI培训

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2020 EEWORLD.com.cn, Inc. All rights reserved