情况一
input:
1 | import torch |
output:
1 |
|
换种说法就是:
a: [B, L, F]
b: [B, L, F, F]
每个字对应一个[F, F]的矩阵
这个矩阵的第i行第j列的元素的含义是:上一时刻tag为i, 这一时刻tag为j的分数
。比如应用到一阶马尔可夫相关的模型中。
情况二(这种情况没真实测试过,需谨慎对待)
1 | # b 代表的是: sequence length: 3 * 3 |
即这个长度为3的句子形成一个首尾的矩阵,最后一维代表相关的概率。
比如在嵌套ner任务中,
我 | 爱 | 北 | 京 | |
---|---|---|---|---|
我 | ||||
爱 | ||||
北 | 0.03 | 0.02 | 0.05 | 0.9 |
京 |