发新帖

关于生成维基百科副标题模型选择的问题

[复制链接]
334 3

快来加入 TensorFlowers 大家庭!

您需要 登录 才可以下载或查看,没有帐号?加入社区

x
实验室老板定的课题,就是给定整篇维基百科的文章生成里面副标题,为了简化问题只需要生成第一级的副标题,因为老板给的方向比较坑,基本找不到这方面的论文或模型,所以我现在主要参照的是文本摘要模型,因为现在我看到的的文本摘要模型都是seq2seq的,所以我现在正在尝试用seq2seq+attention实现,输入整篇文章,输出的是所有副标题连在一起的句子。但是这样的结果并不太好,我想请问各位大佬能不能使decode输出一个二维数组,我现在是在谷歌的textsum的基础上改模型,看了decode的部分感觉无从下手啊。我也想过使用cnn或者rnn实现,但是文本处理方面基本都是用这些实现文本分类,输出的标签都是one-hot的,感觉不是很适合这种文本生成问题。

训练数据的格式是这样的
QQ截图20180606133354.png



求各位大佬指条路
我知道答案 回答被采纳将会获得10 金币 + 20 金币 已有3人回答
本楼点评(0) 收起

精彩评论3

舟3332  TF芽芽  发表于 2018-6-8 21:25:54 来自手机  | 显示全部楼层
onehot 为什么不适合这类问题?
本楼点评(1) 收起
neverchange  TF豆豆  发表于 2018-7-5 00:32:27 | 显示全部楼层
特意找来one-hot的定义:独热编码即 One-Hot 编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候,其中只有一位有效。
本楼点评(0) 收起
ViolinSolo  TF豆豆  发表于 2018-7-6 19:49:48 | 显示全部楼层
还是seq2seq吧,既然你要文本生成。。就这样吧 当作翻译来做
本楼点评(0) 收起
您需要登录后才可以回帖 登录 | 加入社区

本版积分规则

主题

帖子

3

积分
快速回复 返回顶部 返回列表