Skip to content

RUCDM/Generating-Text

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

30 Commits
 
 

Repository files navigation

Generating-Text

本模型使用的数据

  • Amazon_beauty
  • Amazon_Clothing_Shoes_and_Jewelry
  • Amazon_Office_Products
  • JD Data

生成文本:

Input output
this is a well built calculator this is a well built calculator to and and but the glue inkjet cardboard have the greasy
i have a canon powershot i have a canon powershot so are not other color magnets. white or want to my that the of ivory is buy very magnets.
i wanted to make sure that i wanted to make sure that machine it's experience am file ink or you're made directly nature very that once at is medium sense.

生成的模板:

pattern
and NN i VBP the NNS
a NN i VBP JJ the
and have NN i JJ NNS
this is NNS NN
a good NN JJ
i had NN JJ
...

生成的莎士比亚诗词:

Input output
时间已经终止它的运行了 时间已经终止它的运行了处置必须,神座没有吧不的能手你你们吧罗她神座分庭抗礼守戒呼吸啊智慧向我此上还有女儿什么虽然举动这小书罗我要是话有不宽容点儿米兰达。

生成的京东评论(4.10):

Input output
价格便宜,物流也给力             不好送朋友家但是但是满意                                                                
京东不错!唇膜很棒!             干净没有放心扣头好吧不错经常很味道                                                        
物美价廉,很不错                 物美价廉,很不错关键吧很满意                                                        

生成的京东评论(4.12):

Input output
价格便宜,物流也给力             价格便宜,物流也给力很好 暂时还没发现缺点哦!很好 很好                                      
京东不错!唇膜很棒!             京东不错!唇膜很棒! 应该价格容易暂时大哦,·感觉没有挺或的,样子狗狗给用(                    
物美价廉,很不错                 物美价廉,很不错,在买的,暂时还没发现缺点哦!                                  
非常好用 美观大方               物美价廉,很不错关键吧很满意                                                            
价格便宜,颜色一般 价格便宜,颜色一般的,很有暂时!发现买性价比不错 很好 很不错 暂时还没发现缺点哦!

生成的京东评论(4.16添加规则):

Input                RNN                                         RNN+rule                                    
整体感觉不错哦质量不错,精确度还可以就是包装盒 整体感觉不错哦质量不错,精确度的被五星显示。还是就是味道有点回来啊,给似乎是帽子的了 整体感觉不错哦质量不错,精确度的时候五星就效果有保证的屏幕行,质量货。服务挺还行的时候考虑
小巧,经济,实用小巧,经济 小巧,经济,实用小巧,经济里面,这款组装,味道。对给几分钟评价,正品,暂时送礼发现也漂亮啊 小巧,经济,实用小巧,经济里面,这款组装,味道。对京东评!不错!比超市的比较满意!很不错
使用起来很方便,数据直观。 使用起来很方便,数据直观。挺舒服的,有友机型还行,是产,打。太大的有点心得, 使用起来很方便,数据直观。挺舒服的,有友机型还行,是正品,手机等特别比较
确实还行,但是大小不合适 确实还行,但是大小不合适不错没做工用,是等包装这个不买不少了了的安装。 确实还行,但是大小不合适不错没做工用,是正品,手感可以的,有点手机行暂时

生成的京东评论(4.25添加item):

product_ID user_ID review                                             output                     
689955 9893886 顶级品牌,质量上乘。单层面料, 顶级品牌,质量上乘。单层面料,好用,有点满意暂时还没发现缺点哦!
670390 9581780 很好哦哈,盘子很大质量很好 很好哦哈,盘子很大质量,用了这个说明很好,不错,很好
670397 18337173 挺好的,房子鞋柜上放钥匙 挺好的,房子鞋柜上放钥匙,很完美一直便宜。暂时还没发现缺点哦!
670398 1311365 够大的碗,还不错的 够大的碗,还不错的,很不错的东西暂时还没发现缺点哦!
420101 11257175 没感觉和一般的润唇膏有啥 没感觉和一般的润唇膏有啥,这个还可以使用,暂时还没发现缺点哦!

实验分析:

实验结论:

相较上周的模型,本模型主要在层数以及迭代次数上有所增加,上图是迭代420次的的结果。虽然从结果看效果还是不理想,但整体的句子骨架已经出来了,句子中的部分词语之间也存在了相关性。例如,输入this is a well built calculator,虽然后面句子没有产生关于计算器的描述,但是生成了glue inkjet cardboard have the greasy,表示蓝色墨水盒很润滑。

实验问题:

相比较古诗生成、莎士比亚诗句生成,从实验数据上来看,Amazon的数据噪声比较大,从肉眼来看,很多训练的评论数据根本不能成为一句通顺的话,导致预测结果不是很理想。此外,从重现古诗生成以及莎士比亚诗词生成的结果来看,其实他们的实验结果有一些“水分”,并不能生成通顺的句子,只是能生成相似风格的语言。因此,我换了一批京东的数据进行训练,从实验效果来看,生成的句子还是能看的,但是由于时间比较仓促,我没有更改实验的任何参数,在接下来一周我要做的事情主要是将生成的模板和2-gram应用到模型中,并更改loss函数,争取得到更好的结果。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published