您的位置 首页 百科

2333是什么意思(当电脑看到“2333”时,她觉得是什么意思)

2333是什么意思
来源于猫扑表情第233号,是一张捶地大笑的表情,因此不少网友就喜爱在贴吧、论坛、弹幕网站等评论中加上一句“233”,最开始只是233,随后“233”演变为23333或者更多3跟在后边表示自己笑得很猖狂~多个3还可表示笑声持久,用来显示讽刺或表示内心欢喜,就像这样根本停不下来23333333333333……

猫扑第233表情

当电脑看到“2333”时,她觉得是什么意思
试想一个情境,如果你拿到100条玩家说的话,你要这么去分析玩家的情感态度?
我们怎么做?
你可能会这么做,通读这100条语句,判断每条语句玩家的态度是正面的、负面的还是中性的。
你也可能这么做,将玩家说的这100条语句进行分类,发现某些话是在赞美时装,某些话是在讨论打本,还有一些话在热烈“818”。
然后,你拿到了500条玩家语料,你又要怎么去分析?可能是硬着头皮上吧。
那么,如果你拿到了50000条玩家语料,你又打算怎么办?你可能会找寻小伙伴一起帮忙,也可能随机选取里面的少部分语料进行分析……
当然,我们也可以叫电脑为我们做这件事情。
电脑怎么做?
如果是电脑来分析这50000条语料,对她来说第一件麻烦事就是她不是很能读中文的句子——和英文语句不一样,空格隔开了两个词,所以她要先把句子变成词语,这个转句子为词语的过程就是切词。
切词是进行情感分析的基础,按照一定的策略将待分析的语句与机器词典中的词条进行匹配,如果找到了某个词,那么这个词就会被识别。
进行切词之后,电脑得到了比50000条更多的词,此时她还是不懂这些词是什么意思,然后她开始了第二次查词典的过程。这次她要查的词典是每个词的态度是什么,比如“优秀”是一个正向的词,“恶劣”是一个负向的词,当她有一个词典可以去对照的时候,就知道了每个词的情感极性(正向/负向/中性)。
我们电脑虽然比较笨,什么都要教,什么都要查,但是记忆力很好,有多少词就能记住多少,还可以把这些词对应到切词前的语句中,最后就可以告诉我们每一句话的情感极性了。
这里还要特别指出电脑是怎么处理那些否定词的,比如“不好”,电脑就会将一个-1的得分去乘以“好”的极性。这是时候问题来了,“不得不说好”这是怎么处理的呢,电脑会用(-1)^2去处理,这就是“双重否定表示肯定”了,三重就是(-1)^3,以此类推。
情感分析的优缺点
用电脑的优点非常明显,迅速、可以处理大量的数据、标准统一。迅速和处理大量的数据就是字面上的可以帮助我们迅速的处理哪怕是量很大的文本语句。标准统一是指我们人工处理虽然比电脑聪明,会直接读语句,但“一千个读者就有一千个阿姆雷特”,不同的人的理解不一样,也就造成了分析的偏差,而“傻瓜”电脑则不会有这样的偏差。
不过这种简单的电脑情感分析弱点也显而易见,就是“太笨”。中华语言博大精深,电脑目前处理否定词都要单独处理,更别提强调,反问,否定之否定了,试想如果问电脑“一把把把把住了”什么意思,她会理解成什么。
怎么提高情感分析的准确率?
我们的电脑处理文本虽然准确率不高,但胜在快速量大,当然我们目前也能采用一些方法来让结果变得更为准确。方法一就是扩充字典,举个例子,现在被广泛应用的情感字典是知网的“中文情感分析词语集”(董振东和董强,2007;杜振雷,2013),这个词典归纳了表达正向、负向倾向的词语还有程度词。
但是当我们把这个词典拿去分析弹幕等含有更多网络用语的文本时,就不太够用了。这时候我们可以加入其它词典,比如肖卓等人(2015)使用的多维情感字典,包括7类情感,在这个词典中,“2333”这个原字典中的中性词汇在7维情感字典中就被归入了“乐”这种情绪,还有“男神”、“逆天”、“牛逼”等词就被归入“好”这个维度。
除了丰富字典之外,我们还可以用不同的字典做出结果之后再交叉比较来增强准确性。最后,更高阶的,可以使用机器学习比如聚类来分析文本,也可以使用卷积神经网络和模糊算法来分析图片。情感分析远不止分词然后查字典这么简单,情感分析相关的NLP技术有文本信息编码word2vector,sense2vector,elmo等,文中介绍的只是一种基础的、简单的情感分析方法。
猫扑第233表情
总之,算法有很多种,也在不断改进,我们用户研究也在不断与时俱进。之后会有更多研究的展示哦,尽请关注。