专利名称:文本分类方法和装置专利类型:发明专利
发明人:蒋卓,赵建强,黄剑,张辉极申请号:CN201911326228.9申请日:20191220公开号:CN111078887A公开日:20200428
摘要:本申请实施例公开了文本分类方法和装置。该方法的一具体实施方式包括:获取待分类文本;对待分类文本进行分词,得到词语列表;对待分类本文中的文字进行声调划分,得到声调组合列表;确定词语列表中的每个词语的词向量,以及确定声调组合列表中的每个声调组合的声调向量;将所得到的词向量和声调向量输入预先训练的文本分类模型,得到用于表征待分类文本的类别的标签。该实施方式实现了将词向量和声调向量相结合,从词和声调两个维度分别提取文本的语义和语调特征,使用这些特征可以有效地改善字/词级特征存在的不足,提高文本分类的准确性。
申请人:厦门市美亚柏科信息股份有限公司
地址:361000 福建省厦门市软件园二期观日路12号102-402单元
国籍:CN
代理机构:厦门福贝知识产权代理事务所(普通合伙)
代理人:陈远洋
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容