天眼查App显示,5月25日,腾讯科技(深圳)有限公司获得“新词发现的方法、设备、计算机存储介质、电子设备”专利授权,公告号为CN112559694B,申请日为2021年2月。
专利摘要表明,该方法包括:获取候选字符串后,利用目标字符串的前缀和后缀(词库中没有记录)计算信息熵。如果目标字符串与其上下文的关联度高,则目标字符串不具有独立的语义,不构成词汇,而关联度低则表明目标字符串具有独立的语义,可以构成词汇。该方案利用信息熵分值过滤掉没有独立语义的目标字符串,提高新词发现的准确性。
版权声明:内容来源于互联网和用户投稿 如有侵权请联系删除