一种校正输入中文拼写的方法
申请公布号:CN102541837A
申请号:CN201010605512.2
申请日期:2010.12.22
申请公布日期:2012.07.04
发明人:周连惠
分类号:G06F17/27(2006.01)I
主分类号:G06F17/27(2006.01)I
地址:215600 江苏省张家港市国泰北路一号留学人员创业园A235-236
摘要:本发明公开了一种校正输入中文拼写的方法,本发明把计算机的汉语文本通过标点符号和非汉字字符串作为节点,切分成若干个子句,然后再以代词、助词、连词作为每个子句的节点,把子句切分成几个字长大于等于2小于等于8的词单元,在后台把这些词单元转换成汉语拼音,然后与相同字长的语料库的词组拼音进行循环字长递减匹配,直到找到与要校正的词单元相同拼音的全部词组,然后在进行字的匹配,如果符合条件字的匹配率大于等于0.5小于1,那么就把该词单元筛选出来,用红色下划线标示在文本中,用户可以进行比较选择。本发明能够大量减少计算机文本中的错别字,减少完全依赖人工的办法矫正汉语文本的落后局面,提高效率。
主权项:一种校正输入中文拼写的方法包括语料库和计算机软件,其特征在于对选定的汉语文本文件以标点符号和非汉字字符串为节点,切分成若干个子句;然后以代词、助词、连词、联绵词、缩略语和专有名词为节点子句再切分若干个字长不多于8个的词单元;然后对每个词单元与语料库的同样字长词组进行拼音的循环递减匹配,直到找到拼音相同的词组。
VERFAHREN ZUR HERSTELLUNG VON HEXAMETHYLEN-BIS-DICYANDIAMID
KUEHLVORRICHTUNG FUER VERBRENNUNGSMOTOREN
OBERSCHALIGE WAEGEVORRICHTUNG, INSBESONDERE ZUR DIGITALEN KRAFTMESSUNG
BARRING POST OF A PARKING PLACE FOR A VEHICULE
AUTOMATIC APPARATUS FOR CHANGING RECORDS
SWITCH MEANS FOR RADIO ALARM DEVICE
METHOD FOR COMPRESSING GASEOUS MATERIALS IN A CONTAINED VOLUME
APPARATUS FOR BRINGING VAPOR INTO CONTACT WITH LIQUID
SOLAR ENERGY CONVERSION SYSTEM
TOE PULLING OVER AND LASTING MACHINE
RADIANT HEATING SYSTEM USING PARTITIONED LIGHTING PLENUMS
INSTALLATION FOR FLARING TUBES BY ELECTRO-IMPULSION