首页 > 专利信息

一种校正输入中文拼写的方法

申请公布号:CN102541837A

申请号:CN201010605512.2

申请日期:2010.12.22

申请公布日期:2012.07.04

申请人:
张家港市赫图阿拉信息技术有限公司

发明人:周连惠

分类号:G06F17/27(2006.01)I

主分类号:G06F17/27(2006.01)I

地址:215600 江苏省张家港市国泰北路一号留学人员创业园A235-236

摘要:本发明公开了一种校正输入中文拼写的方法,本发明把计算机的汉语文本通过标点符号和非汉字字符串作为节点,切分成若干个子句,然后再以代词、助词、连词作为每个子句的节点,把子句切分成几个字长大于等于2小于等于8的词单元,在后台把这些词单元转换成汉语拼音,然后与相同字长的语料库的词组拼音进行循环字长递减匹配,直到找到与要校正的词单元相同拼音的全部词组,然后在进行字的匹配,如果符合条件字的匹配率大于等于0.5小于1,那么就把该词单元筛选出来,用红色下划线标示在文本中,用户可以进行比较选择。本发明能够大量减少计算机文本中的错别字,减少完全依赖人工的办法矫正汉语文本的落后局面,提高效率。

主权项:一种校正输入中文拼写的方法包括语料库和计算机软件,其特征在于对选定的汉语文本文件以标点符号和非汉字字符串为节点,切分成若干个子句;然后以代词、助词、连词、联绵词、缩略语和专有名词为节点子句再切分若干个字长不多于8个的词单元;然后对每个词单元与语料库的同样字长词组进行拼音的循环递减匹配,直到找到拼音相同的词组。

专利推荐

DISPERSE MONOAZOFARBSTOFFE UND VERFAHREN ZU IHRER HERSTELLUNG SOWIE IHRE VERWENDUNG ZUM FAERBEN VON SYNTHETISCHEN TEXTILMATERIALIEN

DISPERSE MONOAZOFARBSTOFFE UND VERFAHREN ZU IHRER HERSTELLUNG SOWIE IHRE VERWENDUNG ZUM FAERBEN VON SYNTHETISCHEN TEXTILMATERIALIEN

VERFAHREN ZUR HERSTELLUNG VON HEXAMETHYLEN-BIS-DICYANDIAMID

KUEHLVORRICHTUNG FUER VERBRENNUNGSMOTOREN

VERFAHREN UND VORRICHTUNG ZUM UEBERTRAGEN EINER VERGLEICHSFLUESSIGKEIT VON EINER AMPULLE AUF EIN ELEKTROCHEMISCHES MESSINSTRUMENT

METHOD FOR TREATING WATER

OBERSCHALIGE WAEGEVORRICHTUNG, INSBESONDERE ZUR DIGITALEN KRAFTMESSUNG

BARRING POST OF A PARKING PLACE FOR A VEHICULE

AUTOMATIC APPARATUS FOR CHANGING RECORDS

TWIN BELT VACUUM WASHER

SWITCH MEANS FOR RADIO ALARM DEVICE

METHOD FOR COMPRESSING GASEOUS MATERIALS IN A CONTAINED VOLUME

ROTARY ENGINE VALVE

APPARATUS FOR BRINGING VAPOR INTO CONTACT WITH LIQUID

SOLAR ENERGY CONVERSION SYSTEM

TOE PULLING OVER AND LASTING MACHINE

RADIANT HEATING SYSTEM USING PARTITIONED LIGHTING PLENUMS

INSTALLATION FOR FLARING TUBES BY ELECTRO-IMPULSION

ONE-PASS COMPLETE TILLAGE SYSTEM

GREASE COMPOSITIONS