來(lái)源:中國(guó)青年報(bào)
2023-05-10 08:55:05
原標(biāo)題:守護(hù)困在信息系統(tǒng)“盲區(qū)”的生僻字
來(lái)源:中國(guó)青年報(bào)
原標(biāo)題:守護(hù)困在信息系統(tǒng)“盲區(qū)”的生僻字
來(lái)源:中國(guó)青年報(bào)
http://vod.cyol.com/vod/data/video/202305/10/faea65b8-b41d-415d-c220-ceca352992bf/transcode_29fbfa15-313f-6a03-6ae8-f99a8b7e.mp4/av-g.m3u8
最近,一個(gè)生僻字沖上熱搜。[(上邊是少了一橫的“鳥”,下邊是“甲”),nia,四聲]姓是云南麗江傈僳族中一支以鳥為圖騰家族的姓氏,這個(gè)字為上下結(jié)構(gòu)的漢字,上邊是少了一橫的“鳥”,下邊是“甲”。
進(jìn)入數(shù)字時(shí)代,由于(nià)這個(gè)姓氏無(wú)法在信息系統(tǒng)中使用,為避免購(gòu)票、辦卡等均無(wú)法正常輸入、顯示的麻煩,該姓氏的上百人被迫把姓改成了“鴨”。
據(jù)統(tǒng)計(jì),全國(guó)有6000萬(wàn)人名及大量地名、古籍、方言中包含生僻字,其中多數(shù)尚未實(shí)現(xiàn)數(shù)字化。很多人名、地名中的生僻字還無(wú)法在信息化系統(tǒng)中正常使用。
數(shù)字時(shí)代,我們?cè)撊绾问刈o(hù)那些被困在信息系統(tǒng)“盲區(qū)”的漢字?中青報(bào)·中青網(wǎng)記者在溫暖一平方直播間展開(kāi)了采訪。
中國(guó)社會(huì)科學(xué)院語(yǔ)言研究所研究員、原詞典編輯室主任譚景春認(rèn)為:“漢字正是由于獨(dú)特的表意方塊形體,才具備超時(shí)間和空間的能力,使得我國(guó)7個(gè)大方言區(qū)的人們的交流在書面上能夠順利進(jìn)行,也使得中國(guó)幾千年的燦爛文化能夠留傳至今。”
譚景春表示,“漢字收錄在《康熙字典》里的有4萬(wàn)多個(gè),收錄在《漢語(yǔ)大字典》里的有6萬(wàn)多個(gè),收錄在《中華字海》里的有87019個(gè)。不過(guò)現(xiàn)代通用的也就5000到8000個(gè),比如2013年6月,由國(guó)務(wù)院正式發(fā)布的《通用規(guī)范漢字表》收錄了8105個(gè)漢字”。幾千年來(lái),漢字在維護(hù)民族和國(guó)家的統(tǒng)一,記錄和保存文化遺產(chǎn)等方面發(fā)揮了巨大的作用。
每一個(gè)生僻字姓氏,往往承載著本土文化的“基因”。
《中國(guó)民間故事叢書》的云南麗江華坪卷,記述了關(guān)于傈僳“nià”姓來(lái)歷的傳說(shuō)故事。
傳說(shuō)很久很久以前,深居在大山里的一戶傈僳族人家生下了一個(gè)小孩,但沒(méi)幾天小孩的媽媽因病去世,父親用鳥肉湯喂養(yǎng)小孩活下來(lái),逐漸長(zhǎng)大。為了讓孩子記住這段經(jīng)歷,父親就給他取了一個(gè)名,叫“nià”,意思是用鳥肉湯喂大的孩子。從此以后,傈僳族中就有了這個(gè)姓氏。
“nià”這個(gè)姓氏留存著傈僳族對(duì)如守護(hù)神一般鳥類的紀(jì)念和崇拜。因姓氏無(wú)法在信息系統(tǒng)中順暢地輸入與顯示,為了避免麻煩被迫改姓“鴨”,這是一種何其無(wú)奈的遺憾。“棄用”生僻漢字,無(wú)疑意味著當(dāng)?shù)厝吮黄雀钌崃艘欢紊詈竦拿褡鍤v史文化。
[(冫口),zhàn]子莊位于山東省日照市東港區(qū)濤雒鎮(zhèn)駐地東南7公里,緊鄰黃海,交通便捷。因“(冫口)”字生僻,20世紀(jì)80年代地名標(biāo)準(zhǔn)化的過(guò)程中,在官方名稱里被同音字“棧”替代。
山東日照棧子村村民傅承田接受中青報(bào)·中青網(wǎng)記者采訪時(shí)表示,傳說(shuō)清朝時(shí)一位軍官發(fā)現(xiàn)地圖上此地沒(méi)有名字,便集思廣益,讓當(dāng)?shù)厝艘黄鹑∶2糠肿x書人觀察地形、方位和周圍物象,最終造出了“(冫口)”這個(gè)字和zhàn的讀音。村里50歲以上的人都知道“(冫口)”字的來(lái)歷,但是年輕人對(duì)這個(gè)字和背后的來(lái)歷沒(méi)有印象。
傅承田說(shuō),該村目前居住著3000多人,在外地的約有四五千人。“我非常希望‘(冫口)’字能夠讓更多人了解,讓我們村的歷史也能返璞歸真”。
由于漢字屬于象形、表意文字,難學(xué)、難記、難寫。進(jìn)入了數(shù)字時(shí)代,用鍵盤輸入漢字仍然存在著難寫的問(wèn)題——有些漢字打不出來(lái)。譚景春認(rèn)為“這是數(shù)字時(shí)代對(duì)漢字提出的挑戰(zhàn),同時(shí)也是時(shí)代給予中華民族的一次機(jī)遇”。
在譚景春看來(lái),打不出生僻字,不僅會(huì)給一部分人的工作和生活帶來(lái)困擾和不便,也意味著寶貴的漢字文化遺產(chǎn)正在流失。
為何生僻字的信息化如此難?
工信部電子工業(yè)標(biāo)準(zhǔn)化研究院中文信息研究室主任黃姍姍介紹,漢字是一種表意文字,跟表音文字不同。每個(gè)漢字都有它獨(dú)特的含義和字形,那么生僻字其實(shí)就是表意字所特有的信息處理問(wèn)題。“信息系統(tǒng)要認(rèn)識(shí)漢字就需要一字一形一碼來(lái)建立對(duì)照表,一個(gè)漢字有形沒(méi)有碼,或者編碼不被某個(gè)系統(tǒng)所支持,就成了信息時(shí)代的生僻字”。
黃姍姍說(shuō),漢字信息化編碼難度高,開(kāi)發(fā)字庫(kù)的工作費(fèi)時(shí)費(fèi)力,生僻字的標(biāo)準(zhǔn)化專業(yè)又復(fù)雜。“目前的一個(gè)痛點(diǎn)是,雖然盡管很多字已經(jīng)被收錄進(jìn)了標(biāo)準(zhǔn),但是產(chǎn)品對(duì)標(biāo)準(zhǔn)的支持并不充分。大多數(shù)應(yīng)用、軟件產(chǎn)品支持的漢字量都在2萬(wàn)-3萬(wàn),一些個(gè)性化的字庫(kù)產(chǎn)品甚至只有幾千字”。
黃姍姍坦言,生僻字的搜集和整理是一個(gè)長(zhǎng)期的工作,已經(jīng)開(kāi)展了幾十年,未來(lái)還會(huì)繼續(xù)開(kāi)展。
日前,由騰訊搜狗輸入法聯(lián)合工信部電子工業(yè)標(biāo)準(zhǔn)化研究院等多方發(fā)布“漢字守護(hù)計(jì)劃”公益行動(dòng),守護(hù)那些“被困”數(shù)字時(shí)代盲區(qū)的生僻字。
今年4月20日“聯(lián)合國(guó)中文日”,搜狗輸入法聯(lián)合多方上線全國(guó)首個(gè)“生僻字征集”微信小程序,直接面向用戶征集無(wú)法輸入的生僻字。該程序是由工信部電子工業(yè)標(biāo)準(zhǔn)化研究院指導(dǎo)和推薦的生僻字提交入口,用戶通過(guò)拍照上傳,即可提交。
“生僻字征集”小程序上線后,首日訪問(wèn)量突破63萬(wàn),用戶提交生僻字1404個(gè)。經(jīng)專業(yè)審核,通過(guò)的生僻字將被賦碼并錄入國(guó)標(biāo)字庫(kù),最終實(shí)現(xiàn)在電腦、手機(jī)等設(shè)備及信息系統(tǒng)中無(wú)障礙地輸入與顯示。
工信部電子工業(yè)標(biāo)準(zhǔn)化研究院副院長(zhǎng)孫文龍表示:“電子標(biāo)準(zhǔn)院2022年?duì)款^制定強(qiáng)制性國(guó)家標(biāo)準(zhǔn)GB 18030《信息技術(shù) 中文編碼字符集》,所有政務(wù)服務(wù)、公共服務(wù)的產(chǎn)品與系統(tǒng)均須符合標(biāo)準(zhǔn),這將有效解決生僻字引發(fā)的公共障礙。”
中青報(bào)·中青網(wǎng)記者 沈杰群 來(lái)源:中國(guó)青年報(bào)
想爆料?請(qǐng)登錄《陽(yáng)光連線》( https://minsheng.iqilu.com/)、撥打新聞熱線0531-66661234或96678,或登錄齊魯網(wǎng)官方微博(@齊魯網(wǎng))提供新聞線索。齊魯網(wǎng)廣告熱線0531-81695052,誠(chéng)邀合作伙伴。