
序
乙巳四月卽至,蜀地氣候乖張。月初猶聞油菜花頭殘雪;倏爾艶日高懸,單衣汗流。至月中,黃沙漫捲,重衾不暖。方數日,又炎威再熾,空調難歇。昔者四時行而百物生,今草木榮悴失時,雀鳥惶惶易巢。冬夏無序,春秋失期。惟余慨之:此誠發佈新字體之良時也。(啊?
正文
1. 介紹
抱歉,一開頭讓大家看了一段奇怪的文字,但細心的大家一定發現了(?),這段文字(包括我接下來的所有文字)的用字是不同尋常的,他旣不同於目前港台所用的繁體標準,也和之前大衆所認知的所謂“大陸標準繁體”不盡相同。
我用的這一套標準其實就是我國新近頒佈實施的《古籍印刷通用字規範字形表》(GB/Z 40637-2021)標準繁體(以下簡稱《古籍表》、「古籍表字形」)。
這個《古籍表》
是在北京师范大学资深教授王宁先生的带领下,以汉字学科学理论为指导,以我国第一部大型辞书《辞源》所收文言词汇为切入点,在对海量古籍数字化资源进行统计测查基础上,确立严谨、科学的规范原则和验证条例,按照定字数、定主形、定笔数、定字音、定编码的“五定”目标,历时6年研制完成的。这是新中国成立以来对传世古籍印刷字的第一次整理规范。
该标准规定了古籍印刷通用字收字和宋体字形规范原则,给出了14250个古籍印刷通用字的字形、字音以及在国际编码字符集ISO/IEC 10646中的码位,适用于传世古籍的印刷出版,以及现代书刊的繁体版印刷。该标准的发布实施,对于推动语言文字规范化标准化信息化,传承弘扬中华优秀传统文化,建设社会主义文化强国都具有重要促进作用。
用不太準確但最容易理解的話説:此表是我國大陸地區第一個正式的繁體字規範。
我願稱之爲 真·國標繁體。
2. 讚
那麽可能有人要問了,爲什麽我們需要這樣一個繁體字規範呢?
很簡單,因爲我們很長時間裏都缺這麽一個東西。衆所周知,國朝以簡體爲正,自上世紀五十年代頒佈簡化漢字方案以來,各種語言文字改革皆是在對簡體系統進行修補與規範,而所謂的繁體一直没有一個正式的規範。像《第一次异体字整理表》其本身是一個簡化漢字的起手式,而非給繁體字定正字。後來《汉字简化方案》一直到《通用规范汉字表》所列的繁體、異體也只是告訴大家我們現在所用的簡體字是從哪些字簡化而來的,也不是對繁體字的正字做了一個規定。繁體作爲一種被棄之不用了的東西,被看作是一種“古代文字”,且在如今國人對港台某一撮人觀感日益惡化的背景下,用繁體甚至被認爲是前朝餘孽、境外敵對勢力的象徵。這是很不健康的,畢竟在大陸,還是有很多學語言文字專業或者從事相關研究的人、對傳統文化熱愛的人、學習書法的人、漢字廚,乃至於裝愛逼標榜自己與衆不同的人,都有着使用繁體字的需求。這些人可能在人群中所佔比例不大,但在十四億人口的基數下,人數比境外用繁體的人還多也説不定。
在這樣的情况下,没有我們自己的繁體字規範就很不好了。没有規範,人們就只能按照現有的簡體字規範去猜測“規範繁體”的樣貌。這就出現了很多對於繁體來説很不舒服的操作:比如按照《第一次异体字整理表》的規定,把很多歷史上普遍承認且使用的正體打成了異體(像災、異就以灾、异爲正);還有一些諸如 爭/争、換/换 這種一般認知上算繁簡體區别——但按簡體規範是新舊字形區别的字,在繁體書裏也按新字形寫 争、换。這些操作,把現代繁體印刷書籍的面貌弄得很奇怪,所以很多時候,人們都自發地不按照這種“規範”來做,國内繁體書籍的用字因此相當混亂,通規字體、港台標準混雜使用,很多時候用啥字都是按照作者或編輯自己的習慣來,没什麽標準可言。
你没有規範,你不去制定、主導、引領規範,就會被其他地方的規範帶着走,被其他地方的規範奪取話語權與代表權,這是很不好的。繁體字不僅僅是古代文字,也不是只有港台人會用的文字,他是堂堂正正的中國原生文字,是每個中國人都可以拿來學習使用的溝通古今、連接未來的工具。
所以説《古籍表》的頒佈,填補了相關領域一個很大的空白。結束了我們“無法可依”的歷史。
3. 歎
不過,這個表也不是没有毛病的,目前主要有四方面的問題:
① 正異體的取捨不明
表裏包含了一些意思完全相同的正異體字,比如晋𣈆晉,但没有明確説用哪個爲正。可能後續會出分級字表來解決這一問題,現在只能靠《辭源》字頭來猜定了。
② 對近代白話文用字的支持不太好
據《古籍表》宣稱其适用于传世古籍的印刷出版,以及现代书刊的繁体版印刷。然而現代書刊會用到的一些近代常用字、分化字並未收錄進《古籍表》,比如剪、呆、嚐、慾、揹、餚、崗等等,最離譜的是連“古”這個字都被漏收,非常令人費解。這些字在文言及古、近代白話中都是會用到的,但可能因爲《古籍表》所用的統計數據大多數是古籍,就没能照顧到這一塊。但畢竟其宣稱了可用於現代書刊的繁體版印刷,那麽還是有必要將近現代白話文(特别是民國時期大量的白話文書籍、文章)的實際用字也納入考慮,以供現代文參考使用。
③ 表内部件類推不完善
古籍表相對通規字而言,修正了很多部件的寫法。但是可能因爲種種原因,這些修改部分並没有完美地落實到每一個字上,使表内殘留了一些類推不完善的字。
這個倒是不算大問題,畢竟看了表之後我們都能理解到其修改意圖,做字體時自己按規律做就好,或者保持原樣也無妨。
④ 配套設施極其不完善
重點來了,這套標準,説是新近頒佈的,其實也正式發佈了好幾年了,但似乎没在市面上砸出什麽水花。都這麽久了,大衆還是没有啥配套的東西可用。
要想把這套東西用起來,起碼需要兩個重要的東西——輸入法和字體。
輸入法負責標準字碼的打出,字體負責標準字形的顯示。
現在市面上的輸入法一般都支持繁簡轉換,但是繁體幾乎都是按照港台(甚至就只是台灣)標準來做的。
或者像微軟拼音那種不知道哪兒搞的“類國標野雞轉換標準”。
我曾經還給搜狗拼音發過功能建議,當然結果是没人搭理。
所以目前還没有看到哪個輸入法大廠説是要支持這個。
當然,我們是可以用開源輸入法(rime)實現打古籍表字的目的的,原理也很簡單,加入一個簡體或者繁體與古籍表字的對照表進去就行了。在github上也有别人做的現成的古籍表opencc文件可用。
就是得自己折騰折騰,不太方便。
而字體方面,是有一個《古籍表》本身印刷用的方正古籍規範宋,不過一般人不怎麽好下載到,且版權字體也不好隨便使用。
除此之外,倒還有兩個免商字體,一個是我之前發的京華老宋體,還有一個是基於思源宋做的文津宋體,這兩個都可以用樣式集的方式,把字體換成古籍表標準的形式。
但是這個用法實在是略有門檻,一般人很難直接放在手機或電子書使用。
當然,抱怨這麽多問題不是説《古籍表》不好哈,這都是需要時間慢慢改、慢慢完善的。
像前兩個問題,就得靠專業人士繼續努力研究補充,而後兩個問題則需要各字體、軟件廠商去支援開發。
而我,作爲一個野生奏字人,感覺自己除了抱怨,似乎也可以做點什麽——爲其添點磚、加點瓦。
所以這次,我做了這麽一個工具包,其中就包含了輸入法和字體兩大配套設施:
工具包發佈
前摇完成,終於到了正式發佈環節。
1. 輸入法
首先是輸入法,我折騰了兩個rime輸入法方案。

一個是基於小狼毫自帶的朙月拼音修改的朙月拼音-古籍規範版,朙月拼音本來就是用的繁體詞庫,轉換起來很方便,一個字表就可以搞定。
一個是基於白霜詞庫修改的白霜拼音,這個是一個很強大的多功能簡體詞庫,支持各種符號、emoji輸入,還可以拆字輸入,對於用慣了微軟拼音拆字功能的人來説很親切。而因爲是簡體詞庫,所以除了轉換字表,還要配一個詞表,以處理那些一簡對多繁的字。
而轉換用的字、詞表的基礎都來自於github上的古籍表opencc項目,然後我根據自己使用時覺得不舒服的地方,調整了一些過於古舊的用字(纔、喫、翫之類的)的出現優先級,以防默認出詞面貌看起來太老古董。
這兩個方案我試着打包弄成了可以直接安裝的exe文件,畢竟想着儘量要降低使用門檻,卽裝卽用肯定是最好的(也方便我換電腦時安裝)。就是裝的時候注意⚠️最好别亂改安裝路徑和用户文件夾位置,不然可能會用不了…
當然,你也可以選擇自己折騰,單獨的yaml文件和opencc文件我也有提供出來,可以用到其他旣有方案裏去。
2. 字體
然後是字體,這我老本行了,可謂輕車熟路。這次我一下做了兩種,一種黑體一種宋體。

黑體基於思源黑體改造,擴B區的字取自遍黑體
宋體基於思源宋體改造,擴B區的字取自文津宋體
得益於思源豐富的地區字形,拆拆湊湊很方便就可以改出一個古籍表版本。而關於那些部件不統一的字,我有選擇性地擅自進行了統一。

然後黑體和宋體各提供了兩個版本,一個是僅包含古籍表表内字的純古籍表版,一個是把古籍表外的——思源本來有的那些字一股腦放進去的“F”版本(當然這些表外字就没有按古籍表規範修改,保持思源原樣)。

各位可以按需選用。日常看書寫東西可以用F版,確保不缺字。
如果要作爲做字體的參考或者煉丹的底子,就可以用純古籍表版,以免被表外字誤導。
(没錯,其實這次弄這倆字體,本來就是作爲煉丹工具性質的
除了這倆思源改,我的竹音仿宋和東鄉明朝還在緩慢製作中,都是優先基於古籍表的構型規範做的。單獨的京華老宋體古籍表版本正在調試中,後續會擇日放出(坑+1)
除了這些“魚”,我還準備了一些“漁”:我把我做字體時用到的、總結的各種字表都放在了包裏。各位做字同仁可對照這些表,把自己的國標字體改造成古籍表標準。(後面我可能也會專門開一個文章來寫下這倆具體的區别。(坑又+1))

誠然本人學識有限,不免會有錯漏之處,如使用時遇到什麽問題,望諸位能評論反饋。
費力搞這些東西不爲别的,一是填補相關領域空白,二是滿足我自己用,三是方便之後煉丹。
也希望能讓更多人瞭解並方便地把古籍表字形運用起來。
也算是進行一個抛磚引玉了吧。
最新评论
鲜要修,着字不用修。
乍一看字形问题挺多,如简体样例中“执着”“鲜艳”,一字细一字粗笔画差异明显——噢原作就有这问题,那得从根子上修了。
年中狂欢购,好像是商用字体,这有点坑人
字符数量错误,应该不正常,建议修复字符数量。
为什么在猫啃网搜不到金山云技术体了呢?
可以使用,FAQ里有写,嵌入式字体需要标注
不能,这个字体不能用来做商标
请问有这个字体的版权证书吗