陈堃銶:汉字激光照排的“另一半”——《大美 · 中国女科学家》

她为我国的印刷出版业技术进步,以及以计算机技术改造传统产业做出了重大贡献。在荣誉面前,她如是说:“我就希望,咱们知识分子,还是要有原来的气节和风骨,尽量不要随波逐流,最好自己要有定力,无论什么样的情况下都能够踏踏实实地工作,静下心来。”

她是陈堃銶,作为汉字激光照排系统大型软件的总设计者和负责人,陈堃銶教授入选由中国科学技术协会出品,中国科协常委会女科技工作者专门委员会和中国女科技工作者协会统筹策划的系列丛书《大美·中国女科学家》。书中重点刻画了陈堃銶与王选及北大计算机所科研团队一道,科技报国、潜心钻研、百折不挠、拼搏奉献的感人事迹和淡泊名利、提携后学的人格魅力,请君品读。

陈堃銶教授入选《大美·中国女科学家》

我们都知道,汉字处理实现计算机化的关键一步,是由王选研发的汉字信息处理与激光照排技术。在计算机系统性能极为有限的年代,这项技术以独特的方式存储、编辑和输出汉字,使信息庞大的汉字实现了数字化,从而令中国印刷业“告别铅与火,迎来光与电”。这被誉为继北宋时期毕昇发明活字印刷术之后,中国印刷业的又一次革命,也为信息时代汉字和中华民族文化的传播与发展创造了条件。

但很少有人知道,汉字激光照排系统使用的字形信息压缩方案,其实是由王选和他的夫人陈堃銶共同研究的;而系统早期所用的软件,也是出自她的创造。这对科学家伉俪在科研道路上携手并进,各尽所长、密切配合,令一项伟大创举终成现实。

1967年陈堃銶与王选在北大未名湖畔

王选“最幸运的选择”

身兼中国科学院、中国工程院、第三世界科学院院士的著名计算机科学家王选,曾经在回顾自己的人生时表示,他的一生中有10次左右改变人生走向的重大选择,而最为重要也最为幸运的一项,便是与陈堃銶的结合。他们在一个对科研工作者来说最为艰难的时代里结缘,并且在此后的岁月里彼此扶持,一起完成了汉字激光照排这项中国计算机科学领域的伟业。

1953年,从杭州高级中学毕业的陈堃銶,考入了北京大学数学力学系。4年之后,作为中国第一届计算数学专业毕业生, 她留校进入数学力学系计算数学教研室担任助教。在这个岗位上, 她见证了新中国计算机研究事业的黎明。1958年,北京大学决定研制每秒能运行10000次定点运算的中型计算机“红旗机”,在当时,这样的运算速度可以跻身全球前20名。北京大学成立了研发团队“红旗营”,陈堃銶在其中负责软件部分的培训与设计,以及各种杂务。在这个团队里,就有她未来的丈夫,同样留校参与科研的王选。

当时,为了更好地了解国外计算机科学的进展,王选养成了看外文资料的习惯,时常请陈堃銶搜集计算机方面的英文资料进行研读。几年过去,在研读国外计算机文献的过程中,王选逐渐领悟到,只有从事软、硬件相结合的研究,探讨软件对未来计算机体系结构的影响,才有助于学术素养的精进。他决定从研制ALGOL 60高级语言编译系统入手,而陈堃銶则帮他找到了一本油印的英文资料《ALGOL 60修改报告》。1964年,读懂了这部“天书”的王选,开始了ALGOL 60编译系统的设计,计划将它应用在 DJS 21型计算机上。

ALGOL 60编译系统是国内最早真正实用的高级语言编译系统,而且具有当时不多见的在源语言级上的调试功能。当时,王选每设计好一部分方案,就将它寄到北京大学;而陈堃銶则是负责实现这些设计的几名教师之一,担任系统核心模块的程序设计。后来,这套系统获得了几十名用户,在计算机凤毛麟角的当年, 称得上是出色的成就。在《中国计算机工业发展简史》和《中国计算机行业大事年表(1956—1983)》中,ALGOL 60系统也赫然在列。

1985年,陈堃銶在华光Ⅱ型系统鉴定会上作技术报告

一次次科研中的共同奋斗,使王选和陈堃銶从同学和同事成为恋人。当时间进入1966年,“文化大革命”的浩劫开始了。在打击、挫辱知识分子的社会氛围里,王选学习外国资料和英语也成为一种罪行。

1967年,就在人们对王选“避之不及” 的时候,陈堃銶却主动与他结为夫妻。从此之后,他们一起踏上了同甘共苦、相濡以沫的科研和人生之路。

在当时,做这样的选择需要很大的勇气,甚至需要赌上自己的事业。1969年,北京大学参与研制150计算机,陈堃銶调入编译程序组。但因为与王选的婚姻,再加上父亲因在抗战时期是国民党某通讯部门技术负责人而被打为“历史反革命”,她被认为存在“家庭社会关系”问题,入组不到3天就被逐出。而后,她又被派到地质仪器厂,一边搞项目,一边接受“再教育”。不过,是金子在哪里都会发光。陈堃銶成功地解决了一些技术问题,受到工厂欢迎,使身处逆境中的她感到了些许温暖和慰藉。而与此同时,一个新的人生机遇正等待着她和王选。

汉字字模信息压缩了五百倍以上

1975年年初,陈堃銶参加了由北京大学组织的一项关于计算机应用的调研。在这次会议上,她了解到中国已经启动了一项汉字信息处理系统工程。这是 1974年8月在周恩来总理支持下设立的国家重点科研项目,所以也称为“748工程”。它包括了3个子项目,分别是汉字精密照排系统、汉字情报检索系统、汉字远传通信系统。

汉字精密照排系统引起了王选的兴趣。他和陈堃銶经过仔细分析,认定这是一个价值和前景不可估量的重大项目。所谓“汉字精密照排”就是运用计算机和相关的光学、机械技术,对中文信息进行输入、编辑、排版、输出以及印刷。在20世纪70年代, 欧美发达国家的出版业都引入了计算机照排技术,以取代活字印刷,提高工作效率。而当时的中国,仍然在使用落后的铅字排版和印刷,这不仅限制了出版工作的效率,而且能源消耗大,环境污染严重。

但想要实现汉字的计算机照排,第一步就要解决汉字字形信息的存储问题。王选认为,这样的系统一定要使用“数字储存”的方式,也就是将每个字变成由许多小点组成的点阵,存储在计算机内,每个点对应着计算机里的一位二进制信息。陈堃銶完全同意王选的观点,并且在工作之余参加到王选的研究当中。但他们很快就被汉字字形庞大的信息量惊住了。

陈堃銶教授与年轻人讨论科研工作

我们知道,英文只有26个字母,大小写一共才52个,字体和字号再变化,存储量问题也并不突出;其他以拉丁字母来书写的文字,比如法文、西班牙文和德文,字母也都大同小异。而汉字字数繁多,常用字就有五六千个,总量更是数万之巨;在印刷时,汉字又有宋体、黑体、仿宋、楷体等10余种字体,每种字体还有约20种大小不同的字号。为了达到印刷质量要求,五号字大小的正文小字需要由100×100以上的点组成,排标题用的大号字则需要1000×1000以上的点阵。因此,如果将所有字体、字号全部用点阵存储进计算机,那么信息量会高达几百亿字节。

以当时的计算机性能,这是一个无法完成的任务。当时中国国产的DJS 130计算机,使用磁芯存储器作为内存,最大容量只有64KB;这种计算机也没有今天我们熟悉的硬盘结构,只有一个容量512KB的磁鼓和一条磁带,显然不可能储存下如此庞大的汉字信息。

王选在研究字典的时候找到了解决问题的灵感:汉字所有的笔画,可以划分为规则笔画和不规则笔画两类。对于撇、捺、点、勾等不规则笔画,可以在轮廓上选取合适的关键点,将这些点用直线相连成折线,从而确定这些笔画的形状,这是基本的轮廓描述法。横、竖、折等规则笔画,则可以用笔画的长度、宽度等参数表示,这是参数描述法。从这个灵感出发,王选与陈堃銶反复讨论,最终设计出了一套全新的汉字字形信息储存方法。在不失真的同时,它需要的储存空间只是储存点阵所需的五百分之一,甚至千分之一!而且只要存进一套字号,就可以变出大小不同的字号。解决了汉字字模存入计算机的难题,这项“轮廓加参数”的汉字信息压缩技术比西方早了大约十年。

由于王选身体虚弱,陈堃銶向北京大学汇报了这个研究新思路。学校对此十分重视,从各系抽调人员,于1976年3月成立了汉字精密照排研究的“会战组”,由王选负责总体设计和硬件设计,陈堃銶负责软件设计。为了争取立项,北京大学先后向四机部及新华社等单位介绍方案。王选的身体不好,这些接待与方案介绍大都由陈堃銶承担。

当时担任“748工程”办公室主任的四机部三局(即后来的计算机局)副局长郭平欣,希望到北京大学进行实地考察。他在1976年5月4日指定了 11个不同结构的字,要王选和陈堃銶等人,在北京大学研制的6912计算机上,做从压缩信息还原成点阵的模拟试验,并且约定一个半月后来看演示。王选负责做压缩信息,陈堃銶则带领同事与学生立即投入紧张地编制模拟程序的工作中。由于时间紧迫,6912计算机白天有教学任务,陈堃銶常常将上机时间安排在深夜或清晨四五点钟。过度劳累使陈堃銶的血压一度降到55/70,并且伴有浮肿。经过紧张和辛苦的工作,终于使模拟试验在6月11日提前获得成功,“748 工程”的研制任务终于在当年9月8日正式下达给了北京大学。

不畏艰难打磨软件

在设计与试验压缩信息的同时,陈堃銶还负责设计整个软件系统。为了学习排版知识,陈堃銶仔细阅读有关排版的技术书籍,查阅了能找到的各类书籍的版面格式,并向印刷厂师傅虚心请教。

她也研究了国外排版软件的现状,了解到当时美国和日本的排版软件,大都只能输出一篇篇文章,俗称“毛条”(Proofreading),再用毛条加上书眉、页码等拼成书页,或拼成报纸版面;但与此同时,也出现了少数能整页输出、自动成页的先进的排版软件。陈堃銶决定向国际先进技术看齐,跳过输出“毛条”、人工剪贴成页的阶段,直接研制整页组版和整页输出的排版软件。

1977年,限于当时计算机的条件,陈堃銶设计的软件只能以批处理方式实现,所以她设计了能排普通书籍和八开小报的CL排版语言及其编译程序结构。除了让软件有整页输出功能外,她还在核心部分提出了创新的字符处理类型驱动法,以及其他技术诀窍。另一方面,当时多数排版软件的结果直接适应输出设备的要求,而她为了提高软件正确性,将排版与适应输出设备分解为两个阶段,用不同程序来实现。为此,她设计了排版结果信息数据结构,而这就是在前几代激光照排系统中使用的页面描述语言BDPDL 的前身,后来,这一描述语言用于报纸版面远传,告别了报纸传真机。

2015年,陈堃銶教授荣获台湾“财团法人印刷传播兴才文教基金会”颁发的“印刷传播杰出成就奖”。

在当时,中国最重要的新闻通讯社新华社,是汉字激光照排系统的第一用户。考虑到它的使用要求,以及当时中国使用的主机DJS 130计算机的状况,陈堃銶在1977年至1978年,设计了可同时运行4道程序、具有实时功能的分时操作系统。她还将除了排版外的其他功能分拆为多个命令,设计了命令系统中每个命令的程序结构。这样的设计,使系统每一部分的功能都清晰明了,而且不至于让某一部分的缺陷影响到其他部分的功能,如果发生故障也容易排查。

由于国产计算机硬件条件的简陋,使得软件调试工作变得困难重重。DJS 130计算机的性能很不稳定,而且只能用汇编语言书写程序,并且用古老的穿孔纸带输入。要上机调试程序,必须先调对纸带,而纸带输入机又不稳定。如果上机时纸带输不进去,就浪费了排班得到的机时。

排版之后想要看到结果也颇为不易,因为照排机同样不稳定,很难正常照出底片。如果等到底片显影定影之后才发现有错误,那么人力、物力、时间都赔不起。因此,陈堃銶和同事们决定使用宽行打印机输出排版结果信息,也就是将汉字的编码以及它的X、Y 坐标等结果数据打出来,并画在坐标纸上,来判断排版结果是否正确。宽行打印机的字轮很不齐,一个数字常常打成上下两个数,正确与否只能依靠经验来推测。

幸运的是,整个激光照排软件的设计是正确的。在克服了设备性能带来的局限之后,1980年9月15日,中国第一本用国产激光照排系统照排印刷的汉字图书《伍豪之剑》试排版成功。这本书全文大约15000字,讲述中华人民共和国成立前周恩来在情报战线上惩处叛徒的经历,以示对他开启了“748 工程”的纪念。为了充分考验排版程序,1981年6月6日,陈堃銶和同事们又照排出一本有数学公式、化学反应式、表格等复杂版面的样书。1981年7月,原理性样机通过部级鉴定。它搭载的排版软件,除了具有行末、行首自动禁排等一般功能外,还能自动成页、自动形成书眉、页码等。以后,又设计成自动生成目录以及大表格自动拆页等复杂功能。

2016年陈堃銶教授获CCF中国计算机事业60年杰出贡献特别奖 ,李国杰院士(左)为其颁奖,优博代表李泽超(右)向其献花

塑造中国出版事业

从1981年起,各个用户单位的计算机系统开始升级换代,软件必须与之适应。陈堃銶不顾自己长期便血,坚持完成了原理性样机鉴定会和升级所需的编程工作,方才前往医院检查,不幸被确诊为直肠癌。在癌症手术恢复后,她又返回了工作岗位,负责升级之后新系统的联调与测试。经过一年的测试之后,1985年5月,新的华光Ⅱ型照排系统顺利通过国家级鉴定,并通过了新华社用户验收。中国第一个自行设计的实用电子排版系统,开始用于每日生产。

此后,为了缓解中国科技书籍出版难的问题,陈堃銶又主持了华光Ⅲ型系统软件的研制工作。科技书籍常常涉及形形色色复杂的数理化公式和符号,要铸造专用铅字字模耗时又费力,因此出版流程时常延误。到20世纪80年代中期,这个问题积累到了令人难以忍受的程度,1984年就应该出版,但到1986年还没能出版的科技图书,竟然多达3826种。有鉴于此,陈堃銶对排版软件进行了针对性的改进,使它能够用于科技公式的排版。1986年,华光Ⅲ型系统与服务科技文献排版的科技版软件通过了部级鉴定;铁道出版社也在同一年引入这套系统,一举解决了积压已久的书籍出版问题。

华光Ⅲ型系统的另一个广为人知的技术分支,用来排版报纸的交互式大报版排版软件,也离不开陈堃銶的指导。1987年5月22日,《经济日报》在中国首家采用激光照排,出版了世界上第一张用计算机屏幕组版、用激光照排系统整版输出的中文报纸。到1988年,经济日报社引入了更为进步的华光Ⅳ型激光照排系统,并且扔掉了沉甸甸的铅字,成为中国第一家“告别铅与火、迈入光与电”的报社。这一时刻,足以载入中国印刷史册。

1992年之后,陈堃銶退出了编程第一线。此后,她致力于搜集国外的技术情报,以及培养计算机领域的新人。作为北京大学计算机研究所的教授、博士生导师,她对学生要求十分严格,尽力培养他们的独立工作能力,因此绝大部分学生在毕业后,成为软件技术领域的优秀人才。

2008年,陈堃銶教授(右五)被中国版权协会授予“中国版权产业风云人物”。

尽管王选一直认为,如果没有陈堃銶,便没有汉字激光照排;但在系统研制成功并且广泛应用之后,向来淡泊名利的陈堃銶选择了退居幕后。她不愿接受采访,也多次拒绝报评院士和奖项;即使她是贡献了某个创新成果的主力,也不愿意署名在前,甚至拒绝署名。对于这些选择,她多次表示,自己的才能并不出众,是这些研发项目给了她锻炼能力与创造的机会。并表示,自己从被逐出到能够进行科研与创新,并取得一些成绩,已经非常满足,别无他求了。

本文内容经中国科协常委会女科技工作者专门委员会和中国女科技工作者协会授权,转载自《大美·中国女科学家》(全2册)(科学普及出版社2019年3月出版)

CLOSE

上一篇 下一篇