物理、数学和工程论文中的复杂公式对于某些人来说可能是非常难以阅读的内容,但很多人一开始就很难理解它们。美国国家标准与技术研究院(NIST)创建了一种工具,可以让视力障碍人士更轻松地阅读这些论文,并且即将得到广泛采用。
该工具可将一种常用的数学公式显示格式转换为另一种格式,有助于让所有人都能获取最新、最优秀的研究论文。大多数新的研究论文都以PDF文件形式分发,研究界的许多人都难以阅读。
根据世界卫生组织的数据,世界上超过四分之一的人口被诊断患有视力障碍,耶鲁大学阅读障碍和创造力中心报告称,在美国,20%的人患有阅读障碍。在最近对以PDF形式分发的科学论文进行的一项研究中,研究人员发现,他们抽取的文档中只有2.4%满足其可访问性标准。
“如果你不是一个一生都在努力发表数学论文的人,你可能会想知道为什么这是一个问题,”NIST的布鲁斯·米勒(BruceMiller)说,他是一位专门研究数学软件的物理学家。“PDF在打印页面上看起来很棒。但是,如果您希望大声朗读数学公式,或者在平板电脑或手机等不同尺寸的屏幕上清晰易读,那么这种不匹配可能会很痛苦。您无法轻松地重新调整用途其他媒体的PDF。”
PDF通常是如何生成的?创建使用许多公式的纸质手稿的科学家通常会使用LaTeX(发音为“lay-tech”)语言或其近亲之一来呈现公式。LaTeX自20世纪80年代以来一直在使用,并因其创建的高质量排版而受到广泛尊重,但它被设计用于以静态形式生成打印页面。
自20世纪90年代以来,网页创建者开始使用HTML,这使得根据上下文调整显示文本的外观、行为和布局成为可能。如果您曾经将网页拖动到不同的尺寸,并观察其文本平滑地重新定位以适应新矩形的边界,那么您就会看到有视力障碍的读者想要的功能。
现代HTML包含的扩展不仅允许这种“重新流动”类型的能力,而且还允许机器为那些无法自己阅读文本的人朗读数学公式。这些功能使HTML成为创建可访问文本的理想选择,但多年来没有有效的方法将LaTeX转换为HTML。当米勒需要一种方法将NIST的1,000多页令人尊敬的数学函数手册带入数字领域时,这给米勒带来了一个问题。
“当时,一些程序声称可以将LaTeX转换为网页,但效果都不够好,”他说。“我想,让我们尝试自己制作吧。”
由此产生的NIST工具是LaTeXML,它读取LaTeX源文件并构建可以转换为HTML的文档表示形式。LaTeXML是创建在线数学函数数字图书馆的关键,几年后,一个主要在线资源的管理者意识到它也可以为他们提供帮助。
该资源是arXiv(发音为“archive”),它是尚未在科学期刊上发表的学术文章的存储库。arXiv由康奈尔大学维护,目前拥有超过200万篇文章,可以免费查看和下载PDF格式的文章。该服务器已成为一个重要的中转站,作者可以在其中发布研究结果并在正式宣布之前与同行进行讨论。
“根据arXiv在2022年进行的一项调查,只有30%依赖辅助技术的用户可以在没有帮助的情况下访问他们需要的所有研究。同一项调查发现PDF格式是最大的障碍,”首席研究员ShamsiBrinn说道。arXiv的可访问性报告和HTML论文项目的经理。
Brinn说,随着arXiv使用LaTeXML转换器,这种情况将会改变。服务器将生成论文的HTML版本,并在下载PDF的链接旁边包含HTML版本。
arXiv存储库将滚动转换论文,并于2023年12月首次提供。东北ADA中心助理主任JoeZesski表示,此举遵循了需要可访问的网络和电子信息的更广泛趋势。这一变化不仅将帮助科学界遵守白宫关于免费提供联邦资助研究的最新政策,而且还将让使用电子资源长大的年轻科学家能够获取信息。
“教育领域对网络和电子信息的依赖日益增加,同时人们对残疾年轻人平等接受教育的期望也越来越高,”泽斯基说。“采取措施使学生能够访问和使用所需的信息非常重要。”