在我国历史长河中留存下来的古籍星汉灿烂,但无论是竹简帛书还是纸质古籍在时间的浸润下都会造成不同程度的损毁,抢救、保护、修复… …如何让古籍“活”起来、“动”起来、传承下来,是一个亟待解决的课题。
你支持用数字技术可以让古籍“活过来”?
听听开发者宋杰讲述自己利用 Serverless 技术实现古籍活化的历程 >> 进入视频
通过阿里云 Serverless 产品, 帮助复旦大学进行数字图书馆的搭建,从传统的浅层次图片,逐步建立了可打标、可互动图像修复的标准方案,让更多用户可以查阅到复旦图书馆特藏中心的古籍图片等大量珍贵的历史资料。
本期话题:
1、你觉得数字技术能让古籍活过来吗?
2、你觉得利用现代技术修复古籍可能遇到的难点是什么?
3、如果有古籍活化的公益体验活动,你愿意参与吗?
福利:领取函数计算免费试用资源,感受音视频/图片转码等体验场景。
免费资源领取:https://free.aliyun.com/?product=9555928
本期奖励:
截止2023年8月31日24时,参与本期话题讨论,将会选取5名优质回答用户送出罗马仕充电宝。(体现个人观点与思考获奖几率更大哦)
注:话题讨论要求原创,如有参考,一律注明出处,否则视为抄袭不予发奖。获奖名单将于3个工作日内公布,礼品将于7个工作日内发放,节假日顺延。
引言
开发者宋杰利用 Serverless 技术实现古籍活化的历程所引起的思考
自己观看了开发者宋杰讲述自己利用 Serverless 技术实现古籍活化的历程的视频,深受启发。同时,自己作为一名开发者,宋杰的故事让我深刻地感受到了 Serverless 技术在古籍保存和传承方面的重要性。
在视频中,宋杰介绍了自己如何利用 阿里云Serverless 产品实现了对古籍的数字化修复和展示。他首先提到了古籍修复的困难和复杂性,包括古籍的材料、结构、历史背景等方面的问题,以及数字化修复的技术难点和保护原貌的原则。然而通过 Serverless 技术的支持,宋杰成功地实现了对古籍的数字化修复和展示,他利用 Serverless 技术实现了古籍的数字化拍摄、修复和展示,使得更多的人可以了解古籍的文化内涵和艺术价值。
我深深地感受到了 Serverless 技术在古籍保存和传承方面的重要性和应用价值。阿里云Serverless 产品可以帮助开发者解决传统的服务器管理和维护的问题,让开发者更加专注于应用的开发和创新。在古籍保存和传承方面,Serverless 技术可以帮助开发者实现对古籍的数字化修复和展示,提高古籍的保存和传承效率和质量。
另外,宋杰的故事也让我深刻地认识到了数字化修复和展示对古籍保存和传承的重要性。通过数字化修复和展示,古籍可以更好地保存和传承,让更多的人了解和欣赏古籍的内涵和价值。数字化修复和展示还可以让古籍从传统的静态形式转化为动态和互动的形式,增强了古籍的吸引力和影响力。
数字化技术的发展
首先来聊一下数字化技术的发展情况。随着数字技术的快速发展,可以让越来越多的文化古籍被数字化保存和传播,原因在于数字技术包括数字扫描、数字存储、数字还原和数字展示等方面的技术,可以将文化古籍转化为数字形式,从而实现其永久保存和广泛传播。
数字化技术的发展,使得人们可以更加轻松地浏览、搜索和学习文化古籍,从而更好地理解和欣赏人类文明的历史和文化。
数字技术能让古籍“活过来”
个人觉得通过数字技术能够让古籍“活过来”,那是因为可以通过数字技术的手段,让古籍的内容更加生动、形象、易于理解,使人们能够更好地了解和欣赏古籍的内涵和价值。数字技术的应用可以让古籍从传统的静态形式转化为动态和互动的形式,比如通过数字化技术对古籍进行三维还原、虚拟展示、数字化翻译等操作,使人们能够更加深入地了解古籍的历史、文化和艺术价值。
利用现代技术修复古籍可能遇到的难点
随着现代技术的不断发展进步,利用现代技术修复古籍是数字技术在古籍保存和传承方面的重要应用之一。通过数字技术对古籍进行数字化修复可以更好地保护古籍,使其能够更好地保存和传承。但是,在利用现代技术修复古籍的过程中,可能会遇到一些难点。
比如技术难点,数字化修复古籍需要掌握专业的技术和知识,需要对古籍的材料、结构、历史背景等方面有深入的了解。又如古籍材料的特殊性,古籍作为一种文化遗产,具有很高的历史、文化和艺术价值,其材料和特殊性质需要特别关注,例如纸张的酸碱度、墨迹的稳定性等问题。再如保护原貌的原则,在数字化修复古籍的过程中,需要尽可能保护古籍的原貌,尊重古籍的历史和文化价值,避免对古籍造成二次损害。
数字技术对文化古籍的保护和保存的影响
个人觉得数字技术非常强大,而且数字技术对文化古籍的保护和保存起到了重要的作用。
数字技术对文化古籍的保护。通过数字化技术,文化古籍可以被转化为数字形式存储在云端,以防止自然灾害、战争和盗窃等意外事件的发生。数字技术还可以对文化古籍进行数字还原和修复,比如通过数字化技术去除文化古籍上的污渍和污点,还原其原始形态;数字化技术还可以对文化古籍进行数字化防伪,以防止盗版和伪造。
数字技术对文化古籍的传播和利用。此外,数字技术对文化古籍的传播和利用也起到了重要的作用。通过数字化技术,文化古籍可以被广泛传播和分享,使更多人能够接触和学习。数字技术还可以对文化古籍进行数字化处理和数字化展示,使其更加生动、形象和易于理解。数字技术还可以对文化古籍进行数字化翻译,使其能够更容易地被理解和应用。
数字技术的局限性。尽管数字技术为文化古籍的保护、保存和传播提供了很多新的方法和工具,但数字技术仍然存在着一些局限性。例如,数字化技术无法完全还原文化古籍的原始形态,因为它无法保留原始文化古籍的物理特征和感觉。此外,数字化技术也无法保证文化古籍的长期保存和传承,因为数字技术本身也存在着技术更新和数字化崩溃等问题。
通过上面几点可以看到,现代数字技术确实为文化古籍的保护、保存和传播提供了很多新的方法和工具,使得文化古籍可以“活过来”。数字化技术可以对文化古籍进行数字化处理、数字化防伪、数字化翻译等操作,从而更好地保护和传承人类文化遗产。然而数字技术仍然存在着一些局限性,它无法完全还原文化古籍的原始形态,也无法保证文化古籍的长期保存和传承。因此,我们需要继续探索更加完善的数字化技术,以实现对文化古籍的更好保护和传承。
此外,数字技术也需要与传统的文化古籍保存和传承方式相结合,例如通过博物馆展览、文化活动等形式,使人们能够更加深入地了解和欣赏文化古籍。在数字技术和传统文化古籍保存和传承方式的相互补充下,我们可以更好地保护和传承人类的文化遗产。
从更广泛的角度来看,数字技术的发展也提醒我们要更加关注数字技术的伦理和社会问题。数字技术的使用需要遵循道德和法律规范,以保证对文化古籍的保护和传承不会对人类社会造成负面影响。我们需要保持警觉,以确保数字技术的使用符合人类文明的价值观和利益。
个人必定参加的古籍活化公益体验活动
个人觉得,参加古籍活化公益体验活动,从名字来看就是一件非常有意义的事情,参与其中就是最大的受益者。古籍活化的公益体验活动可以让更多的人了解古籍的文化价值,增强公众对古籍的保护意识和文化认同感,通过参与古籍活化的公益体验活动,大家可以亲身感受数字技术对古籍的修复和展示,了解古籍的历史和文化背景,感受古籍的魅力和价值。
参与古籍活化的公益体验活动,可以让大家更好地了解古籍的文化内涵和艺术价值,增强公众对古籍保护的意识和责任感。同时,通过公益体验活动的参与,大家可以更深入地了解数字技术在古籍修复和展示方面的应用,了解数字技术的发展和应用对文化遗产保护的作用。在参与古籍活化的公益体验活动中,大家还可以与其他爱好者交流和分享自己的体验和感受,从而增加社交和交流的机会,促进社会和文化的交流和融合。
最后
通过上文的分享介绍,现代数字技术的发展确实为文化古籍的保护、保存和传播带来了巨大的机遇和挑战,以及Serverless 技术在古籍保存和传承方面的重要性和应用价值,以及数字化修复和展示对古籍保存和传承的重要性。此外,在数字技术的支持下,古籍活化的公益体验活动也开始逐渐兴起,为更多的人提供了接触古籍、了解古籍的机会。与此同时,需要不断探索更加完善的数字化技术,同时也需要注意数字技术的局限性和伦理问题,以实现对文化古籍的更好保护和传承,只有这样我们才能更好地理解和欣赏人类的历史和文化,推进人类文明的发展。
我们应该不断探索和完善数字技术在古籍保存和传承方面的应用,让古籍的文化价值得到更好地传承和发扬。我相信,在不断的探索和创新中,我们可以更好地利用数字技术,实现对古籍的保存和传承,让古籍的文化价值得到更好地传承和发扬。
现代数字技术可以在很大程度上帮助文化古籍”活过来”,为其保护、传承和访问提供了许多新的机会和方法。以下是一些数字技术对于文化古籍的积极影响:
数字化保存:数字技术可以用于对文化古籍进行数字化扫描和存储,将其转化为电子格式。这样可以防止原始古籍遭到破坏或丢失,并使其在数字形式下永久保存。
全球共享和访问:通过数字化,文化古籍可以在线共享和访问,不再受限于地理位置。人们可以从世界各地使用互联网浏览和学习这些珍贵的文化资产。
文本标记和注释:数字技术允许对文化古籍进行文本标记和注释,增加了对原始文本的理解和交流。这样可以为学者、研究人员和读者提供更多的信息和参考。
虚拟重建和体验:通过虚拟现实和增强现实等技术,人们可以体验文化古籍中的内容和环境,尽可能还原历史的场景和背景,使其更加生动和有趣。
数据分析和挖掘:数字技术可以帮助对文化古籍进行大规模的数据分析和挖掘,揭示隐藏在文本中的模式、关联和知识。这有助于研究人员进行更深入的文化和历史研究。
尽管数字技术可以为文化古籍提供许多机会,但也面临一些挑战,如版权问题、数据安全性和可持续保存等。因此,在推进数字化和利用数字技术的过程中,需综合考虑与保护、隐私和可持续发展相关的问题,并制定相应的政策和措施。
随着人工智能数字技术的不断推进,我觉得数字技术能让古籍活过来,只是时间问题,但会有很多困难需要一一解决。
2019年,阿里巴巴和四川大学提出“数字化回归”设想。达摩院技术团队与四川大学专家联手,利用机器学习方法,构造了一套边识别古籍、边训练模型的系统,以97.5%的准确率完成对20万页古籍的整体识别。
2021年5月18日,“汉典重光”海外古籍数字化回归发布会在中国科技馆举行。
一批珍藏于加州大学伯克利分校的中文古籍善本,以数字化方式回归故土,落地汉典重光古籍平台。借助阿里达摩院的技术,首批20万页古籍已完成数字化,并沉淀为覆盖3万多字的古籍字典,公众可通过汉典重光平台翻阅、检索古籍。
古籍数字化尝试由来已久,但难度大、成本高。古籍文字字类多、字体多样,外加流传过程中出现的各类损坏,使得识别难度极高。由于缺乏充足的训练数据,常规OCR识别方法高度依赖人工,几乎需要专业人员逐字标注,导致古籍数字化无法形成规模效应,总体进程缓慢。
常规的古籍数字化完整流程分为几大环节:采集侧(纸质书变为电子扫描版)-数字化生产侧(电子扫描版变为文字版)-应用侧(文字版变为古籍研学系统,涵盖检索、字典、知识图谱等功能)。
达摩院的工作主要集中于数字化生产侧、应用侧两个环节。在数字化生产侧,达摩院自研了一套全新的AI古籍识别系统,可以规模化、系统化对电子扫描版古籍进行识别。
达摩院沉淀了完整的OCR技术能力,主要用于解决现代场景中的文字识别需求,比如文档、卡证、表单等识别。而古籍识别与现代场景的文字识别存在巨大差异,在现代场景下识别准确率超过99%的算法,应用到古籍识别上识别率不足40%。
基于上述原因,达摩院技术团队与四川大学专家联手研发了一套全新的古籍识别系统。利用单字检测、无监督单字聚类、小样本学习、主动学习等机器学习方法,构造了一套边识别古籍、边训练模型的系统,在首批数字化的20万页古籍上,达到了97.5%的识别准确率,AI现已能够识别3万类古籍文字。
通过视觉手段,让机器学习到单字,字和字之间的差异。通过这种技术手段,解决了字的聚合问题,他们构建了一套先基础感知模块去进行单字表征,单字表征以后做单字聚合,做完单字聚合以后,再由我们古籍专家跟我们系统发生交互,来告诉我们什么做对了,什么做错了。这个反馈的信息会到我们后台,再进一步的去更新我们的表征模型,我们再会产生相应的单字聚合结果,再回馈给我们的古籍专家,形成这样一个闭环的工作模式。
目前,在该系统基础上,达摩院研发搭建了集古籍数字化交互式训练、古籍全文内容检索、古籍汉字字典三大功能于一体的汉典重光古籍数字化平台。随着今后数字化规模的扩增,系统的识别准确率和识别效率还将不断提升。
未来,该平台将尝试拓展数据数量、进行更加详细的数据挖掘、分析,提高识别准确率。达摩院希望能够实现古籍全文检索的能力:只要在平台输入命名实体,比如一个人名、地名,就可以知道这个人名曾经出现过哪些典籍里面。
如果有古籍活化的公益体验活动,我愿意参与,也为中文古籍善本逐步数字化贡献自己的一份力量。