点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:彩云网论坛-彩云网交流群
首页>文化频道>要闻>正文

彩云网论坛-彩云网交流群

来源:彩云网娱乐2024-01-07 17:48

  

彩云网论坛

古籍如何兼顾“藏”与“用”******

古籍如何兼顾“藏”与“用”

——来自古籍数字资源联合发布会的专家观点

光明日报记者 陈雪

  “古籍具有特殊性,作为文物必须保护,作为文献必须为读者所用,二者存在矛盾。”——解决“藏”与“用”之间的矛盾一直是古籍工作的重点,山东大学文学院院长、教授杜泽逊说:“数字化是目前最好的办法”。

  1月4日,国家图书馆(国家古籍保护中心)、天津图书馆、南京图书馆、云南省图书馆、苏州图书馆、中山大学图书馆等6家单位,在线召开了古籍数字资源联合发布会,发布了6786部(件)古籍资源,可在线免费阅览全文影像。会上,多位古籍专家学者围绕古籍数字资源建设进行了深入讨论。

  古籍数字化有何迫切性?未来趋势是什么?专家学者展开了深入探讨。

  数字化平衡“文物性”与“文献性”

  20世纪90年代初,上海图书馆把内部使用的古籍目录卡片摆在图书馆的走廊里,为了完成“四库全书存目丛书”的版本调查,杜泽逊跑到上图,查阅了十几天卡片。夏天高温,他就到馆外买一根绿豆冰糕含在嘴里,再回到馆内查卡片——为查阅古籍文献,要出差到各地,克服各种困难,这是一代古籍研究者的集体记忆。

  “从内部使用到目录卡片放在走廊,再到数字资源挂在网上,这个进步是非常快的。”杜泽逊说,国家图书馆为首的几十家图书馆把古籍数字资源放在网上,读者不必直接使用古籍原件,这是很重要的一条保护措施。此外,在线阅览不知道节省了多少人的时间、体力、财力,对推进新时代古籍工作有重大贡献。

  兼顾“藏”与“用”,古籍数字化刻不容缓。“国家图书馆从2000年起开始有计划地将古籍进行数字化,并陆续建成数字方志、碑帖精华等专题库,面向社会公众发布。”国家古籍保护中心办公室负责人王红蕾介绍了古籍数字资源发布的整体情况。2016年,国家图书馆搭建“中华古籍资源库”平台,发布了国图馆藏善本和普通古籍、甲骨、敦煌文献、碑帖拓片、家谱、老照片等数字资源,以及天津图书馆、哈佛燕京图书馆等许多馆外古籍和海外征集古籍资源。2021年疫情期间,读者远程访问需求增长,为回应读者的“急难愁盼”,“中华古籍资源库”实现了免登录阅览。资源库上线、免登录阅览被学者称为惠及学林的两个重要节点。

  2007年以来,随着“中华古籍保护计划”的深入开展,各地图书馆陆续投入人力物力,大力推进古籍数字化。苏州图书馆党委书记、馆长接晔介绍,截至目前,苏州图书馆已完成数字化古籍1496部,容量达16.12TB。

  据了解,国家图书馆(国家古籍保护中心)先后联合39家单位发布古籍资源2.8万部(件),此次是第七次联合发布,6家收藏单位新增发布古籍资源6786部(件),不仅有明清版刻、稿抄本古籍,还有碑帖拓本等特色资源:新增国家图书馆藏古籍数字资源1075部19.2万叶,主要为年谱类、目录类古籍;天津图书馆发布馆藏稿抄本文献165种655册;南京图书馆发布了“清人文集数据库”,共收录清人文集399种,以全本彩色扫描的方式制作成数字影像;云南省图书馆发布馆藏善本63部381册,图像50604拍;苏州图书馆发布馆藏古籍数字资源888部;中山大学图书馆发布了一批颇具该馆特色的碑帖文献数字资源。

  本次资源发布后,全国累计发布古籍及特藏文献影像资源达到13万部(件),其中,国图建设的“中华古籍资源库”发布超过10.2万部(件)。王红蕾说,“中华古籍资源库”已成为全国古籍资源类型和品种最多、体量最大的综合性资源共享发布平台。

  北京大学中文系古典文献学教研室主任、教授杨海峥感叹,从2016年到现在,陆续推出了13万部(件)古籍数字资源,对于学者来说是非常重要的一件事情。在线查阅免去了往返奔波各家图书馆的时间,缓解了古籍“藏”和“用”之间的矛盾,平衡了古籍的文物性与文献性。

  古籍资源既要“用得上”,还要“用得好”

  2022年10月,全国古籍整理出版规划领导小组印发实施《2021—2035年国家古籍工作规划》,“国家古籍数字化工程”正是四项重点实施工程之一。近年来,全国古籍登记工作让3000万册件古籍有了“身份证”,未来,让更多古籍“上线”与读者见面,将是我国古籍工作的一大重点。

  “古籍数字化资源的制作与发布,其实是回归到古籍作为书籍文献本来的性质。”清华大学科学技术史暨古文献研究所研究员刘蔷说,以往,人们说学术的繁荣与学术资料的新发现有关,这种说法是忽视了存世的大量古籍,存世古籍是一个巨大的资源库。可以预见,连续的古籍资源发布,将带来宏阔的学术气象。

  古籍数字化平衡了“藏”与“用”的矛盾,让古籍资源“用得上”,未来,更要“用得好”。学者们对古籍数字资源的深度利用提出了许多有益建议。

  浙江大学图书馆研究馆员黄晨认为,古籍数字资源联合发布可以更好地呈现资源的利用价值,接下来,可以进一步就已发布的资源进行深度揭示,进一步打通资源和发布平台,提供一站式检索,将资源聚合起来,这样的利用效果会更好。刘蔷也表示,期待能有一个与古籍数字化资源相匹配的古籍数字目录,以便实现一站式检索。

  杨海峥认为,目前古籍数字化发展迅速,百花齐放,各类数据库和古籍数字化平台纷纷涌现,多样化的发展一方面带来了很大便利,另一方面也应进行协调统一,建立更加规范的数据规范标准,使得古籍数字化的资源有保证,达到方便使用的学术水准。杨海峥说,2022年中办、国办印发的《关于推进新时代古籍工作的意见》,专门强调要“加强古籍数据流通和协同管理,实现古籍数字化资源汇聚共享”,国图联合全国古籍存藏单位把古籍数字资源进行统一与整合,形成公益性平台,奠定了非常好的基础,是未来古籍数字化的发展趋势。

  汇聚、开放、共享,古籍数字化的步伐不断加快。杜泽逊说,“期待发布更多的数字资源,最终达到除少数特殊情况外,全部数字化。”

  《光明日报》( 2023年01月06日 09版)

你的隐私,大数据怎知道******

  作者:杨义先、钮心忻(均为北京邮电大学教授)

  在网络上,每个人都会或多或少,或主动或被动地泄露某些碎片信息。这些信息被大数据挖掘,就存在隐私泄露的风险,引发信息安全问题。面对汹涌而来的5G时代,大众对自己的隐私保护感到越来越迷茫,甚至有点不知所措。那么,你的隐私,大数据是怎么知道的呢?大家又该如何自我保护呢?

  1.“已知、未知”大数据都知道

  大数据时代,每个人都有可能成为安徒生童话中那个“穿新衣”的皇帝。在大数据面前,你说过什么话,它知道;你做过什么事,它知道;你有什么爱好,它知道;你生过什么病,它知道;你家住哪里,它知道;你的亲朋好友都有谁,它也知道……总之,你自己知道的,它几乎都知道,或者说它都能够知道,至少可以说,它迟早会知道!

  甚至,连你自己都不知道的事情,大数据也可能知道。例如,它能够发现你的许多潜意识习惯:集体照相时你喜欢站哪里呀,跨门槛时喜欢先迈左脚还是右脚呀,你喜欢与什么样的人打交道呀,你的性格特点都有什么呀,哪位朋友与你的观点不相同呀……

  再进一步说,今后将要发生的事情,大数据还是有可能知道。例如,根据你“饮食多、运动少”等信息,它就能够推测出,你可能会“三高”。当你与许多人都在独立地购买感冒药时,大数据就知道:流感即将暴发了!其实,大数据已经成功地预测了包括世界杯比赛结果、股票的波动、物价趋势、用户行为、交通情况等。

  当然,这里的“你”并非仅仅指“你个人”,包括但不限于,你的家庭,你的单位,你的民族,甚至你的国家等。至于这些你知道的、不知道的或今后才知道的隐私信息,将会把你塑造成什么,是英雄还是狗熊?这却难以预知。

  2.数据挖掘就像“垃圾处理”

  什么是大数据?形象地说,所谓大数据,就是由许多千奇百怪的数据,杂乱无章地堆积在一起。例如,你在网上说的话、发的微信、收发的电子邮件等,都是大数据的组成部分。在不知道的情况下被采集的众多信息,例如被马路摄像头获取的视频、手机定位系统留下的路线图、驾车的导航信号等被动信息,也都是大数据的组成部分。还有,各种传感器设备自动采集的有关温度、湿度、速度等万物信息,仍然是大数据的组成部分。总之,每个人、每种通信和控制类设备,无论它是软件还是硬件,其实都是大数据之源。

  大数据利用了一种名叫“大数据挖掘”的技术,采用诸如神经网络、遗传算法、决策树、粗糙集、覆盖正例排斥反例、统计分析、模糊集等方法挖掘信息。大数据挖掘的过程,可以分为数据收集、数据集成、数据规约、数据清理、数据变换、挖掘分析、模式评估、知识表示等八大步骤。

  不过,这些听起来高大上的大数据产业,几乎等同于垃圾处理和废品回收。

  这并不是在开玩笑。废品收购和垃圾收集,可算作“数据收集”;将废品和垃圾送往集中处理场所,可算作“数据集成”;将废品和垃圾初步分类,可算作“数据规约”;将废品和垃圾适当清洁和整理,可算作“数据清理”;将破沙发拆成木、铁、布等原料,可算作“数据变换”;认真分析如何将这些原料卖个好价钱,可算作“数据分析”;不断总结经验,选择并固定上下游卖家和买家,可算作“模式评估”;最后,把这些技巧整理成口诀,可算作“知识表示”。

  再看原料结构。大数据具有异构特性,就像垃圾一样千奇百怪。如果非要在垃圾和大数据之间找出本质差别的话,那就在于垃圾是有实体的,再利用的次数有限;而大数据是虚拟的,可以反复处理,反复利用。例如,大数据专家能将数据(废品)中挖掘出的旅客出行规律交给航空公司,将某群体的消费习惯卖给百货商店等。总之,大数据专家完全可以“一菜多吃”,反复利用,而且时间越久,价值越大。换句话说,大数据是很值钱的“垃圾”。

  3.大数据挖掘永远没有尽头

  大数据挖掘,虽然能从正面创造价值,但是也有其负面影响,即存在泄露隐私的风险。隐私是如何被泄露的呢?这其实很简单,我们先来分解一下“人肉搜索”是如何侵犯隐私的吧!

  一大群网友,出于某种目的,利用自己的一切资源渠道,尽可能多地收集当事人或物的所有信息;然后,将这些信息按照自己的目的提炼成新信息,反馈到网上与别人分享。这就完成了第一次“人肉迭代”。

  接着,大家又在第一次人肉迭代的基础上,互相取经,再接再厉,交叉重复进行信息的收集、加工、整理等工作,于是,便诞生了第二次“人肉迭代”。如此循环往复,经过多次不懈迭代后,当事人或物的画像就跃然纸上了。如果构成“满意画像”的素材确实已经证实,至少主体是事实,“人肉搜索”就成功了。

  几乎可以断定,只要参与“人肉搜索”的网友足够多,时间足够长,大家的毅力足够强,那么任何人都可能无处遁形。

  其实,所谓的大数据挖掘,在某种意义上说,就是由机器自动完成的特殊“人肉搜索”而已。只不过,这种搜索的目的,不再限于抹黑或颂扬某人,而是有更加广泛的目的,例如,为商品销售者寻找最佳买家、为某类数据寻找规律、为某些事物之间寻找关联等。总之,只要目的明确,那么,大数据挖掘就会有用武之地。

  如果将“人肉搜索”与大数据挖掘相比,网友被电脑所替代;网友们收集的信息,被数据库中的海量异构数据所替代;网友寻找各种人物关联的技巧,被相应的智能算法替代;网友们相互借鉴、彼此启发的做法,被各种同步运算所替代。

  各次迭代过程仍然照例进行,只不过机器的迭代次数更多,速度更快,每次迭代其实就是机器的一次“学习”过程。网友们的最终“满意画像”,被暂时的挖掘结果所替代。之所以说是暂时,那是因为对大数据挖掘来说,永远没有尽头,结果会越来越精准,智慧程度会越来越高,用户只需根据自己的标准,随时选择满意的结果就行了。

  当然,除了相似性外,“人肉搜索”与“大数据挖掘”肯定也有许多重大的区别。例如,机器不会累,它们收集的数据会更多、更快,数据的渠道来源会更广泛。总之,网友的“人肉搜索”,最终将输给机器的“大数据挖掘”。

  4.隐私保护与数据挖掘“危”“机”并存

  必须承认,就当前的现实情况来说,大数据隐私挖掘的“杀伤力”,已经远远超过了大数据隐私保护的能力;换句话说,在大数据挖掘面前,当前人类有点不知所措。这确实是一种意外。自互联网诞生以后,在过去几十年,人们都不遗余力地将碎片信息永远留在网上。其中的每个碎片虽然都完全无害,可谁也不曾意识到,至少没有刻意去关注,当众多无害碎片融合起来,竟然后患无穷!

  不过,大家也没必要过于担心。在人类历史上,类似的被动局面已经出现过不止一次了。从以往的经验来看,隐私保护与数据挖掘之间总是像“走马灯”一样轮换的——人类通过对隐私的“挖掘”,获得空前好处,产生了更多需要保护的“隐私”,于是,不得不再回过头来,认真研究如何保护这些隐私。当隐私积累得越来越多时,“挖掘”它们就会变得越来越有利可图,于是,新一轮的“挖掘”又开始了。历史地来看,人类在自身隐私保护方面,整体处于优势地位,在网络大数据挖掘之前,“隐私泄露”并不是一个突出的问题。

  但是,现在人类需要面对一个棘手的问题——对过去遗留在网上的海量碎片信息,如何进行隐私保护呢?单靠技术,显然不行,甚至还会越“保护”,就越“泄露隐私”。

  因此,必须多管齐下。例如从法律上,禁止以“人肉搜索”为目的的大数据挖掘行为;从管理角度,发现恶意的大数据搜索行为,对其进行必要的监督和管控。另外,在必要的时候,还需要重塑“隐私”概念,毕竟“隐私”本身就是一个与时间、地点、民族、文化等有关的约定俗成的概念。

  对于个人的网络行为而言,在大数据时代,应该如何保护隐私呢?或者说,至少不要把过多包含个人隐私的碎片信息遗留在网上呢?答案只有两个字:匿名!只要做好匿名工作,就能在一定程度上,保护好隐私了。也就是说,在大数据技术出现之前,隐私就是把“私”藏起来,个人身份可公开,而大数据时代,隐私保护则是把“私”公开(实际上是没法不公开),而把个人身份隐藏起来,即匿名。

  《光明日报》( 2023年01月12日 16版)

  (文图:赵筱尘 巫邓炎)

[责编:天天中]
阅读剩余全文(

相关阅读

视觉焦点

  • 相爱相杀真的甜,“德哈”吃粮线索全放送

  • VIP8.5阿郎的故事发哥经典催泪情嘉宾:周润发 张艾嘉 黄坤玄

独家策划

推荐阅读
彩云网登录南非洪水过后被垃圾"占领"
2024-04-07
彩云网代理39亿彩票巨奖得主怒告亲儿-图
2024-03-11
彩云网官方一季度亏损1.77亿元 乐视网暂停上市或成定局
2024-09-17
彩云网注册千里共婵娟的苏轼苏辙兄弟
2024-03-03
彩云官网网址一线|北京延庆突现小黄车停车牌 ofo正在测试定点停车
2024-10-09
彩云网攻略阴阳师cosplay摄影周报名开启
2024-08-26
彩云网平台日本将迎来第126代新天皇!动画看天皇家族那些事儿
2024-01-25
彩云网开户 迪士尼如何买断所有人的童年?
2024-09-05
彩云网注册网唐艺昕撇下男友张若昀,与张一山相约深夜档看大片
2024-04-22
彩云网返点刘诗诗新剧真的很赶客
2024-04-06
彩云网网投英超-马塔破旧主 德赫亚送礼 曼联主场平切尔西
2024-06-14
彩云网登录Letme一打二反杀,操作重回MSI巅峰,RNG夏季赛稳了?
2023-12-17
彩云网计划群突发:印尼决定迁都!
2024-08-13
彩云网漏洞 《复联》十年终结!曾经陪伴超级英雄的座驾最全面解读
2024-08-30
彩云官网平台四件大事接连发生!这个春天,对中国来说很不寻常
2024-08-06
彩云网app下载俄军T-72B3坦克越野涉水场面狂野
2024-07-11
彩云网投注MH370最终搜寻报告:花1.6亿美元 仅找到3块残片
2024-07-18
彩云网开奖结果奥迪"异味门"升级!相关部门介入调查
2024-02-26
彩云网APP2019版第五套人民币出炉 来看看长啥样(图)
2024-09-10
彩云网手机版APP货通天下 产地数字化加速进行时
2024-01-18
彩云网软件不是行情结束 而是给大家上车机会
2024-08-03
彩云网走势图量子保密通讯,经典派陷入的N个误区
2024-01-12
彩云网必赚方案 狐狸厨房 | 熬黏粥只知道小火慢炖?科学方法是这5点
2024-02-11
彩云网app三天内二线城市拿地逾780亿 房企拿地热情高涨
2024-02-22
加载更多
彩云网地图