维基文库

维基文库
Wikisource
The current Wikisource logo
Detail of the Wikisource multilingual portal main page.
维基文库首页
网站类型
数字图书馆
持有者 维基媒体基金会
创始人 使用者建立
网址 wikisource.org 编辑维基数据链结
商业性质
注册 可选
推出时间 2003年11月24日,​18年前[1]
现状 线上
早期的图示。

维基文库(英语:Wikisource)是维基媒体基金会旗下维基百科的姊妹计划,目的是建立一个自由的、基于Wiki的文献仓库,包括每一个语言版本的完整原始文献,并且把这些文献翻译成多种语言。刚开始叫做「Sourceberg」,在2003年12月6日经过投票确定为现在的名称。

现在维基文库上主要存放各种遵循GNU自由文件协定凭证的文件以及相容这个协定的原始文件,还有公有领域、无著作权或者著作权已经过期的原始文献,例如古代的诗歌、文章、法律文字等等。

这个专案在2003年11月4日开始启动。它的图示是一座写实的冰山。但由于图像著作权问题,后又经投票,决定今日的图像,一个更卡通的标志。

由于美国对较短期间规则的不接受性,部分内容无法放入维基文库。

发展历史

早期

维基文库早期历史(2003年-2005年)包括名称和域名的变化,及在2005年不同语言分家到字域名。

专案的早期概念是为重要的历史文献提供储存,这些文献提供原始的证据和文献,扩充维基百科条目,并以其自身的著作权存档。有别于如古腾堡计划等其它类型的数字档案馆,文献的收集最初集中在历史文化的重要材料[1]

该专案在规划阶段曾被命名为「Sourceberg」(取义古腾堡计划)[1]

2001年,维基百科就主要原始材料的加入发生争议,导致编辑战超越材料所提及和删除的内容。在解释该专案时,使用者拖延者表示:「专案有别于古腾堡计划,就像维基百科有别于Nupedia一样」[3],但他很快就作出澄清:「我们并不想重复古腾堡所做的成果,相反我们要完善古腾堡。」Sourceberg就是在提供维基百科对古腾堡计划档案的连结,让上传文件至古腾堡变得快捷[4]。外界对专案的评价最初持怀疑态度。拉里·桑格询问专案的必要性,写道:「难以回答的问题是,古腾堡专案已经存在,何必要重新发明轮子?我们想补充古腾堡,那该怎么做?[5]」吉米·威尔士回答道:「和拉里一样,我对完善古腾堡的工作很感兴趣。但专案似乎不太可能充当编辑时的主要来源——我的意思是,莎士比亚就是莎士比亚,不管我们如何评价他的作品。[6]

专案开始在ps.wikipedia.org上活跃,贡献者将域名中的「PS」理解为「第一手资料」或「Project Sourceberg」。然而这导致专案与维基百科普什图语子域http://ps.wikipedia.com发生冲突(普什图语的ISO编码为PS),改由2003年11月24日正式启动的临时URL:http://sources.wikipedia.org取而代之。原有域名中的文献和讨论页面也被转移到临时位址,网站名称透过2003年12月6日投票决议,改为维基文库。直到2004年7月23日,专案移至永久连结:http://wikisource.org (页面存档备份,存于网际网路档案馆[7]

标识及口号

中文维基文库的图示字型取自《四库全书》原文扫描,具有历史感、著作权自由、象征着网站收录原文的目标,同时字型本身典雅、端庄、大气、易于辨认[8]

维基文库前身「Project Sourceberg」的第一个标识是冰山[1],沿用至2006年,期间进行过两次没有结果的关于修改图示的投票。最后,出于法律和技术上的原因,以原始的冰山图示为灵感制作的向量冰山图示被强制作为此专案的标识。

维基文库第一个在多语种的门户页面上广泛使用的口号是「自由的图书馆」(The Free Library),该页面基于维基百科门户在2005年8月27日被重新设计[9]。和维基百科门户一样,口号伴随着十大语言版本入口环绕着图示。点击门户中央的图片(冰山标识及顶部「Wikisource」标题),将会出现Wikisource和「自由的图书馆」的60种语言翻译列表。

内建工具

在挪威语维基文库上使用校对工具的截图,画面右侧为扫描图像,左侧为文字。

开发者ThomasV为维基文库开发了专用MediaWiki扩充程式ProofreadPage(页面校对),大大方便了书面内容的转抄。作品页面的扫描图片与有关页面文字并列出现,文字校对得以实现,比其他任何的独立验证编辑方式的精度要高[10][11][12]。一旦书籍或其他文字被扫描,原始图像可以用图像处理软体修改,以修正页面旋转等问题。修正过的图像可转换成PDFDjVu档案,上传至维基文库维基共享资源[10]

该系统能协助编者确保维基文库文字的准确性。作品完整的原始页面扫描结果,向全部使用者开放,让错误等以及时更正,读者也可以核对文字的原件。ProofreadPage还允许更大程度的参与,一旦图像被上传,浏览原始作品的印刷版本,不便于对专案作出贡献。故此,该工具增加了专案遵循维基媒体「人人可编辑」原则的信用度。

ThomasV还设计了其他工具,如是否发布注释的问题一旦被商议,可以透过小工具选择显示注释或仅显示文字。又如文字是否应数位化的问题被讨论,可透过小工具显示原件,以便确认文字的原始性。

如:法语维基文库对旧版字母s「ſ」的转换
原始文字
扫描页面

里程碑

sources.wikipedia.org专案正式启动仅两周,已建立了超过1000个页面,其中有200个为正式篇目。2004年1月4日,维基文库迎来第100位注册使用者。7月初,篇目数增至2400篇,注册使用者超500位。2005年4月30日,注册使用者总数为2667位(含18位元管理员),篇目数接近19000,当天专案透过了第96000次编辑。

2005年11月27日,英语维基文库上线第三个月,共收录了20000篇作品,比该版本专案移动到语言子域名前的四月份篇目数要多。2008年2月14日,英语维基文库收录了第10万篇作品——画家弗朗西斯·比科内尔·卡朋特回忆录《在白宫的六个月》的第74章。

2006年5月10日,法语维基文库首个维基文库主题建立

收录内容

维基文库的准入制度「可靠、已出版、著作权许可」可用文氏图表示,绿色为最佳情况,黄色为可以勉强接受的情况

维基文库收集已出版作品的数字版本,涵盖小说、书信、演讲、历史文献、法律等作品和系列档案。所收录的全部档案有著作权自由,以创用CC/署名-相同方式共享协定发布[1]。所有语言的文字和译作皆可收录。除了文字,维基文库的上还有漫画、电影、录音、笔录等材料[1]。维基文库的所有文件须已被出版,不收录贡献者「自费出版」的书籍或文件[1][13][14][15][16]

对于中文维基文库而言,大部分的内容是来自其他数字图书馆。其他语言的维基文库的内容有的需要扫描源,也有些文件是从线下来源转换而来或来自其他数字图书馆。在少数情况,也接受未发表的作品,比如具备显著的历史重要性的原始文件,许可或著作权法律规定不变。

维基文库唯一接受的原创作品是注解和译作[17],姊妹专案维基教科书也允许编者为文件建立注解版本。区别是,维基文库以文字为主,维基教科书以注释为主[16]。注解版本在德文维基文库更受欢迎[16]。该专案也收录使用者提供的译作。英语维基文库最显著的译作是《圣经》,旨在建立新的、「自由翻译」的《圣经》[18]

架构

语言子域名

2004年8月,独立的希伯来语维基文库(he.wikisource.org)成立,以解决从右到左书写的希伯来文排版困难。随后几个月,包括德语在内的其他语言贡献者要求分立子域名。12月份的相关投票中,编者没有达成共识。在2005年5月12日的第二轮投票中,支援按语言分立域名的投票占了多数。

2005年8月23日,布利昂·韦伯建立了最初的14种语言版本[19]。新的语言版本不包含英语,跨语言连结代码「en:」被暂时重新导向到主站(wikisource.org)。

当时,维基文库社群将成千上万篇文字和分类按照语言分类,为第二波在地化做准备。2005年9月11日,wikisource.org被重新组态,建立了英文和其他8个语言版本[20]

2006年3月29日,又有三个语言版本建立[21],2006年6月2日的第三波在地化中,有14个语言域名被设立[22]。目前,超过60种语言在维基文库拥有子域名[23]。有些语言版本还在孵化器网站,有的还在wikisource.org主站(主站目前代管31种语言版本)。

wikisource.org

虽然不少语言已经迁移到子域名,主域名wikisource.org依然运作,有如下三个目的:

  1. 各语言版本的协调作用:分站后,主域名的协调作用并非很频繁。主要的活动包括,在写字间的方针交流、子站更新的新闻、里程碑讯息,如Wikisource:2007。
  2. 作为语言版本孵化器:30多个语言版本还没有自己的子域名,依然代管在wikisource.org[24]。其中有些版本非常活跃,建成了拥有上千篇文件(如世界语和沃拉普克语),印地文条目则达到数千,已建立网站。
  3. 对存取wikisource.org的使用者进行导航:当前首页门户由ThomasV在2005年8月26日建立,仿照维基百科的首页。

特定专案的协调wiki是首次在维基文库出现,后来被维基学院测试版效仿。但其首页不是多语种的门户(非wiki页)[25]

回应

维基文库专案参与者的个人见解

拉里·桑格批评维基文库及其姊妹专案维基词典的合作性质和采用的技术,意味着没有监督的专家,因此提供内容不可靠[26]

北卡罗来纳大学教堂山分校新约圣经学者兼宗教学教授巴特·叶尔曼,批评英语维基文库计划创设使用者生成的《圣经》译本:「民主与学术不沾边。」[18]乔治亚大学旧约学者和犹太教教授理察·埃利奥特·弗里德曼,指出文库的《创世纪》翻译有误[18]

2010年,维基媒体基金会法国分会与法国国家图书馆达成协定,向法文维基文库加入该图书馆1400项公有领域文字,并把扫描图像并上传到维基共享资源。转录文字原先是光学字元辨识自动生成的,希望在维基文库得到人工改善[27][28][29] 。但该协定存在争议[30]

2011年,英文维基文库收到美国国家档案和记录管理局的大量高品质文件扫描,以致力于「增加文库的可存取性和可见性」。NARA的维基人多米尼克·麦克德维特-帕克斯,协助处理NARA收藏的众多图像,并将其上传至共享资源。许多文件已被转录,并以连结形式,出现在国家档案馆的线上目录中[31]

参考资料

  1. ^ 1.0 1.1 1.2 1.3 1.4 1.5 1.6 Ayers, Phoebe; Matthews, Charles; Yates, Ben. How Wikipedia Works. No Starch Press. 2008: 435–436. ISBN 978-1-59327-176-3. 
  2. ^ wikisource.org Competitive Analysis, Marketing Mix and Traffic - Alexa. www.alexa.com. [2020-01-13]. (原始内容存档于2019-01-22). 
  3. ^ The Cunctator. Primary sources Pedia, or Project Sourceberg. Wikipedia. 2001-10-16 [2011-07-05]. (原始内容存档于2016-03-14). 
  4. ^ The Cunctator. Primary sources Pedia, or Project Sourceberg. Wikipedia. 2001-10-16 [2012-03-24]. (原始内容存档于2018-11-20). 
  5. ^ Sanger, Larry. Primary sources Pedia, or Project Sourceberg. Wikipedia. 2001-10-17 [2012-03-24]. 
  6. ^ Wales, Jimmy. Primary sources Pedia, or Project Sourceberg. Wikipedia. 2001-10-17 [2012-03-24]. 
  7. ^ Starling, Tim. Scriptorium. Wikisource. 2004-07-23 [2011-07-05]. (原始内容存档于2013-10-15). 
  8. ^ 投票·存档3:维基文库图标. 中文维基文库. [2020-08-25]. 
  9. ^ Wikisource.org门户页面历史版本. Wikisource.org. 2005-08-27 [2011-07-05]. (原始内容存档于2013-11-10). 
  10. ^ 10.0 10.1 Bernier, Alex; Burger, Dominique; Marmol, Bruno. Wiki, a New Way to Produce Accessible Documents. Miesenberger, Klaus; Klaus, Joachim; Zagler, Wolfgang; Karshmer, Arthur (编). Computers Helping People with Special Needs. Springer. 2010: 22–24. ISBN 978-3-642-14096-9. 
  11. ^ Proofread Page extension at MediaWiki. Retrieved 2011-09-29.
  12. ^ ProofreadPage at Wikisource.org. Retrieved 2011-09-29.
  13. ^ Mission statement. WikimediaFoundation.org. Wikimedia Foundation. [2011-07-08]. (原始内容存档于2011-07-04). 
  14. ^ Wikisource. Wikimedia.org. Wikimedia Foundation. [2011-07-08]. (原始内容存档于2011-07-13). 
  15. ^ What is Wikisource? – What do we excluded. Wikisource.org. Wikisource. [2011-07-08]. (原始内容存档于2011-07-09). 
  16. ^ 16.0 16.1 16.2 Boot, Peter. Mesotext. Amsterdam University Press. 2009: 34–35. ISBN 978-90-8555-052-5. 
  17. ^ Broughton, John. Wikipedia Reader's Guide: The Missing Manual. O'Reilly Media, Inc. 2008: 23. ISBN 978-0-596-52174-5. 
  18. ^ 18.0 18.1 18.2 Philips, Matthew. God’s Word, According to Wikipedia. Newsweek. 2008-06-14 [2014-12-06]. (原始内容存档于2009-04-16). 
  19. ^ Server admin log for August 23, 2005,第十五个语言版本于8月25日建立
  20. ^ 详见2005年9月11日01:20的伺服器管理纪录档和底部时间「9月10日22:49
  21. ^ Server admin log for March 29. Wikitech.wikimedia.org. [2011-07-05]. (原始内容存档于2015-04-02). 
  22. ^ Server admin log for June 2, 2006. Wikitech.wikimedia.org. [2011-07-05]. (原始内容存档于2015-04-02). 
  23. ^ 详见维基文库首页Multilingual Portal和元维基的维基文库版本列表.
  24. ^ 所有语种首页的自动列表,详见Category:Main Pages; 而格式化的列表,请参阅维基文库门户.
  25. ^ Wikiversity.org. Wikiversity.org. [2011-07-05]. (原始内容存档于2010-08-12). 
  26. ^ Anderson, Jennifer Joline. Wikipedia: The Company and Its Founders. ABDO. 2011: 92–93. ISBN 978-1-61714-812-5. 
  27. ^ La BNF prend un virage collaboratif avec Wikisource [BNF takes a collaborative turn with Wikisource]. ITespresso. NetMediaEurope. 2010-04-08 [2011-09-29]. (原始内容存档于2011-10-08) (法语). 
  28. ^ Wikimédia France signe un partenariat avec la BnF [Wikimedia France sign a partnership with the BnF]. Wikimédia France. 2010-04-07 [2011-09-29]. (原始内容存档于2011-09-29) (法语). 
  29. ^ "French National Library to cooperate with Wikisource", Wikipedia:维基简讯. 2010-04-12.
  30. ^ Eric Chaverou. BnF Scanning controversy. franceculture.fr. Radio France. 2013-05-02 [2013-12-14]. (原始内容存档于2013-12-13) (法语). 
  31. ^ McDevitt-Parks, Dominic; Waldman, Robin. Wikimedia and the new collaborative digital archives. The Text Message. 国家档案和记录管理局. 2011-07-25 [2011-09-29]. (原始内容存档于2011-09-13). 

外部连结