罗马化
罗马化(英语:Romanization),又称拉丁化(Latinization),是语言学中将不是拉丁字母(又称罗马字母)形式的文字系统,转换成拉丁字母的过程。主要是将被转换系统里的非拉丁文字,按照转写系统的规则和转写表,忠实地将字符(也包括字符的附加符号及单音素双字符)对号入座地转写成转换系统里的拉丁字符。被转换系统与转换系统的字符也可以逆向转写。
罗马化的方案有很多,包括用以表达书面语的音译、和用以表达口语的转录。后者可以再被分为两类:音位转录,用以记录音素或者一段说话里的语义数量。和更严格的标音转录来记录说话声音。而每一个罗马化方案均有一套独立的规则,规定了每一个已罗马化字元的发音。除了拼音文字之外,现今唯一彻底采用语素文字系统的汉字也从近代起出现罗马化方案,但并未完全取代汉字原有的功能。
类似罗马化的文字转写型式还有「西里尔化」(又称「斯拉夫化」),即把一个语言音译或转录成西里尔字母的过程。
罗马化方案
音译
如果使用罗马化方案去把原来的字词去音译的话,最基本的原则就是把本来语言里的字母,逐一音译到目标语言之中。这个方法的特色,就是过程中并不着重在目标语言里的实际发音。例如,使用日语的训令式罗马字的话,就容许读者可以百分之百地,凭拼音去重组成日语的片假名音节。但这个方案需要事前对日语有一定的知识。
转录
音位转录
但是,大部份的罗马化方案都以一般读者为主。就是说读者事前并不需要对本来语言有认识,反而应该提起读者对本来语言如何发音的兴趣。这样的罗马化方案大多根据音位转录原则,尝试把在本来语言里,每一个音位的发音,尽量准确地转录,使到操目标语言的人都能发到贴近的发音。日语里的平文式罗马字(或称黑本式罗马字)就是一个很好的例子,这个罗马化方案是为英语使用者而设的。
标音转录
标音转录方案则更进一步,这个方案尝试把本来语言里所有的音位描绘出来。有时可能会牺牲目标语言里阅读性的,使用在目标语言里没有的字母。国际音标字母就是一个在标音转录里最常用的系统。
取舍
对于大部份的语言来说,建立一套可用性的罗马化方案都会涉及需要在两个极端里进行取舍。纯正的转录被普遍认为是不可能的,因为多会发生诸如在本来语言里的发音和区别,不可能在目标语言里表现出来。但如果硬要表现出来的话,就会使罗马化后的字眼变得复杂。
一般来说,除了一部份学者之外,罗马化方案都倾向以音位转录形式出现。举个例子,日本武术「柔术」这一词,使用训令式罗马字的话,就会变成「zyūzyutu」。这样一来可以让本身懂日语的人去重组成假名的「じゅうじゅつ」。但使用平文式罗马字的话就会变成「jūjutsu」,人们会较易猜到这个词语本来的日语发音。
不同书写系统的罗马化方案
阿拉伯字母
阿拉伯字母是用来书写阿拉伯语、波斯语和乌尔都语。其罗马化方案如下:
- 德国摩尔根兰学会[1](1936年):被罗马的国际东方学者会议所使用,是以汉斯-威海辞典(ISBN 0879500034)为基础所发展的方案。
- BS 4280(1968年):由英国标准协会[2]发展的方案。
- 标准阿拉伯语技术性音译系统(1970年代):由美国军队发展的方案。
- 联合国地名专家组(1972年)[3]
- DIN-31635(1982年):由德国标准化协会所发展的方案。
- ISO 233(1984年):国际标准化组织的音译方案。
- 卡拉姆(1985年):一套着重保留字母串法,牺牲了发音的方案。 [4]
- ISO 233-2(1993年):国际标准化组织的简化音译方案。
- 毕克华尔特音译方译(1990年代):由施乐研究中心的添·毕克华尔特先生所发明的系统。[5]这个系统并不需要一些特别的发音区别符号。[6]
- 美国国会图书馆标准方案(1997年)[7]
希伯来语字母
希伯来语
- 美国国家标准学会 Z39.25(1975年)
- 联合国地名专家组(1977年)[8]
- ISO 259(1984年):国际标准化组织的音译方案。
- ISO 259-2(1994年):国际标准化组织的简化音译方案。
- ISO/DIS 259-3:国际标准化组织的音位转录方案
- 美国国会图书馆标准方案 [9]
婆罗米字母
婆罗米字母用以书写印度大陆和东南亚地方语言的书写系统。长久以来,西方都是透过其罗马化音译去研究梵文以及其他印度文字。自英国的东方学者威廉·琼斯爵士之后,不同的印度文字音译方案亦随之推出。[10]
- ISO 15919(2001年):国际标准化组织的音译方案。这套方案以发音区别符号去标示大量的婆罗米子音及母音。[11]而天城文独有的部份在学术标准上也被同化。国际梵文音译字母及美国国会图书馆的标准[12]
- 哈佛-京都转写:使用大楷、小楷及双字母以避免使用发音区别符号,及限制使用范围至7位元的美国信息互换标准代码(ASCII)标准。
- 印度语言音译:由Avinash Chopde发明的一套7位元ASCII标准的音译方案,常见于Usenet网络。
- HTML用梵文音译字母:源自阿根廷,同样兼容7位元的ASCII标准。[13]
- 印度文字信息互换代码方案(1988年)
- 加尔各答国家图书馆罗马化
汉语文字
汉语的罗马化,在某些层面上被证明是一个困难的问题,因为同时涉及政治考虑。另一个困难之处,就是汉语并非表音文字,而是意音文字。所以大部份的罗马化方案并非直接把汉字转换,而是建基于类似汉语拼音之上。[14]
现代标准汉语
- 美国国会图书馆标准方案:和威妥玛拼音类似的方案[15], 但在2000年已经被转换成汉语拼音。 [16]
- 法国远东学院拼音:由法国远东学院于19世纪发明,主要于法国使用。
- 拉丁化新文字(1926年):把音调省略,主要于前苏联使用。
- 德国式拼音:主要于德国使用。
- 邮政式拼音(1906年):早期的国际地址标准。
- 威妥玛拼音(1912年):音译方案,在中国大陆常用于第二次世界大战之前,在台湾现今仍用于县市级以上之地名及大多台湾人名。
- 耶鲁拼法(1942年):由美国所创,用于战地通讯。
- 捷克拼音:主要于捷克和斯洛伐克使用。
中华人民共和国
- 汉语拼音(1958年):在中华人民共和国,这套方案已经被官方确认为罗马化汉语的标准方案。多数用于教授母语并非普通话的学生,学习普通话时使用的学习工具。这套方案亦被国际社会普遍所接受,作为拼写中文或名字时的标准。汉语拼音价值在于中国地大物博,人口之多,与其他面积和人口相若的国家一样,出现了多种汉语方言。所以需要有一套统一的书写系统和语言去进行沟通。
- ISO 7098(1991年):国际标准化组织的方案,与汉语拼音非常相似。
中华民国
- 威妥玛拼音:通用拼音始为官方系统前,多数中华民国地名、路名与中华民国国民姓名多以此一拼音系统拼写。
- 国语罗马字(1926年):中华民国教育部于1926年正式公布后在于全中国地域使用。1949年后则于台湾地区继续使用,后来才被注音符号第二式所取代。
- 注音符号第二式(1986年):主要于中华民国使用,目前仍普遍用于以儿童为对象的公共场合或机构。
- 通用拼音(2000年):主要于中华民国。[17]
标准南京官话
标准粤语
- 教育学院拼音方案:香港教育局、考评局承认的方案
- 广州话拼音方案:饶秉才在广东省教育部门方案基础上的修订版本
- 香港政府粤语拼音:香港政府拼写人名、地名的方案
- 香港语言学学会粤语拼音方案(粤拼,1993年):香港语言学学会方案
- 澳门葡式粤语拼音:澳门政府拼写人名、地名的方案
- Meyer-Wempe
- 刘锡祥拼音
- 耶鲁粤语拼音(1942年)
- 黄锡凌罗马拼音
- 宽式国际音标
吴语
闽南语
闽东语/福州话
传教士罗马化语言办报
- 发端:19世纪末,在中国的欧洲、美国传教士再次掀起兴办中文报刊的高潮。以美国乔治亚州的传教士编辑林乐知为首的一批传教士编辑认识到了非教会报纸具有广泛传播的可能性。为了扩大报刊的发行量,就需要使用更加通俗易懂的文字。作为针对文盲读者的极端方法,他们开始使用罗马化语言。他们起初曾持怀疑态度,因为这意味着报刊的传播元素将与汉字方块字彻底分离。这不仅预示着字母文字的引进,而且暗示了一种基于新文字的文学体系的形成。
- 莱普修斯字母表:德国传教士倾向于卡尔·理察·莱普修斯(Karl Richard Lepsius)字母表
- 威廉·琼斯字母表:英国传教士倾向于推行威廉·琼斯(William Jones)的字母表
- 成果:在中国东南沿海方言丰富多变的地区,罗马化语言办报的计划取得了些许成功。例如,厦门土话约有800个音节,相比之下,在中国四分之三地区通用的标准官话只有420个音节。虽然不同地区的官话略有变化,但后来还是成为了全国性的标准语言。在香港,崇真会(巴色会)传教士娄士(G.Reusch)于1882年用罗马化的客家方言编纂一份插图月刊,每年订阅价为20美分。[18]在台湾,英国长老会差会的巴克礼(Thomas Barclay)创办一份用罗马拼音化的白话字印刷的教会月刊《台南府城教会报》(后更名台湾教会公报)。在汕头,英国长老会的传教士汲约翰(J.C.Gibson)也办过类似的《潮惠会报》,只是后来都因时局原因而停止,但白话字仍在民间传承。相反的,官话实行罗马化或者演变为单纯的拼音文字都不适用,因为它具有太多的同音异义字。因此,大多数传教士报刊不仅使用汉字印刷,而且采用中国传统的书册式报刊形制。
日文
罗马化,在日语里称作罗马字(ローマ字)。
- 平文式罗马字(1867年):音位转录方案。
- 日本式罗马字(1885年):音译方案,于1989年成为了ISO 3602严谨标准。
- 训令式罗马字(1937年):音译方案,后来成为了ISO 3602标准。
- JSL(1987年)
- 美国国会图书馆标准方案:与平文式罗马字相似的一套方案。[19]
- 文字处理器式罗马字
谚文
韩语
- 马科恩-赖肖尔转写系统(1937年):直至2002年为止,都是南韩官方的韩语罗马化方案。现时此系统仍于北韩使用。
- 罗马字标记法修正案(2000年):在2005年,南韩政府正式使用这套已于2000年批准的方案。路牌和教科书已经开始逐步跟随,政府估计此刻修订需要花费至少20亿美元。但人名拼音仍然可以按照个人意愿,但政府会强烈建议使用新方案。
- 耶鲁拼法(1942年):这套方案主要应用于学术文学层面。
- 美国国会图书馆标准方案:与McCune-Reischauer式大致上相同。[20]
- ISO/TR 11941(1996年):这套方案其实是由两个方案所组成,分别为南北韩两个国家所提出。最初提交上国际标准化组织的方案,是经过双方努力的成果(方案主要以耶鲁方案为基础)。但在最后阶段,双方出现方歧,导致出现了两个方案。[21]
吉阿吉阿语
吉阿吉阿语原本没有文字。从2008年开始,当地与韩国训民正音学会采用谚文字母作为其现代化的文字,但后来废止了。
- 吉阿吉阿语罗马化方案
泰文
泰语
泰语主要于泰国使用,有自己的一套文字去书写。该套书写系统可能是由古高棉传过来,属于婆罗米文字的一种。请参阅泰语字母。
- 皇家泰语转写通用系统
- 美国国会图书馆标准方案[22]
- ISO 11940(1998年):国际标准化组织的音译方案。
西里尔字母
在语言学中,西里尔字母和格拉哥里字母都使用了科学音译。同样情况亦应用于古教会斯拉夫语,以及现代的各个斯拉夫语族,因为他们同样使用这些字母。
白俄罗斯语
白俄罗斯语同时使用了西里尔字母和拉丁字母。但时至今日,纵使仍然有使用拉丁字母(正式名称为Łacinka或Łacinica)的拥护者,但已经几乎绝迹。但姑勿论本来的拉丁字母存在与否,白俄罗斯语的名字一般按俄语的习惯被翻译。
例字 | |
---|---|
Łacinka字母 | 罗马化后 |
Homiel | Homyel' |
Mahiloŭ | Mahilyow |
Viciebsk | Vitsebsk |
Baranavičy | Baranavichy |
Žytkavičy | Zhytkavichy |
文献 | |
|
俄语
现时并没有一套国际公认把俄语翻译成罗马字母的方案—事实上已经有很多套方案存在:有时会稍作调整以迎合某些特定语言(例如德语和法语),而有些则设计为图书馆音译之用,有些则为翻译俄罗斯旅客护照之用。有时,有些名字的音译则是以传统为主。这样一来,同一个名字会重复出现很多次。例如,俄国著名作曲家柴可夫斯基可以被译成以下名字:Tchaykovsky, Tchajkovskij, Tchaikowski, Tschaikowski, Czajkowski, Čajkovskij, Čajkovski, Chajkovskij, Chaykovsky, Chaykovskiy, Chaikovski等等。
- BGN/PCGN(1947年):美国地名委员会的方案[24]
- GOST 16876-71(1983年):前苏联的国家标准委员会,测量及地图绘制部门的方案。[25]
- 联合国标准(1987年):以GOST方案上作基础,在俄罗斯国内及国外的绘图产品都开始被大量广泛使用。
- ISO 9(1995年):国际标准化组织的音译方案。
- 美国国会图书馆标准方案(1997年)[26]
- Volapuk编码(1990年):这是一个人们为了方便在网络上,使用拉丁字母传送讯息,而使用的非正统俄语罗马化方案。(这里不是指沃拉普克语)
- 维基百科内部标准(2004年):从BGN/PCGN拼法引伸出来,特别于网上实际应用尤为重要。
乌克兰语
乌克兰的人名多以音位转录形式翻译。乌克兰国家系统主要于翻译乌克兰地名时使用。
希腊字母
- ISO 843(1997年):国际标准化组织方案 [31]
- 美国国会图书馆标准方案[32]
乔治亚字母
乔治亚语
ISO 9984是把现代乔治亚语罗马化的系统。
总结
以下的表格列出了把不同字母或书写系统,作音位转录罗马化后的结果。虽然对大部份使用者来说已经足够,但是每一个字母始终还有几个译法和其他例外例子。详情请参阅以下各个语言的相关条目。(由于韩语字母数量过于庞大,所以本表格只列出第一个字母)
罗马化后 | 希腊语 | 俄语 | 希伯来语 | 阿拉伯语 | 日语片假名 | 韩语 |
A | A | А | ַ, ֲ, ָ | دَ, دَ, ﺍ — ﺎ, دَىا | ア | |
AI | י ַ | |||||
B | Б | בּ | ﺏ ﺑ ﺒ ﺐ | ㅂ | ||
CH | Χ | Ч | ㅊ | |||
CHI | チ | |||||
D | Δ | Д | ד | ﺩ — ﺪ, ﺽ ﺿ ﻀ ﺾ | ㄷ | |
DH | ﺫ — ﺬ | |||||
E | Ε | Э | , ֱ, י ֵֶ, ֵ, י ֶ | エ | ||
F | Φ | Ф | פ (final ף ) | ﻑ ﻓ ﻔ ﻒ | ||
FU | フ | |||||
G | Γ | Г | ג | ㄱ | ||
GH | ﻍ ﻏ ﻐ ﻎ | |||||
H | ח, ה | ﻩ ﻫ ﻬ ﻪ, ﺡ ﺣ ﺤ ﺢ | ㅎ | |||
HA | ハ | |||||
HE | ヘ | |||||
HI | ヒ | |||||
HO | ホ | |||||
I | Η, Ι, Υ | И | ִ, י ִ | دِ | イ | |
IY | دِي | |||||
J | Ж | ﺝ ﺟ ﺠ ﺞ | ㅈ | |||
JJ | ㅉ | |||||
K | Κ | К | כּ (final ךּ ), ק | ﻙ ﻛ ﻜ ﻚ | ㅋ | |
KA | カ | |||||
KE | ケ | |||||
KH | Х | כ (final ך ) | ﺥ ﺧ ﺨ ﺦ | |||
KI | キ | |||||
KK | ㄲ | |||||
KO | コ | |||||
KU | ク | |||||
L | Λ | Л | ל | ﻝ ﻟ ﻠ ﻞ | ||
M | Μ | М | מ (final ם ) | ﻡ ﻣ ﻤ ﻢ | ㅁ | |
MA | マ | |||||
ME | メ | |||||
MI | ミ | |||||
MO | モ | |||||
MU | ム | |||||
N | Ν | Н | נ (final ן ) | ﻥ ﻧ ﻨ ﻦ | ㄴ | |
NA | ナ | |||||
NE | ネ | |||||
NI | ニ | |||||
NO | ノ | |||||
NU | ヌ | |||||
O | Ο, Ω | О | , ֳ, וֹֹ | オ | ||
P | Π | П | פּ (final ףּ ) | ㅍ | ||
PP | ㅃ | |||||
PS | Ψ | |||||
Q | ﻕ ﻗ ﻘ ﻖ | |||||
R | Ρ | Р | ר | ﺭ — ﺮ | ㄹ | |
RA | ラ | |||||
RE | レ | |||||
RI | リ | |||||
RO | ロ | |||||
RU | ル | |||||
S | Σ | С | ס, שֹ | ﺱ ﺳ ﺴ ﺲ, ﺹ ﺻ ﺼ ﺺ | ㅅ | |
SA | サ | |||||
SE | セ | |||||
SH | Ш | ש | ﺵ ﺷ ﺸ ﺶ | |||
SHCH | Щ | |||||
SHI | シ | |||||
SO | ソ | |||||
SS | ㅆ | |||||
SU | ス | |||||
T | Τ | Т | ט, תּ, ת | ﺕ ﺗ ﺘ ﺖ, ﻁ ﻃ ﻄ ﻂ | ㅌ | |
TA | タ | |||||
TE | テ | |||||
TH | Θ | ﺙ ﺛ ﺜ ﺚ | ||||
TO | ト | |||||
TS | Ц | צ (final ץ ) | ||||
TSU | ツ | |||||
TT | ㄸ | |||||
U | У | , וֻּ | دُ | ウ | ||
UW | دُو | |||||
V | B | В | ב, ו, וו | |||
W | ﻭ — ﻮ | |||||
WA | ワ | |||||
WE | ヱ | |||||
WI | ヰ | |||||
WO | ヲ | |||||
X | Ξ | |||||
Y | Й, Ы | י | ﻱ ﻳ ﻴ ﻲ | |||
YA | Я | ヤ | ||||
YE | Е | |||||
YO | Ё | ヨ | ||||
YU | Ю | ユ | ||||
Z | Ζ | З | ז | ﺯ — ﺰ, ﻅ ﻇ ﻈ ﻆ | ||
ZH | Ж |
参见
参考文献
- ^ DMG. [2021-12-31]. (原始内容存档于2017-08-10).
- ^ BSI Group. [2013-04-25]. (原始内容存档于2008-10-07).
- ^ EPORT ON THE CURRENT STATUS OF UNITED NATIONS ROMANIZATION SYSTEMS FOR GEOGRAPHICAL NAMES (PDF). 2018-06 [2005-08-20]. (原始内容存档 (PDF)于2021-02-11).
- ^ Qalam: A Convention for Morphological Arabic-Latin-Arabic Transliteration. [2015-07-02]. (原始内容存档于2009-02-08).
- ^ ARABIC TRANSLITERATION. qamus.org. [2005-08-20]. (原始内容存档于2021-02-24).
- ^ Xerox Arabic Morphological Analysis and Generation. [2021-12-31]. (原始内容存档于2002-04-24).
- ^ Arabic (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2017-12-15).
- ^ REPORT ON THE CURRENT STATUS OF UNITED NATIONS ROMANIZATION SYSTEMS FOR GEOGRAPHICAL NAME (PDF). 2013-02 [2005-08-20]. (原始内容存档 (PDF)于2021-01-25).
- ^ Hebrew and Yiddish (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-03-22).
- ^ SANSKRIT 3 COMPARING TRANSLITERATION SYSTEMS. [2005-08-20]. (原始内容存档于2004-03-15).
- ^ 详情请参阅:Transliteration of Indic scripts: how to use ISO 15919 (页面存档备份,存于网际网路档案馆)
- ^ Hindi (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2020-12-10).
- ^ SANSKRIT 3 LEARNING THE INTERNATIONAL ALPHABET OF SANSKRIT TRANSLITERATION. [2006-11-20]. (原始内容存档于2007-02-12).
-
^ 拼音转换查询. [2005-08-20]. (原始内容存档于2004-06-19).
Romanization.com a guide to Taiwan. [2005-08-20]. (原始内容存档于2021-03-17). - ^ Chinnese (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-03-23).
- ^ New Chinese Romanization Guidelines. www.loc.gov. [2005-08-20]. (原始内容存档于2021-04-14).
- ^ Zhuyin, Hanyu Pinyin, and Tongyong Pinyin Cross-Reference Table. 2000-10-16 [2005-08-20]. (原始内容存档于2017-09-17).
- ^ JOHN MURDOCH.Report on Christian Literature in China.Shanghai 1882.pp7-8,12,19-20
- ^ Japanese (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-04-20).
- ^ Korean (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-03-20).
- ^ 两个方案的分别:Hangul and Other Languages (页面存档备份,存于网际网路档案馆)
- ^ The romanization table - thai (PDF). [2005-08-20]. (原始内容存档 (PDF)于2008-12-11).
- ^ Beloruss (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-01-15).
- ^ Cyrillic Usage. [2013-04-25]. (原始内容存档于2012-07-16).
- ^ CCL phg-koi8. www.ccl.net. 1992-12-30 [2005-08-20]. (原始内容存档于2021-03-17).
- ^ Russian (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-04-25).
- ^ Ukrainia (PDF). www.lov.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-03-22).
- ^ JPEG图档,以乌克兰写成. [2005-01-25]. (原始内容存档于2005-03-07).
- ^ REPORT ON THE CURRENT STATUS OF UNITED NATIONS ROMANIZATION SYSTEMS FOR GEOGRAPHICAL NAME (PDF). 2003-01 [2021-12-31]. (原始内容 (PDF)存档于2006-01-03).
- ^ 托马士.彼得逊先生撰写的五个系统对比:Transliteration of Ukrainian (页面存档备份,存于网际网路档案馆)
- ^ The Greek Vitis Database. [2005-01-25]. (原始内容存档于2004-12-10).
- ^ Greek (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2011-05-13).
外部连结
- 联合国地名专家组-罗马化系统工作组 (页面存档备份,存于网际网路档案馆)
- 美国国会图书馆-罗马化列表 (页面存档备份,存于网际网路档案馆)(PDF文档)
- Java罗马化程式
- 尚有少量书籍附有罗马化列表《ALA-LC Romanization Tables》Randall Barry (ed.), U.S. Library of Congress, 1997, ISBN 0844409405.
- Thomas T. Pederson's chart (页面存档备份,存于网际网路档案馆)