关于中文歌曲beatmap的Romanisation的讨论

posted
Total Posts
54
Topic Starter
Lyric
现在我们中文mapper们越来越多,对于中文romanised title的规范拼写需求越来越大。汉语拼音是由中华人民共和国官方颁布的汉字注音拉丁化方案,然而旧的规则( t/244684 )存在严重的错误和定义上的不全面问题,

As a result of more and more Chinese mappers, we need a more appropriate way to romanise Chinese songs. Currently we use https://osu.ppy.sh/forum/t/244684 as a reference for those songs which don't have any official reference, while PinYin is a romanising proposal made by PRC, the old rule doesn't support the PRC's official ways.


例如:
Examples:
  1. 我们的爱

    应为 Women de Ai
    而不是 Wo Men De Ai
    原因: de 是虚词; Women是一个独立的名词。
    Should be "Women de Ai",
    instead of "Wo Men De Ai".
    Reason: "de" is an empty word, "Women" is a independent noun.

  2. 沙发

    应为 Shafa
    而不是 Sha Fa
    原因: Shafa是一个独立的名词。
    Should be "Shafa",
    instead of "Sha Fa".
    Reason: "Shafa" is a independent noun.

  3. 基因

    应为 Jiyin
    而不是 Ji Yin
    原因: Jiyin是一个独立的名词。
    Should be "Jiyin",
    instead of "Ji Yin".
    Reason: "Jiyin" is a independent noun.

  4. 我的未来式

    应为 Wo de Weilaishi
    而不是 Wo De Wei Lai Shi
    原因: de 是虚词;Weilaishi是一个结合紧密的三音节词组。
    Should be "Wo de Weilaishi",
    instead of "Wo De Wei Lai Shi".
    Reason: "de" is an empty word, "Weilaishi" is a Tight three-syllable phrase.
所以现在提出对中文歌曲标题romanised title的拼写方法的修改。
So now we intend to modify the romanised spelling of Chinese songs.

中文歌曲的标题在osu!中Romanised化的拼写,属于对中文出版物或文献的信息处理过程,符合中华人民共和国国家标准中文书刊名称汉语拼音拼写法第1条的描述,故应该使用中华人民共和国国家标准中文书刊名称汉语拼音拼写法(GB 3259-92)代替 t/244684 的rule。
Romanised spelling of Chinese in osu! belonging to Chinese literature or publications information processing. It is mentioned in the first article in Transliterating rules of Chinese phonetic - Alphabet on titles for books and periodicals in Chinese (GB 3259-92), to replace rule in t/244684 .
具体内容如下:
Details are as follows:
(Quoted from http://www.pep.com.cn/xiaoyu/jiaoshi/st ... 956087.pdf )

5.1 中文书刊名称拼写基本上以词为书写单位。每个词第一个字母要大写。因设计需要,也可以全用大写。
Chinese publications should be written word by word (instead of character by character). The first letter of each word should be capitalized. Factorial designs can use all capital.

  1. 子夜 Ziye 珍珠 Zhenzhu
  2. 长城恋 Changcheng Lian 新工具 Xin Gongju
  3. 中国青年 Zhongguo Qingnian 人民日报 Renmin Ribao
  4. 幼儿小天地 You'er Xiao Tiandi 行政法概论 Xingzhengfa Gailun
  5. 人口经济学 Renkou Jingjixue
  6. 散文创作艺术 Sanwen Chuangzuo Yishu

5.2 结合紧密的双音节和三音节的结构(不论词或词组)连写。
Regardless of the word or phrase, Tight two-syllable and three-syllable structure should ligature.

  1. 海囚 Haiqiu
  2. 军魂 Junhun
  3. 地火 Dihuo
  4. 红楼梦 Hongloumeng
  5. 爆破工 Baopogong
  6. 资本论 Zibenlun

5.3 四音节以上的表示一个整体概念的名称按词(或语节)分开写,不能按词或语节划分的,全部连写。
Quadrisyllabic or above word/phrases, which represents a whole concept should spell in parts. All ligature for which can not be separated.

  1. 线性代数 Xianxing Daishu
  2. 汽油发电机 Qiyou Fadianji
  3. 中华人民共和国森林法 Zhonghua Renmin Gongheguo Senlinfa
  4. 高压架空送电线路机械设计 Gaoya Jiakong Songdian Xianlu Jixie Sheji
  5. 微积分学 Weijifenxue 极限环论 Jixianhuanlun
  6. 非平衡态统计力学 Feipinghengtai Tongji Lixue

5.4 名词与单音节前加成分和单音节后加成分,连写。
Composition before or behind a noun/monosyllable should be ligatured.

  1. 超声波 Chaoshengbo
  2. 现代化 Xiandaihua

5.5 虚词与其他语词分写,小写。因设计需要,也可以大写。
Empty words should be separated and in lower case. Unless the design needs.

  1. 水的世界 Shui de Shijie
  2. 大地之歌 Dadi zhi Ge
  3. 功和能 Gong he Neng
  4. 红与黑 Hong yu Hei

5.6 并列结构、缩略语等可以用短横。
Parallel structures and abbreviations can combined with hyphen.

  1. 秦汉史 Qin-Han Shi
  2. 英汉词典 Ying-Han Cidian
  3. 袖珍真草隶篆四体百家姓 Xiuzhen Zhen-cao-li-zhuan Si Ti Baijiaxing
  4. 北京大学和五四运动 Beijing Daxue he Wu-si Yundong
  5. 环保通讯 Huan-bao Tongxun
  6. 中共党史讲义 Zhong-Gong Dangshi Jiangyi

5.7 汉语人名按姓和名分写,姓和名的开头字母大写。笔名、别名等,按姓名写法处理。
Separate first name and last name for Chinese names. First/Last name should begin with capitals. Including pseudonym.

  1. 茅盾全集 Mao Dun Quanji
  2. 巴金研究专集 Ba Jin Yanjiu Zhuanji
  3. 沈从文文集 Shen Congwen Wenji
  4. 盖叫天表演艺术 Gai Jiaotian Biaoyan Yishu
  5. 已经专名化和称呼,连写,开头大写。
  6. 庄子译注 Zhuangzi Yizhu
  7. 小包公 Xiao Baogong

5.8 汉语地名专名和通名分写,每一分写部分的第一个字母大写。
Common name and administrative division name suffix for one place should be separated. Initials for each part.

  1. 江苏省地图 Jiangsu Sheng Ditu
  2. 九华山 Jiuhua Shan
  3. 话说长江 Huashuo Chang Jiang

5.9 某些地名可用中国地名委员会认可的特殊拼法。
Some place name should spell according to the Geographical Names Board of PRC.

  1. 陕西日报 Shaanxi Ribao

5.10 书刊名称中的中国少数民族和外国的人名、地名可以按原文的拉丁字母拼法拼写,也可以按汉字注音拼写。
It would be best to translate foreign names. Even if you can spell it with Pinyin.

  1. 成吉思汗的故事 Chengjisihan de Gushi
  2. 怀念班禅大师 Huainian Banchan Dashi
  3. 铁托选集 Tietuo Xuanji
  4. 居里夫人传 Juli Furen Zhuan
  5. 威廉·李卜克内西传 Weilian Libukeneixi Zhuan
  6. 在伊犁 Zai Yili 拉萨游记 Lasa Youji
  7. 巴黎圣母院 Bali Shengmuyuan
  8. 维也纳的旋律 Weiyena de Xuanlv

5.11 数词十一到九十九之间的整数,连写。
Digital form 11 to 99 should ligature.

  1. 十三女性 Shisan Nvxing
  2. 财政工作三十五年 Caizheng Gongzuo Sanshiwu Nian
  3. 六十年目睹怪现状 Liushi Nian Mudu Guai Xianzhuang
  4. 黄自元楷书九十二法 Huang Ziyuan Kaishu Jiushi'er Fa

5.12 “百”“千”“亿”与前面的个位数,连写;“万”“亿”与前面的十位以上的数,分写。
Digits before Hundred, Thousand or Yi (one hundred million) should ligature with their suffix. Ten or more before Wan (ten thousand) and Yi should spell separately.

  1. 美国二百年大事记 Meiguo Erbai Nian Dashiji
  2. 一千零一夜 Yiqian Ling Yi Ye
  3. 十万个为什么 Shi Wan Ge Weishenme

5.13 表示序数的“第”与后面的数词中间,加短横。
There should be a hyphen between "第" (a prefix before a number to make it become a ordinal number) and a number.

  1. 第二国际史 Di-er Guoji Shi
  2. 第三次浪潮 Di-san Ci Langchao

5.14 数词的量词分写。
Separate quantifiers.

  1. 一条鱼 Yi Tiao Yu
  2. 两个小伙子 Liang Ge Xiaohuozi

5.15 阿拉伯数字和外文字母照写。
Copy Arabic numbers and Latin alphabets.

  1. 赠给18岁诗人 Zenggei 18 Sui Shiren
  2. 1979—1980中篇小说选集 1979—1980 Zhongpian Xiaoshuo Xuanji
  3. BASIC语言 BASIC Yuyan
  4. IBM-PC(0520)微型机系统介绍 IBM-PC (0520)Weixingji Xitong Jieshao

5.16 "ü" must be romanised to "v",因为ü并不是标准的拉丁字符。
because "ü" is not a standard Latin character.

  1. 女生 Nvsheng

TR;DL: 以每个短语/词语/成语来分空格,而不是每个中文汉字。Spacing each phrase/word/idiom, instead of one character.

Please discuss and give your opinions!
Wing My Way
总结一下

支持新rule的看法:
1.标准化后更规范,原先的rule不够标准且来源不充分,且新rule有助于规范汉语拼音的书写
2.对于汉语意思的区分有帮助,比如同一个词语用不同的汉语拼音书写的意义是不同的
3.好看,原先的rule一部分人认为书写起来不够漂亮
4.有利搜索,原先的汉语拼音书写格式需要打空格搜索起来较麻烦

反对新rule的看法:
1.歧义,一些新兴词语或难以解释的词语如何使用新rule存在分歧
2.执行可行性差,因为新rule普及难度高,使用后可能会给书写的标准化带来麻烦
3.审核条件更加严苛,谁也不是语言学专家,所以如果新rule执行后谁来审核
4.不利于搜索,新rule使用后原先分开的拼音连起来后更难搜索
5.规则只是大陆发表的,其他华人作品如何处理

我是支持新rule的,对于反对新rule的看法我有几点要说明:
1.歧义,对于歧义可以进行讨论,字是死的人是活的,可以活学活用
2.执行可行性问题,新rule是正确的规则,而旧rule是不规范的规则,我认为不应因成本问题而丧失正确的标准
4.不一定是不利于搜索,比如《小苹果》原来的书写方式是Xiao Ping Guo,新rule的规范应是Xiaopingguo,在osu!游戏中如果搜索”Xiaopingguo“是搜不到有关Xiao Ping Guo的有关信息的。而如果书写中写成Xiaopingguo在游戏中搜索”Xiao Ping Guo“是可以搜索到关于Xiaopingguo的有关信息的,而且搜索”Xiaopingguo“同样是有其相关信息的。至于网页中搜索,使用中文搜索也是足矣搜到。如果说是在网页中搜索更麻烦了,那么在游戏中是更容易搜到了。

1、3、5:集中表明一下态度,能否使用一种既不丧失规范又容易使用的方法?我的建议是title中规范用法,tag中可以添加旧rule的拼音,具体问题具体分析,不一定非得遵循某个rule的规则。如果说”这样改了和不改有什么区别?“的话,我的看法是规范的书写是必要的,新rule是有标准操作规范和一定科学的来源的,而这些是旧rule不具备的。
Pata-Mon
反对更改rules,简单列一些原因:

1、中文和日文有很大区别,中文会有大量的歌名在执行《中华人民共和国国家标准中文书刊名称汉语拼音拼写法》时可能会出现争议;
2、即使这些争议是能够找到标准答案的,这些争议也会对执行时有巨大影响;
3、而现行规则是最简单最行之有效,最不容易产生争议的,而这方面的小问题并不会影响osu的游戏性。

下举一些有可能导致争议的例子:

月亮之上
(“之上”是否应该分开?)

痛彻心扉
(成语全都写在一起?那么成语又如何划分?)

毁人不倦
(本来成语是“诲人不倦”,歌手把成语改了一个字作为歌名,应该如何处理?)

不潮不用花钱
(“不潮”、“不用”、“花钱”分别应该如何认定?)

我只是个传说
(“只是个”如何划分?)

青苹果乐园
(“青”和“苹果“是否需要分开?)

大侠艾吃汉堡包
(又是一个歌名中故意“错字”的例子。)

他夏了夏天
(“夏了”如何认定?)

山楂花 / 玫瑰花的葬礼
(“山楂”/“玫瑰”和“花”是否分开?桃花朵朵开呢?)

爱江山更爱美人
(“更爱”是否该分开?)

学不会
(如何划分?)

当冬夜渐暖
(“渐暖”是否应该分开?)


以上只是我随意从我的列表里看到的一些例子,很不全面,但已经足够说明可能产生的争议会有多少。
仅仅把我上面提出的例子全都回答一遍并不能让新规则的合理性变强,因为你需要保证的不只是这些争议都有唯一的正确答案,还有将来施行规则时,不会因为这些争议导致一些没有必要的麻烦。
而使用原规则,以上问题全都不会出现。


我比较懒,大概发完这篇就不会在来这里吵吵了 :)
Kinomi
小学语文,fine
等等,5.13,为何要加短横
ZZHBOY
要是不照你说的改会怎么样?改了又会怎么样?
MoeAsuka
反对,实在太复杂了
而且确实会有模糊的问题
反过来说,我并不知道“标准”的好处有什么
实行的话以后圈内估计要专门找个人帮忙确认metadata23333
Topic Starter
Lyric

ZZHBOY wrote:

要是不照你说的改会怎么样?改了又会怎么样?
改了会让中文更标准化,而且美观,正式的标准会让中文标题有一个中规中矩的模样。
不改一是不符合中文拼音的标准,二是让人觉得中文这种语言就是在单蹦音节,毫无章法。组词的拼写法也有助于人们快速理解整句的含义。
KaedekaShizuru
反对
首先请你说说现行的rule除了不符合那个规则外还有哪点不好
其次谁来解决执行后各种潜在的争议性问题? OK 如果你很得空我很乐意看到你来一条条为广大麻婆解决
为何说汉语博大精深 很多用语和单词中国人自己都搞不清楚的你指望麻婆圈子里各个都是国学大佬吗
haodumiao
好复杂 不如直接一个个的汉语拼音 搜索时也比较方便
Mafumafu
规则挺好的,不过。。。从哪里找有足够资质审核标题的人呢。
而且,这个规则只是大陆发表的,Official也只是PRC的Official,其他华人地区的作品怎么办?

标题是给人搜索的,按照这个规范写出来的标题太复杂了,对于不懂得这个规则的人来讲很不利于搜索。。。
Topic Starter
Lyric

KaedekaShizuru wrote:

反对
首先请你说说现行的rule除了不符合那什么狗屁规则外还有哪点不好
其次谁来解决执行后各种潜在的争议性问题? OK 如果你很得空我很乐意看到你来一条条为广大麻婆解决
为何说汉语博大精深 很多用语和单词中国人自己都搞不清楚的你指望麻婆圈子里各个都是国学大佬吗
争议性问题我认为在上面的十几条拼写规则里面已经充分解释清楚了,只是部分人没有认真去读。并且就连日语这种拼写式的语言也难免存在争议,所以单以这个理由就否定更标准化的建议我认为是不可取的。
Kosaka Honoka
部分支持,至少将多音节词汇连写的规则我觉得可以接纳,大家接受和使用起来比较方便,看起来也更加美观
Mafumafu
不过可以推荐把这种写法增加到tag里
Topic Starter
Lyric

haodumiao wrote:

好复杂 不如直接一个个的汉语拼音 搜索时也比较方便
与其图方便,还不如所有音节都连在一起搜索方便呢,那为啥还要一个空格一个空格来?
Xiao Ping Guo 和 Xiaopingguo 你觉得哪个方便?
Kosaka Honoka

Kosaka Honoka wrote:

部分支持,至少将多音节词汇连写的规则我觉得可以接纳,大家接受和使用起来比较方便,看起来也更加美观
好吧,我突然想起来搜索的时候也需要符合这种规则,那我不是很赞成这种规则,不同人有不同的断句方式,尤其出现在歌词里,断句的方式更是多种多样,而平日里大家又没有一个统一的实行方法,实行这样的规则会给大家的游戏带来极大的不便,所以我还是对此持保留意见。
Mafumafu

Lyric wrote:

haodumiao wrote:

好复杂 不如直接一个个的汉语拼音 搜索时也比较方便
与其图方便,还不如所有音节都连在一起搜索方便呢,那为啥还要一个空格一个空格来?
Xiao Ping Guo 和 Xiaopingguo 你觉得哪个方便?
有的时候忘记了歌名或者记错了歌名中的一部分字,写在一起的话就搜不到了,分开写还可以搜到
Sugiura Ayano
分成词组可以让标题的意义更明确,但是也会有一些难以确定的规范性问题

同时我想知道为何日文是以词组区分的而中文却是单字?
一个不懂中文不懂日文的人看标题结果区分的方法完全不一样,这他妈不就很尴尬了?
Kinomi

Kosaka Honoka wrote:

Kosaka Honoka wrote:

部分支持,至少将多音节词汇连写的规则我觉得可以接纳,大家接受和使用起来比较方便,看起来也更加美观
好吧,我突然想起来搜索的时候也需要符合这种规则,那我不是很赞成这种规则,不同人有不同的断句方式,尤其出现在歌词里,断句的方式更是多种多样,而平日里大家又没有一个统一的实行方法,实行这样的规则会给大家的游戏带来极大的不便,所以我还是对此持保留意见。
一个字一个字分开的写法可以加到tag里
Topic Starter
Lyric

Pata-Mon wrote:

反对更改rules,简单列一些原因:

1、中文和日文有很大区别,中文会有大量的歌名在执行《中华人民共和国国家标准中文书刊名称汉语拼音拼写法》时可能会出现争议;
2、即使这些争议是能够找到标准答案的,这些争议也会对执行时有巨大影响;
3、而现行规则是最简单最行之有效,最不容易产生争议的,而这方面的小问题并不会影响osu的游戏性。

下举一些有可能导致争议的例子:

月亮之上
(“之上”是否应该分开?)
Yueliang zhi Shang (5.5)
痛彻心扉
(成语全都写在一起?那么成语又如何划分?)
Tong Che Xinfei (5.3)规则里并没有说成语必须连写,请仔细阅读5.3。
毁人不倦
(本来成语是“诲人不倦”,歌手把成语改了一个字作为歌名,应该如何处理?)
Hui Ren Bujuan (5.1)不论是“毁”还是“诲”,都构成动宾短语,按5.1处理。
不潮不用花钱
(“不潮”、“不用”、“花钱”分别应该如何认定?)
Buchao Buyong Hua Qian (5.1)“不”是副词,“花”是动词。
我只是个传说
(“只是个”如何划分?)
Wo Zhishi Ge Chuanshuo (5.14)量词独立。
青苹果乐园
(“青”和“苹果“是否需要分开?)
Qingpingguo Leyuan (5.3)青苹果是一个独立的词语。
大侠艾吃汉堡包
(又是一个歌名中故意“错字”的例子。)
Daxia'ai Chi Hanbaobao 只管字面,不管双关。(“大侠艾”如果是个人)
他夏了夏天
(“夏了”如何认定?)
Ta Xiale Xiatian“了”是助词,夏是动词。
山楂花 / 玫瑰花的葬礼
(“山楂”/“玫瑰”和“花”是否分开?桃花朵朵开呢?)
Shanzhahua / Meiguihua de Zangli (5.3) 山楂花,玫瑰花都是整体概念。
Taohua Duo Duo Kai (5.14)注意量词。
爱江山更爱美人
(“更爱”是否该分开?)
Ai Jiangshan Geng'ai Meiren“更”是副词。
学不会
(如何划分?)
Xue Buhui“学”是动词,“不会”是个概念。不要说歧义,你只是习惯了没有歧义。
当冬夜渐暖
(“渐暖”是否应该分开?)
Dang Dongye Jiannuan“渐”是副词。

以上只是我随意从我的列表里看到的一些例子,很不全面,但已经足够说明可能产生的争议会有多少。
仅仅把我上面提出的例子全都回答一遍并不能让新规则的合理性变强,因为你需要保证的不只是这些争议都有唯一的正确答案,还有将来施行规则时,不会因为这些争议导致一些没有必要的麻烦。
而使用原规则,以上问题全都不会出现。


我比较懒,大概发完这篇就不会在来这里吵吵了 :)
不能因为新规则更加复杂和全面而因噎废食,新的规则提出了汉语是以词表意而不是以单字表意的精髓,可以说是一个质的飞跃。
你说的争议问题,一是,一天rank的图的标题争议量真的大到这么多人都讨论不完的情况了吗?二是,如果你真的理解了规则,到实施起来会存在什么争议呢?
Topic Starter
Lyric

Tsukuyomi wrote:

Kosaka Honoka wrote:

部分支持,至少将多音节词汇连写的规则我觉得可以接纳,大家接受和使用起来比较方便,看起来也更加美观
好吧,我突然想起来搜索的时候也需要符合这种规则,那我不是很赞成这种规则,不同人有不同的断句方式,尤其出现在歌词里,断句的方式更是多种多样,而平日里大家又没有一个统一的实行方法,实行这样的规则会给大家的游戏带来极大的不便,所以我还是对此持保留意见。

一个字一个字分开的写法可以加到tag里

Regraz wrote:

规则挺好的,不过。。。从哪里找有足够资质审核标题的人呢。
而且,这个规则只是大陆发表的,Official也只是PRC的Official,其他华人地区的作品怎么办?

标题是给人搜索的,按照这个规范写出来的标题太复杂了,对于不懂得这个规则的人来讲很不利于搜索。。。
我支持另起TAG的做法。
show more
Please sign in to reply.

New reply