贡献准则

了解如何向 Yue Voice 数据集贡献及验证语句和录音片段

不同发音

我们所寻求的不是同质化!在以粤语录音为营销课,将重音较在语调方面或语音显著不同的贡献者参与进来, 请谨慎行事。世界各地有各种各样发音,其中一些可能在您的地区并不常见,请为此类可能与您习惯的人, 下次录音的问题。

另一方面,如果您认为朗读者的朗读从未通过这个问题,只要在朗读时明了一个错误的发音,那么情况就错误。如果 您不确定,请点击"跳过"。

示例

路线还不清楚。
路线还不清楚。[评语人对粤语发音"gm"]
路线还不清楚。
路线还不清楚。[评语人对粤语发音"ov"]

冒犯性内容

请勿含有过于社区进行审核,不过出现过无法确保的方式一失。如果您看到明显的到令您感到不快的内容(例如完整提及反 了解的时间区域与情况),请务必使用举报中的"举报"按钮举报来,您也可以通过 commonvoice@mozilla.com 来 联系我们。

误读

完整朗读文字内容十分重要。在听听录音片段时,请注意录音内容是否与文字内容完全一致。如有漏字、漏字、间 将其跳过。

常见的错误有:

  • 录音开头有"嗯""啊"等附加音。
  • 错读了某些词语,例如"美女"误读成"美上"。
  • 错读了某些字,例如将"读音"读成"读音"或"读音注意事项",反之亦然。
  • 由于过长的停顿来录音没有音频人员在一个句。
  • 朗读个人朗读时多次停顿。

示例

我们要出去买咖啡。
我们要出去买咖啡。
我们要出去买咖啡。
嗯,我们要出去买咖啡。(录音开头有"嗯")
我们要出去买咖啡。
我们要出去买茶。(错读了"咖啡"为"茶")

背景噪音

一定程度的噪音是可以接受的,但如果您听到朗读者中还有其他人在说话,则应该拒绝该音频。这种情况应该在另 边开着电视,或附近有其他人在交谈时发生。

示例

三叠纪的巨型恐龙。
三叠纪的巨型恐龙。
三叠纪的巨型恐龙。
三叠纪的巨型恐龙。[音乐声](背景有音乐)
三叠纪的巨型恐龙。
三叠纪的巨型恐龙。[车声](背景有车辆噪音)
三叠纪的巨型恐龙。
三叠纪的巨型恐龙。[电视声](背景有电视声音)

背景人声

一定程度的噪音是可以接受的,但如果您听到朗读者中还有其他人在说话,则应该拒绝该音频。这种情况应该在另 边开着电视,或附近有其他人在交谈时发生。

示例

三叠纪的巨型恐龙。
三叠纪的巨型恐龙。[朗读者自己的声音](你过了吗?1分钟人在说话)

音量

朗读者之间的音量大小会有自然差异。只当音量大或小到手录音中断,或(更常见的情况)音量大小以至于不参考 书面文字您无法听清不当正在说的内容时,才跳过。

朗读者因素

大多数录音都是人们自由朗读的语音,但您可以偶尔接受非常缓慢,即大幅大叫、低声或语调明显用明显"机械朗 读"的音频语音。请跳过明显机械的音频朗读或明显使用计算机成的声音。

仍有不解之处?

如果遇到了这些准则没有涵盖的内容,请根据您认为的朗读质量来决定。如果您的无法决定,请使用跳过按钮,继 续到下一段录音。