CONTRIBUTION AGREEMENT
方言语料贡献协议
诗韵中心 · 方言语料库 | 草案 v0.1(正式发布前请执业律师审阅)
欢迎参与方言语料库建设。本协议告诉您:我们采集什么、用来做什么、您拥有哪些权利。请逐项阅读并自行勾选——任何一项都不会默认勾选,不勾选任何一项也不影响您使用诗韵中心的其他功能。
一、我们采集什么
- 您朗读指定文本或自由讲述时的语音录音(儋州话、海南话等方言);
- 录音对应的文字转写(您或校对志愿者标注的内容);
- 可选的语言背景信息:方言片区、年龄段、性别(用于语料平衡,均为区间选项,不采集精确值)。
我们不采集:您的真实姓名与录音的绑定关系(账号信息与录音文件分离存储)、录音中出现的第三人声音(请勿上传含他人对话的音频,此类内容将被删除)。
二、授权勾选项(核心条款)
☐ A. 语料库收录(基础项)
我同意诗韵中心采集、存储我录制的方言语音及转写文本,用于方言语料库的建设、整理与学术研究。
☐ B. 模型训练
我同意我的语料用于训练语音识别(ASR)、语音合成(TTS)及相关方言人工智能模型,包括其后续改进版本。训练所得模型不会标注我的身份。
☐ C. 匿名公开数据集(可选)
我同意我的语料经匿名化处理后,加入公开发布的方言语料数据集(采用开放许可,供全球研究者使用),为方言保护留下公共财富。
未勾选 B 项的语料只存档不训练;未勾选 C 项的语料永不公开。
三、声音克隆专项授权(独立签署)
若您希望平台复刻特定人的嗓音(如为家中长辈定制方言语音),须由被复刻者本人另行签署《声音克隆授权书》。依据《互联网信息服务深度合成管理规定》,克隆语音生成的音频将附加显著的合成标识。本协议的 A/B/C 项不构成声音克隆授权。
四、您的权利
- 随时撤回:您可随时撤回任一项授权。撤回后,我们在 30 日内删除您的原始录音与转写;已训练完成的模型不受追溯影响(这是撤回的技术边界,特此如实告知)。
- 查询与导出:您可随时查询、下载自己贡献的全部语料。
- 删除:注销账号即触发全部语料删除(已进入 C 项公开数据集的匿名副本除外,因其已不含可识别信息)。
五、存储与安全
语料存储于 Cloudflare R2 私有存储桶(境外云服务商,存储桶不对公网开放,访问需密钥且留痕);账号身份与录音文件分离保存(录音仅以随机编号标识);仅语料库管理人员可接触原始录音;不向任何第三方出售或提供您的语料。由于存储服务商位于境外,境内贡献者的录音将跨境传输至境外存储,采集页面会明确提示并以您的单独同意为合法性基础。
六、未成年人
未满 18 周岁者参与贡献,须由监护人代为勾选并同意。
七、其他
- 语料贡献为自愿公益行为,不构成雇佣或委托关系;如设贡献者致谢或纪念品,与授权范围无关。
- 本协议适用中华人民共和国法律中关于个人信息保护的规定;如您位于其他法域,我们同时按当地生物识别信息法律的书面同意标准执行本协议。
- 协议如有修订,将提前通知,重大变更须重新取得您的勾选同意。
签署方式:网页端逐项勾选 + 点击「同意并开始录音」,系统留存勾选时间戳与协议版本号。