CONTRIBUTION AGREEMENT

方言语料贡献协议

诗韵中心 · 方言语料库 | 草案 v0.1(正式发布前请执业律师审阅)

欢迎参与方言语料库建设。本协议告诉您:我们采集什么、用来做什么、您拥有哪些权利。请逐项阅读并自行勾选——任何一项都不会默认勾选,不勾选任何一项也不影响您使用诗韵中心的其他功能。

一、我们采集什么

我们不采集:您的真实姓名与录音的绑定关系(账号信息与录音文件分离存储)、录音中出现的第三人声音(请勿上传含他人对话的音频,此类内容将被删除)。

二、授权勾选项(核心条款)

重要提示:您的声音属于生物识别信息(敏感个人信息)。以下每一项均需您单独、明确同意。

☐ A. 语料库收录(基础项)

我同意诗韵中心采集、存储我录制的方言语音及转写文本,用于方言语料库的建设、整理与学术研究。

☐ B. 模型训练

我同意我的语料用于训练语音识别(ASR)、语音合成(TTS)及相关方言人工智能模型,包括其后续改进版本。训练所得模型不会标注我的身份。

☐ C. 匿名公开数据集(可选)

我同意我的语料经匿名化处理后,加入公开发布的方言语料数据集(采用开放许可,供全球研究者使用),为方言保护留下公共财富。

未勾选 B 项的语料只存档不训练;未勾选 C 项的语料永不公开。

三、声音克隆专项授权(独立签署)

若您希望平台复刻特定人的嗓音(如为家中长辈定制方言语音),须由被复刻者本人另行签署《声音克隆授权书》。依据《互联网信息服务深度合成管理规定》,克隆语音生成的音频将附加显著的合成标识。本协议的 A/B/C 项不构成声音克隆授权。

四、您的权利

  1. 随时撤回:您可随时撤回任一项授权。撤回后,我们在 30 日内删除您的原始录音与转写;已训练完成的模型不受追溯影响(这是撤回的技术边界,特此如实告知)。
  2. 查询与导出:您可随时查询、下载自己贡献的全部语料。
  3. 删除:注销账号即触发全部语料删除(已进入 C 项公开数据集的匿名副本除外,因其已不含可识别信息)。

五、存储与安全

语料存储于 Cloudflare R2 私有存储桶(境外云服务商,存储桶不对公网开放,访问需密钥且留痕);账号身份与录音文件分离保存(录音仅以随机编号标识);仅语料库管理人员可接触原始录音;不向任何第三方出售或提供您的语料。由于存储服务商位于境外,境内贡献者的录音将跨境传输至境外存储,采集页面会明确提示并以您的单独同意为合法性基础。

六、未成年人

未满 18 周岁者参与贡献,须由监护人代为勾选并同意。

七、其他

签署方式:网页端逐项勾选 + 点击「同意并开始录音」,系统留存勾选时间戳与协议版本号。

← 返回语料库   隐私政策 →