银行数据仓库大模型应用

在安全与隐私保护，如何考虑大模型与数据仓库结合过程中的数据安全和隐私保护？

大模式如何与原有架构（如数据湖、湖仓一体、数据仓库）相结合，成为了企业架构中需要考虑的问题。企业需要对现有的数据架构进行全面的评估，了解其功能、数据处理能力、存储容量、查询性能等，有助于确定大模型与原有架构结合的方式和可行性。企业还需定义统一的集成接口标准，使大...显示全部

关注4

参与13

查看其它 2 个回答catalinaspring的回答

catalinaspring

副处长金融

几乎所有在线服务都在收集我们的个人数据，并可能将这些数据用于训练 LLM 。然而，模型会如何使用这些用于训练的数据则是难以确定的。如果在模型的训练中使用了诸如地理位置、健康记录、身份信息等敏感数据，那么针对模型中隐私数据的提取攻击（ Data extraction attack ）将会造成大量的用户隐私泄漏。「 Are Large Pre-Trained Language Models Leaking Your Personal Information? 」一文中证明，由于 LLM 对于训练数据的记忆， LLM 在对话过程中确实存在泄露个人信息的风险，且其风险随着示例数量的增加而增加。
模型泄漏信息的原因有多种。其中一些是结构性的，与构建模型的方式有关；而另一些是由于泛化能力差、对敏感数据的记忆等因素造成的。
可以考虑通过在数据的存储和传输环节引入加密算法进行处理，并加强访问控制，同时，建立有效的审计机制。

银行 · 2024-01-11

查看赞同的人

在安全与隐私保护，如何考虑大模型与数据仓库结合过程中的数据安全和隐私保护？

查看其它 2 个回答catalinaspring的回答

回答者

catalinaspring 最近回答过的问题

回答状态