10月8日,上海财经大学信息管理与工程学院韩潇教授做了题为“面向智能管理决策的负责任数据共享”的学术讲座。此次讲座由马宝君教授主持,吸引了多名教师、硕博研究生及本科生参加。
韩潇,研究兴趣包括数据挖掘、数据安全、机器学习、隐私计算等,在MIS Quarterly, Informs Journal on Computing, IEEE Transaction on Dependable and Secure Computing, World Wide Web Conference等国际知名期刊及会议发表论文30余篇,指导学生获第八届IEEE网络空间数据科学国际会议杰出学生论文奖。Google学术统计引用共1000 余次。主持国家自然科学基金项目2 项,国家语委重点项目1 项;参与国家自然科学基金重点项目1项。其中已结项的国家自科青年基金获基金委管理学部后评估特优评价。获上海市青年五四奖章、上海市科技进步奖二等奖等荣誉。任管理科学与工程学会人工智能与管理应用分会委员,上海开源信息技术协会大数据专委会副主任。
主讲嘉宾韩潇老师由数据驱动的智能决策和数据共享两个方面引入主题。数据驱动的智能管理决策即在数据的驱动下,建立关键模型,形成管理应用进而进行智能决策。在数据共享的方面,韩潇老师介绍了数据共享的效用和风险两个方面,进而由数据共享的风险转入了本场讲座的主题——负责任数据共享。
首先,韩老师介绍了负责任数据共享的对象、内容、两大类型途径以及常见技术方案和挑战,进而分析了负责任数据共享的三个具体场景中所面临的问题以及应对具体问题的方法途径。
韩老师主要介绍了第一个场景——个体用户向平台脱敏开放非隐私敏感信息,主要分两个方面进行了讲解,分别是隐私风险评估和隐私风险控制。在传统风险度量的过程中,依赖的是用户的主观感知和有限的客观指标,无法区分个体风险差异,而我们的目标是面向个体用户的个性化度量。
由此提出了第一个问题:可否训练一个机器去学习风险评估模型,以推测隐私信息被正确推测的概率?换言之,当前所面临的挑战在于如何对攻击者建模,从而获取风险值标签。在研究分析的过程中有两个发现:其一是对个体用户而言,其发布非敏感信息多,不一定有更高的隐私数据泄露威胁;其二是对不同地区、不同属性的集体用户而言,发布非敏感信息多,不一定有更高的隐私数据泄露威胁。第二个问题是:删除/隐藏某些已经开放的数据能否有效降低风险?隐藏哪些更有效?对于以上两个问题,韩老师都进行了基于数据分析结果上的深度讲解。
对于第二个场景——平台或企业脱敏开放群体批量非敏感数据,韩老师应对这一过程中的三个核心挑战,即可开放的非敏感数据异构、需保护的隐私数据多型以及脱敏操作多样,经过实验验证提出了应对方法,即通过PPEN获得更好的隐私-效用权衡,从而发布网络图非敏感结构数据,以保护其中隐私边信息,并最大化数据效用。
同学们在讲座中也积极踊跃发言,针对同学们和马老师的提问,韩老师都给予了详细解答。讲座最后,马老师总结了本次讲座,并对韩老师表示感谢,此次讲座圆满结束。