我院博士生印闯获全国数据挖掘竞赛大奖
2017年秋季学期,我院二年级博士生印闯赴香港城市大学互联网挖掘实验室参加上海交大与城大联合博士培养项目。在城大祝建华讲座教授指导下,以印闯为队长,城大媒体数据挖掘专业硕士研究生沈安琪和段泽宁为队员的团队,参加了10月份开始,由中国计算机学会举办的第五届大数据与计算智能大赛(CCF-BDCI 2017)。大赛采用的12道赛题由蚂蚁金服、360搜索、零点等领军企业发布,题目涉及语义识别、舆情监测、图像识别、金融风控等多个热门方向,并采用AB双集共同测试模式,每个赛题中成果突出的团队按照最后的成绩榜单排名,前五名进入决赛,通过决赛答辩评选唯一获胜队伍,颁布各赛题组别的一等奖。此外,12支获得一等奖的团队再被推选参加CCF设置的四大奖项(综合特等奖、最佳创新探索奖、最佳商业价值奖、最佳算法能力奖)的最终竞逐。本届比赛吸引国内外及港澳台挖掘6675支,参赛队伍来自495家企业、450所高校,参赛人数达14,991人,竞争十分激烈。
团队合影
获奖奖杯
以“中印洞朗对峙事件中的网络舆情分析”为题,印闯等人采集了数十万推特文本、英文新闻和中文新闻数据,参考传播学理论模型,采用word embedding,sentiment analysis和topic modeling等挖掘技术,展示了中印两国以及第三方国家对于对峙事件看法的动态演化过程,也分析了国内部分主流媒体在进行海外传播时存在的一些策略性错误。大赛历时三个月,在12月于江苏常熟举办的决赛中,互联网挖掘实验室团队荣获三项大奖,包括分组赛第一名、总决赛最佳创新探索奖,优秀指导老师奖,以及奖金4.5万元。
获奖证书
大赛组委会主席崔斌教授说,这是第一次社会科学背景的团队在该全国最大规模的赛事中获得如上奖项。祝建华教授总结胜出原因时指出,“算法是入场券,很重要;数据是故事,更重要;理论是灵魂,最重要。