huangxj

黄萱菁 (复旦大学 教授)

黄萱菁 (Xuanjing Huang),复旦大学计算机科学技术学院教授、博士生导师。1998年于复旦大学获计算机理学博士学位,研究领域为自然语言处理和信息检索。至今在SIGIR、ACL、ICML、IJCAI、AAAI、NIPS、CIKM、ISWC、EMNLP、WSDM和COLING等多个国际学术会议上发表了数十篇论文。曾任2004年第一届全国信息检索和内容安全学术会议 (CCIR) 程序委员会主席,2004年自然语言处理青年学者研讨会 (YSSNLP) 总召集人,2009年亚洲语义网学术会议 (ASWC) 组织委员会主席,2010年国际计算语言学学术会议 (COLING) tutorial主席,2014年CIKM会议竞赛主席,2015年WSDM会议组织者,2015年全国社会媒体处理大会程序委员会主席,2016年全国计算语言学会议程序委员会副主席,2017年自然语言处理与中文计算国际会议程序委员会主席。并多次在人工智能、自然语言处理和信息检索的国际学术会议IJCAI、ACL、SIGIR、WWW、EMNLP、COLING、CIKM、WSDM担任程序委员会委员和资深委员。兼任中国中文信息学会常务理事,社会媒体专委会副主任,中国计算机学会中文信息处理专委会委员,中国人工智能学会自然语言理解专委会委员,ACM和ACL会员,《中文信息学报》编委,国家自然科学基金、教育部高校博士点基金和863计划同行评议专家。

报告题目: 基于深度学习的文本生成

报告时间: 09:15—10:00

报告摘要:

自然语言处理包括自然语言理解和自然语言生成两个领域。但是长期以来,对自然语言处理的研究主要集中在自然语言理解领域,自然语言生成研究相对较少。随着深度学习方法,特别是序列到序列模型、深度产生式模型的提出,自然语言生成的研究取得了飞速发展,研究成果用于自动问答、自动文摘、机器翻译等任务,甚至还出现了自动写作、自动代码生成、视觉字幕生成、视觉问答等新的应用。在介绍文本生成的主流方法之后,本报告将介绍复旦大学自然语言处理团队近期在文本生成方面的初步探索,包括利用结合判别式模型的吉布斯采样进行受限文本生成、利用逆强化学习进行多样化文本生成、问题类型驱动的多样化视觉问题生成、基于强化学习框架的问题生成等。

陈华钧 (浙江大学 教授)

陈华钧,浙江大学计算机科学与技术学院教授、博士生导师。主要研究方向为语义网与知识图谱、大数据分析、生物医学信息等。OpenKG发起人,浙江省大数据智能计算重点实验室副主任、中国中文信息学会语言与知识计算专业委员会副主任、中国人工智能学会知识工程与分布智能专业委会副主任等。在IJCAI、WWW、AAAI/IAAI、ICDE、TKDE、Briefings in Bioinformatics等国际顶级会议或期刊上发表多篇论文,并曾获国际语义互联网会议ISWC最佳论文奖。作为主要参与者,获得教育部技术发明一等奖、国家科技进步二等奖等奖励。

报告题目:领域知识图谱的构建及应用

报告时间:13:30—14:15

报告摘要:

领域知识图谱是相对于通用知识图谱 (如DBpedia、YAGO、Wikidata等) 而言,面向特定领域的知识图谱,如电商、金融、医疗等。相比较而言,领域知识图谱知识来源更多、规模化扩展要求更迅速、知识结构更加复杂、知识质量要求更高、知识的应用形式也更加广泛。此外在真实的领域数据场景下,很多学界研究的模型和方法不具有实用性和适应性。而不同领域数据特点不一,较难找到适合所有领域的知识图谱通用构建和应用方法。本报告结合电商、金融等领域的具体实践,分析了相关模型及方法的可用性和局限性问题,并深入探讨领域知识图谱构建所面临一系列难题和技术挑战。

chenhj
xiaoyh

肖仰华 (复旦大学 教授)

肖仰华,博士、复旦大学教授、博士生导师、复旦大学知识工场实验室创始人、上海市互联网大数据工程技术中心副主任、多家规模企业高级顾问与首席科学家、知识图谱前沿技术系列课程发起人、十多个国家/省市/企业研究奖项获得者、三十多个国家/省市/企业研发项目负责人。在国际顶级学术会议与期刊 (包括SIGMOD、VLDB、ICDE、IJCAI、AAAI、TKDE等) 发表论文百余篇,授权近20项知识图谱专利。百余次担任国际/国内学术机构/会议的学术服务工作。领导构建了知识库云服务平台 (知识工场平台),发布了一系列知识图谱,以API形式为数百家应用单位服务8亿多次。

报告题目:基于知识图谱的问答系统关键技术

报告时间:14:15—15:00

报告摘要:

近年来,大量知识图谱涌现,为各类问答系统提供了质量精良的数据来源。面向知识图谱的问答已经成为知识问答的一种主流形式,成为了问答系统的核心模块之一。但是,自然语言描述与语知识库描述的巨大差异,仍然为面向知识图谱的问答提出了巨大的挑战。为了应对这些挑战,复旦大学知识工场实验室先后研发了基于CN-DBpedia的MentionToEntity模型与实体链接模型、提出了基于概念模版的问题语义表示方式、以及相应的可解释的基于概率图模型的问答模型,提出了一系列基于深度学习的端到端知识问答模型,并将这些模型应用于复旦大学知识工场实验室的问答系统:小CUI问答,并且对外开放了相关知识问答API。本报告将介绍知识工场实验室在基于知识图谱问答系统方面的上述关键技术。

王昊奋 (CCF术语工委 主任)

王昊奋,知识图谱专家,博士毕业于上海交通大学,中文知识图谱zhishi.me创始人、OpenKG联盟发起人之一、CCF术语审定工委主任、CCF理事、中文信息学会语言与知识计算委员会副秘书长,共发表75余篇高水平论文。其带队构建的语义搜索系统在Billion Triples Challenge中荣获全球第2名;在著名的本体匹配竞赛OAEI的实体匹配任务中斩获得全球第1名。曾主持并参与多项国家自然科学基金、863重大专项和国家科技支撑项目,以学术负责人身份参与Paypal、Google、Intel、IBM、百度等企业的合作项目。

报告题目:从人工智能到开放知识图谱

报告时间:10:15—11:00

报告摘要:

人工智能经历了起起落落若干次浪潮,目前正在第三次浪潮的浪尖,而这次的主角不仅有深度学习,也少不了知识图谱。在这次报告中,将围绕知识图谱的前身今世,介绍知识图谱的历史和起源,知识图谱在搜索、问答、聊天机器人、阅读理解、辅助决策等方面的前沿应用,以及支撑这些智能应用的核心技术。接着,将系统地介绍OpenKG,尤其是OpenKG在百科知识发布与链接、开放知识图谱的schema,以及知识图谱开源工具方面的各项工作。

wanghf
huw

胡伟 (南京大学 副教授)

胡伟,博士、南京大学计算机科学与技术系副教授。主要研究方向为数据集成、知识图谱、Web应用。2005年、2009年分别于东南大学计算机科学与工程学院获学士、博士学位。2009年底加入南京大学工作。2007年11月至2008年5月赴荷兰阿姆斯特丹自由大学联合培养,2014年9月至2015年9月赴美国斯坦福大学访学,2016年11月至2017年5月赴美国德州大学阿灵顿分校访学,2017年6月至2017年11月赴加拿大多伦多大学访学。主持国家自然科学基金面上/青年项目、教育部博士点基金、江苏省自然科学基金等项目。在WWW、SIGIR、AAAI、IJCAI、ISWC等高水平国际会议和期刊上发表多篇论文,他引超千次,还获得过JIST最佳论文奖、ISWC最佳论文提名。担任中文信息学会语言与知识计算专委会委员、计算机学会数据库专委会通讯委员、江苏省大数据专委会委员、江苏省人工智能学会知识工程与服务计算专委会委员、万维网联盟W3C南京大学学术代表,以及International Journal of Big Data Intelligence期刊编委。

报告题目:知识图谱实体链接技术

报告时间:11:00—11:45

报告摘要:

实体链接旨在发现指称真实世界中相同对象的不同实体,它是知识图谱等研究中的一个核心问题,对于实现知识之网具有重要意义。近年来,知识图谱领域的研究人员逐渐意识到现有的全自动链接方法难以取得令人满意的效果,人的参与不可或缺。本报告将首先简要介绍知识图谱和实体链接,然后介绍报告人最近的两个工作,分别研究了实体链接的任务设计和用户专长的主题建模问题,最后探讨未来可能的研究方向。

刘璟 (百度公司 高级研究员)

刘璟,百度自然语言处理部资深研发工程师。2014年于哈尔滨工业大学获得博士学位。长期从事自然语言处理方向的研究和应用工作,主要研究兴趣包括自动问答、信息抽取和社交网络。曾于2014年至2017年在微软亚洲研究院任研究员。2017年12月加入百度后,主要负责研发建设百度阅读理解技术,支持公司问答相关产品。至今在SIGIR、ACL、EMNLP、WSDM和CIKM等多个国际学术会议上发表论文十余篇,6项专利获得授权或者受理中。并多次在自然语言处理方向的国际学术会议ACL、EMNLP、NAACL、EACL等担任程序委员会委员,任中国中文信息学会社会媒体专委会委员。

报告题目:百度问答技术和应用

报告时间:15:00—15:45

报告摘要:

近些年来,各种智能设备,如智能手机、智能音响等迅速普及。这些设备具有小屏化或无屏化的特点,在这些设备上,用户需要能够精准满足其信息需求的问答技术。传统的检索式问答技术,主要关注段落排序。仍难以完成精准问答的“最后一公里”,即段落中的精准答案定位。近两年,随着各种大规模阅读理解数据集的出现,基于神经网络的阅读理解技术取得了较大进展。这为精准答案定位提供了有利的技术支持。本报告将首先介绍学术界阅读理解技术的发展。然后详细介绍百度的中文阅读理解数据集DuReader,以及多文档阅读理解技术VNET,并介绍其在百度问答中的应用。

liuj