09:00—09:10 | 开幕式 | |
Session 1 主持人:李斌 扬州大学教授 |
||
09:10—09:50 | 赵东岩 北京大学研究员 | 文本大数据分析及其智能应用 |
09:50—10:30 | 漆桂林 东南大学教授 | 基于行业知识图谱的问答技术和思考 |
10:30—10:50 | 茶歇 | |
Session 2 主持人:胡伟 南京大学副教授 |
||
10:50—11:30 | 黄萱菁 复旦大学教授 | 深度语言表示学习及应用 |
11:30—12:10 | 程龚 南京大学副教授 | 面向高考地理自动答题的知识工程实践 |
12:10—14:00 | 午餐 | |
Session 3 主持人:瞿裕忠 南京大学教授 |
||
14:00—14:40 | 钱宇华 山西大学教授 | 消除学习过程中的随机一致性 |
14:40—15:30 | 陈恩红 中国科学技术大学教授 | 教育大数据的机器学习与知识发现方法 |
15:30—16:10 | 于佃海 百度公司主任架构师 | 百度知识图谱技术和应用 |
报告题目: 文本大数据分析及其智能应用赵东岩 北京大学研究员 |
文本是人类记录和传播知识与信息的重要载体。在大数据时代,如何对大规模文本进行语义分析和理解是自然语言处理及人工智能领域的一个前沿课题,众多国际一流研究机构和IT企业投入大量资源进行相关研究与开发工作。本次报告将系统阐述文本大数据分析的研究路线、核心问题及讲者的研究实践,并结合工业界需求,介绍相关技术在人工智能领域的应用。
赵东岩,北京大学计算机科学技术研究所研究员,博士生导师。主要研究方向为自然语言处理、大规模语义数据管理、知识服务技术。近年来承担国家级项目15项、主持7项,发表学术论文100余篇(包括AAAI、ACL、SIGMOD、VLDB、VLDB Journal、TKDE等顶级会议和期刊),授权发明专利15项、申请10项,先后五次获得国家和省部级奖励。个人获第十届中国青年科技奖(2007年)和北京市第七届“科技之光”技术创新特别奖等荣誉。计算机学会(CCF)高级会员,CCF中文信息技术专委会秘书长、CCF大数据专家委员会委员、CCF网络与数据通信专委会委员。
报告题目: 基于行业知识图谱的智能问答技术与思考漆桂林 东南大学教授 |
在本次报告中,我将介绍一套行业知识图谱的构建方法,以及基于行业知识图谱的智能问答技术。首先介绍佛学和农学知识图谱构建技术;然后介绍佛学考试机器人和农业智能问答技术;最后,给出行业知识图谱构建和问答机器人产业化的一些思考。
漆桂林教授是中国中文信息学会语言与知识计算专业委员会副主任和中国科学技术情报学会知识组织专业委员会副主任。是开放知识图谱联盟openKG的联合创始人之一。是新华社中国经济信息社特约专家。是语义Web著名国际期刊Journal of Web Semantics的编委。曾任中国语义Web和Web科学大会主席、国际会议JIST程序委员会主席。指导学生在国际会议ICTAI获得最佳学生论文奖。发表高水平学术论文100余篇,出版专著一部。6项专利获得授权或者受理。先后承担包括国家自然科学基金和欧洲第七框架项目Marie Curie IRSES在内的多项科研项目,并且承担了华为、百度等企业项目,作为第二负责人参与了由科大讯飞牵头的863课题“高考机器人”的一个子课题。在知识工程、大数据语义分析、知识图谱等领域有将近20年的研究和产业化经验。
报告题目: 深度语言表示学习及应用黄萱菁 复旦大学教授 |
近年来,深度学习技术广泛应用于自然语言处理,在许多任务中取得了超越传统统计方法的性能,其基础则为深度表示学习。本次报告将介绍深度表示学习的研究现状,复旦大学自然语言处理团队在词语、短语、句子和句对表示学习方面的近期研究工作进展,表示学习在中文分词、文本分类、语篇关系分析等下游任务的应用,并对深度表示模型的可解释性进行初步探讨。
黄萱菁(Xuanjing Huang),复旦大学计算机科学技术学院教授、博士生导师。1998年于复旦大学获计算机理学博士学位,研究领域为自然语言处理和信息检索。 至今在SIGIR,ACL,ICML,IJCAI,AAAI,NIPS,CIKM,ISWC,EMNLP,WSDM和COLING等多个国际学术会议上发表了数十篇论文。曾任2004年第一届全国信息检索和内容安全学术会议(CCIR)程序委员会主席,2004年自然语言处理青年学者研讨会(YSSNLP)总召集人,2009年亚洲语义网学术会议(ASWC)组织委员会主席,2010年国际计算语言学学术会议(COLING)tutorial主席,2014年CIKM会议竞赛主席,2015年WSDM会议组织者,2015年全国社会媒体处理大会程序委员会主席,2016年全国计算语言学会议程序委员会副主席,2017年自然语言处理与中文计算国际会议程序委员会主席。并多次在人工智能、自然语言处理和信息检索的国际学术会议IJCAI,ACL,SIGIR,WWW,EMNLP,COLING,CIKM,WSDM担任程序委员会委员和资深委员。 兼任中国中文信息学会常务理事,社会媒体专委会副主任,中国计算机学会中文信息处理专委会委员,中国人工智能学会自然语言理解专委会委员,ACM和ACL会员,《中文信息学报》编委,国家自然科学基金、教育部高校博士点基金和863计划同行评议专家。
报告题目: 面向高考地理自动答题的知识工程实践程龚 南京大学副教授 |
自动解答高考试题,是人工智能新近面临的一项重大挑战,其研究成果有助于计算机在辅助教学等应用场景中发挥更好的效用。本报告围绕自动解答高考地理试题,将简要分析其面临的各类技术挑战,特别是在知识工程方面遇到的困难。然后,介绍我们在这个问题上做的一些尝试,包括一种基于知识图谱的解题方法。
程龚,1984年生,分别于2006年和2010年从东南大学获得计算机科学与技术专业学士学位和计算机软件与理论专业博士学位,曾于2009年前往德国卡尔斯鲁厄理工学院开展访问研究。2011年进入南京大学工作,2015年被聘任为副教授,2017年入选江苏高校“青蓝工程”优秀青年骨干教师和江苏省第十四批“六大人才高峰”高层次人才。目前主要研究智能软件技术,研究主题包括语义搜索、数据摘要、自动问答等。主持承担多项国家自然科学基金、江苏省基础研究计划等科研项目。在TKDE、WWW、IJCAI、ISWC等重要国际学术期刊会议上发表论文30余篇,2011年和2014年两次获得ISWC最佳论文提名奖,论文总引用1600余次。现任江苏省人工智能学会知识工程与智能服务专业委员会副秘书长、中国计算机学会系统软件专业委员会委员、中国中文信息学会语言与知识计算专业委员会委员、中国计算机学会大数据专家委员会通讯委员,曾担任JIST会议导课主席、CCKS会议领域主席等职务,长期担任WWW、ISWC等重要国际学术会议程序委员,发起并组织了国际研讨会SumPre。
报告题目: 消除人类学习过程中的随机一致性钱宇华 山西大学教授 |
在人类自身的学习过程中,对学习结果进行科学客观的评价与反馈是其关键环节。然而,由于学习者的知识缺陷或数据中的噪音干扰使得学习结果可能存在随机一致性,这样的反馈将严重影响学习效能的提升。同样,在人类设计的机器学习中也普遍存在学习结果的随机一致性,也将会影响所设计的学习系统的泛化能力的提升。为此,如何消除人类学习过程中的随机一致性成为了人工智能的一个重要科学问题。本报告重点汇报近年来我们针对该问题进行的一些尝试性探索,以期引起人工智能领域研究的一些学术思考。
钱宇华,博士,教授、博士生导师,山西大学大数据科学与产业研究院负责人。从事人工智能、大数据、复杂网络、数据挖掘与机器学习等方面的研究。国家优秀青年基金获得者,青年三晋学者,山西省中青年拔尖创新人才,教育部新世纪人才,山西省青年学术带头人。中国人工智能学会粗糙集与软计算专委会副主任,中国计算机学会人工智能与模式识别专业委员会委员,中国人工智能学会知识工程与分布智能专委会委员,中国人工智能学会机器学习专委会委员。 近年来,先后在《Artificial Intelligence》、《IEEE Transactions on Neural Networks and Learning Systems》、《IEEE Transactions on Knowledge and Data Engineering》、《IEEE Transactions on Fuzzy Systems》、《IEEE Transactions on Systems, Man and Cybernetics》、《Pattern Recognition》、《中国科学》等国际重要学术期刊发表SCI论文80余篇,获发明专利2 项。2014- 2016年,连续入选爱思唯尔中国高被引学者榜单。曾获得山西省科学技术奖(自然科学类)一等奖,教育部宝钢教育基金特等奖,CCF 优秀博士论文奖,山西省“五四青年奖章”,全国百篇优秀博士论文提名奖。
报告题目: 教育大数据的机器学习与知识发现方法陈恩红 中国科学技术大学教授 |
随着教育信息化进程的深入,在线教育系统为学生用户提供了海量优质的教育资源,从中挖掘出有意义的知识是一个重要的工作,它是各类基于资源的个性化服务的基础。然而,现有的方法很难对海量、高躁的教育资源数据进行表征建模,且难以构建其知识结构关联中所蕴含的丰富语义信息。据此,为了同时保证精准性和可解释性的需求,我们结合教育学领域知识,设计了针对教育资源的深度语义理解框架。首先,基于不同情景信息,我们提出了一种局部资源文本语义关系推断模型。进一步,融合了试题文本的结构特点,我们提出一种基于注意力机制的试题表征模型,能够量化不同数据资源的重要性。所提出的方法能够精准预测教育数据资源的上下文语义联系和试题难度。研究成果发表在人工智能顶级学术会议AAAI中。且试题难度预测研究已被应用于讯飞的在线教育系统如“智学网”中,取得了较好应用成效。
陈恩红,中国科学技术大学教授、博士生导师,CCF会士,国家杰出青年基金获得者,科技部创新人才推进计划重点领域创新团队“大数据分析与应用”负责人,安徽省“特支计划”创新领军人才。现任计算机学院副院长、语音及语音信息处理国家工程实验室主任、大数据分析及应用安徽省重点实验室主任,中国计算机学会理事、大数据专家委员会副主任,安徽省计算机学会理事长。担任WWW Journal、IEEE Transactions on System、Man and Cybernetics:System,计算机研究与发展、模式识别与人工智能、计算机应用等国内外学术期刊编委。多次担任KDD、ICDM、SDM等数据挖掘领域顶级国际学术会议程序委员会委员。在包括TKDE、TMC、TKDD、TIST,以及KDD、SIGIR、ICDM、CIKM等在内期刊、会议上发表论文150余篇,获KDD 2008最佳应用论文奖、ICDM 2011最佳研究论文奖、SDM2015最佳论文提名,2012年教育部自然科学二等奖。培养的博士生获得中国计算机学会优秀博士论文奖、中科院优秀博士论文奖,有多人获得中科院院长优秀奖、特别奖,以及微软学者奖。
报告题目: 百度知识图谱技术及应用于佃海 百度公司主任架构师 |
知识图谱是人工智能时代重要的核心技术之一。百度在在知识图谱的构建和应用方面有着长期工作积累,在图谱规模以及对产品支撑经验等方面处于领先水平。本次报告将介绍百度知识图谱的现状,以及知识图谱背后的知识抽取、实体归一、计算推理、存储检索等多项关键技术,同时将介绍百度知识图谱在搜索、问答、推荐、对话等场景的实际应用。
于佃海,百度自然语言处理部技术委员会主席,主任架构师。2008年从北京大学信息科学技术学院毕业,加入百度。长期从事自然语言处理、机器学习方向的研究和应用工作,在网页搜索、广告、推荐、问答、对话交互等多个方向积累丰富实践经验。负责研发建设的百度机器学习基础算法库及深度学习文本计算平台,支持了公司内多产品线的广泛应用。在ACL、EMNLP等国际会议发表多篇学术论文。做为主要参加人参与了公司承接的多个国家项目课题的研究开发工作。曾获评2012年最佳百度人,所主导参与的自然语言语义理解平台“懂你”项目获得2015年度百度最高奖。