某机构与约翰霍普金斯大学公布六名研究员和九个教师研究奖项
作为JHU + 某机构交互式AI倡议(AI2AI)的一部分,首批获奖者名单已公布。
2022年10月5日
某机构与约翰霍普金斯大学(JHU)今日公布了首批博士生奖学金和教师研究奖项的获得者,这些奖项属于JHU + 某机构交互式AI倡议(AI2AI)的一部分。AI2AI倡议于四月启动,隶属于JHU怀廷工程学院,致力于推动突破性AI进展,重点关注机器学习、计算机视觉、自然语言理解和语音处理。
“我们对JHU教师和学生提交的高质量提案和博士生奖学金提名感到高兴,”Alexa AI副总裁Prem Natarajan表示。“毫无疑问,这一倡议将推动交互式和多模态AI领域的最新技术进展。”
作为该倡议的一部分,年度某机构奖学金授予怀廷工程学院注册的博士生。某机构还资助由JHU教师领导的研究项目,这些项目与博士后研究人员、本科生和研究生以及研究 staff 合作。今年的获奖者是首届获得者。
“我们很高兴我们的学生和教师有机会在某机构合作,在交互式AI这一重要领域进行合作,”约翰霍普金斯大学怀廷工程学院研究副院长Larry Nagahara表示。“利用我们在这个领域的集体专业知识将推动AI发展,并为社会带来许多有益方面。”
以下是研究员及其研究列表,随后是教师奖项获得者及其研究项目。
某机构研究员
Kelly Marchisio、Arya McCarthy、Carolina Pacheco Oñate、Desh Raj、Anshul Shah和Jeya Maria Jose Valanarasu是怀廷工程学院注册博士生的首届奖学金获得者。
Kelly Marchisio 正在攻读计算机科学博士学位,师从计算机科学教授Philipp Koehn。
“词嵌入空间是现代自然语言处理系统的关键组成部分。我的工作重点是理解和利用嵌入空间几何,目标是创建更小、更有用、更跨语言和跨领域通用的空间。”
Arya McCarthy 正在攻读计算机科学博士学位,师从计算机科学教授David Yarowsky。
“我将自然语言处理的愿景称为千语言处理:不仅建模数千种语言,还让它们的集体证据和共性相互强化。为实现这一目标,我创建了神经机器翻译模型;形态学词元化器、标注器和变形器;甚至对跨越数千种语言的颜色术语进行了彻底分析,旨在推动这些前沿。这一愿景受到说话者需求的现实以及NLP目前未能满足这些需求的驱动。世界上约有7000种已识别语言,其中至少4000种有书籍长度的数字化书面存在。尽管数据可用,标准NLP工具通常远少于100种语言。”
Carolina Pacheco Oñate 正在攻读生物医学工程博士学位,师从某机构学者兼Herschel Seder生物医学工程教授René Vidal。
“我有兴趣推动计算机视觉进入数据或注释可用性有限的领域,这不仅与传统计算机视觉任务中的长尾事件相关,还与生物医学科学等其他具有社会影响力的领域相关。我相信深度学习与概率模型和领域知识的结合可以在容量和结构之间提供适当平衡,从而在自监督和弱监督机制中从有限数据中学习。”
Desh Raj 正在攻读计算机科学博士学位,师从电气和计算机工程副教授Sanjeev Khudanpur。
“自从30多年前第一个自动语音识别系统建成以来,语音技术的改进使得诸如自动客户支持和语言学习等应用成为可能。通过多年对语音增强和鲁棒语音处理的研究,这些系统现在部署在家庭扬声器和车辆控制等多种环境中。然而,这些现有系统是被动听者,转录单说话者话语并馈送到下游语言理解组件。未来的对话智能预计将包括能够主动参与人类对话的系统。虽然这些系统需要多种模态的智能——例如用于上下文处理的对话系统、从语音和视频中识别情感、常识推理等——但它们识别自由流动的多方对话的能力是一个需要解决的核心组件。”
Anshul Shah 正在攻读计算机科学博士学位,师从电气和计算机工程及生物医学工程Bloomberg特聘教授Rama Chellappa。
“我当前的研究广泛涉及基于姿态的动作识别、视频理解、自监督学习和多模态学习。我的研究试图对这些研究领域做出根本性贡献,获得新见解并推动技术前沿。我的兴趣与AI2AI在交互式AI技术领域的重点紧密对齐,特别是在计算机视觉和多模态AI方面。”
Jeya Maria Jose Valanarasu 正在攻读电气和计算机工程博士学位,师从电气和计算机工程副教授Vishal M. Patel。
“计算机视觉的深度学习方法在视觉识别领域取得了显著进展。其成功的一个主要原因是这些模型训练的数据量。为每个新问题或应用注释新的真实数据非常低效。此外,当前视觉系统在训练期间未见过的数据分布上表现不佳。这个问题称为域适应,对于在实时部署模型非常重要。此外,当模型在推理期间适应新数据时,适应需要快速,并且在测试时训练模型没有意义。因此,我们需要专注于少样本或更好的零样本学习进行适应。”
教师研究奖项
Mark Dredze、Philipp Koehn、Kenton Murray、Anqi Liu、Jesus Antonio Villalba López、Soledad Villar、Laureano Moro-Velazquez、Mahsa Yarmohammadi和Alan Yuille是JHU + 某机构交互式AI倡议教师研究奖项的首届获得者。
Mark Dredze,计算机科学John C. Malone副教授:“将LLM的知识表示与信息提取系统集成”
“在过去的几年中,捕获语言模式的新型AI模型在从语言中学习信息方面变得非常擅长。这个项目探索如何利用这些模型学习的信息来为语言数据的实际应用提供信息,例如识别产品评论中产品的重要特征或特性。这个奖项将使我们能够通过探索如何利用最新进展来帮助改进语言技术的各种应用,从而推动语言建模的极限。”
Philipp Koehn,计算机科学教授,和Kenton Murray,人类语言技术卓越中心研究科学家:“评估多语言机器翻译的多语言性”
“深度神经网络在人工智能中的普及使得研究人员和工程师能够构建可以自动翻译大语言组之间的系统,而无需构建单独的模型。然而,拥有一个大型通用模型的局限性尚未得到很好理解。我们旨在调查这类AI模型的前沿。”
Anqi Liu,计算机科学助理教授:“通过分布鲁棒学习实现在线域适应”
“这个项目旨在通过建模不确定性实现AI算法的快速和鲁棒适应。这个奖项使我能够研究具有现实世界影响潜力的基础研究问题。”
Jesus Antonio Villalba López,电气和计算机工程助理研究教授:“通用语音处理模型”
“这个项目将研究如何利用大规模AI模型高效提取语音中包含的信息。结果将是一个通用模型,能够将语音转录为文本,并确定说话者的身份、语言和情感状态等。”
Soledad Villar,应用数学和统计学助理教授:“绿色AI:通过利用对称性实现强大且轻量级的机器学习”
“在这个项目中,我们研究在机器学习模型设计中使用对称性和低维结构。强制执行这些数学结构将使我们能够减少训练和评估机器学习模型所需的能源消耗、时间和数据量,同时保持(甚至提高)其性能。”
Laureano Moro-Velazquez,语言和语音处理中心助理研究教授:“改进非典型语音人群的语音理解”
“在这个项目中,我们将创建一个新的数据集并开发新的语音技术,旨在改善非典型语音和语音障碍个体的生活。几乎没有任何公开可用的包含非典型语音的数据集,而这些对于为受影响人群创建新的辅助技术是必要的。这个奖项将使我们能够创建这样一个数据集,这对我们和其他许多研究非典型语音的团体都有用。”
Mahsa Yarmohammadi,语言和语音处理中心助理研究科学家:“通过自动投影和人工监督快速创建多语言数据集”
“人工智能,特别是自然语言处理,需要大规模数据来学习强大模型。这样的数据可能在高资源语言(如英语)以外的语言中不可用。在这个项目中,我们研究通过自动翻译和对齐一种语言中的可用数据集到多种其他语言来快速创建多语言数据集。我们还将研究人工监督在提高数据质量方面的影响。一旦我们创建了这些资源,我们打算使用它们来共同训练单一多语言模型,用于跨语言NLP任务。”
Alan Yuille,认知科学和计算机科学Bloomberg特聘教授:“用于少样本学习的弱监督多模态变换器,具有对新域和细粒度任务的泛化能力”
“自监督和弱监督变换器已被证明对多种视觉、语言和视觉-语言任务非常有效。这个提案针对三个挑战。首先,提高标准任务的性能,特别是在细粒度任务(例如,对象属性和部分)上,这些任务研究较少。其次,开发分词器方法以实现少样本,理想情况下零样本学习。第三,调整这些方法,使它们能够泛化到新域和分布外情况。我们提出了五种策略来实现这些目标,包括扩展基于分词器的方法、修改变换器结构、增加文本注释以帮助这些困难任务,以及使算法能够泛化到域外和分布外的技术。”
AI2AI
有关JHU和某机构倡议的更多信息,包括机会和事件,请访问官方网站。
了解更多