滴滴主题研究计划
滴滴希望通过开放业务场景,与学术界发现与定义问题,合作共赢解决领域难题,构建高水平跨境知识与研究网络,构筑产学研合作共同体。
2018年秋季期主题研究计划包含机器学习、计算机视觉、语音信号处理、地理信息技术和能源与汽车五大研究方向的15个来自滴滴真实业务场景。诚邀全球顶尖的学者与滴滴研究员共同探讨前沿技术在出行领域的落地应用,以真实场景驱动技术革新。
2018年秋季期提交申报书截止日期8月19日。请您关注项目关键时间节点,选定申报命题后提前完成申报工作。
主题研究计划官方网址:
https://outreach.didichuxing.com/RFP
上期我们介绍了机器学习方向的前三个课题,大家可以在文末点击查看。这期我们将介绍该方向的另外三个课题,希望大家可以找到与自己研究方向匹配的申报课题。
机器学习
四. 网约车评价体系设计
1.技术方向
深度学习,机器学习,半监督学习,Active Learning,标注方法,Transportation,用户体验
2.课题背景
随着移动互联网颠覆性的变革,网约车行业在全球兴起。滴滴作为全球领先的网约车以及智慧交通平台,已经在深刻改变着人们的出行乃至生活方式。
让好服务的司机能获得好的收入,为网约车设计一套评价体系,兼顾乘客体验,司机接单公平性与平台的合理收益,也成为司乘生态建设的一大关键。滴滴目前的评价体系构建依赖的机器学习建模实现的。司乘反馈的准确数据标注和模型的持续优化也将可以让网约车评价体系设计的更完善,从而使司机和乘客的用户体验进一步提升。
3.研究目标
针对上述关键问题,研究目标包括不限于:
1. 标注方法研究
构建自动或半自动的样本标注能力,为模型训练提供足够多的样本。一般来说,这个过程需要结合人工标注样本,涉及半监督学习、Active Learning等方面的知识。将自动标注的样本达到人工标注的质量是最困难的。需要满足以下两个要求:
1) 准确性
每个样本都要得到准确的评价结果,达到或近似达到人工标注的质量。
2)自动或半自动
样本的生产是自动或半自动的,可以支撑DNN这种大规模训练数据要求。
2. 模型算法研究
探索合适的机器学习、深度学习、增强学习等方法,持续提高模型效果。 详细来说,评估的指标和方面包括:
1)AUC
2)准确率
3)召回率
4)工程架构
五.基于网约车取消场景下的判责方法研究
1.技术方向
深度学习,机器学习,半监督学习,Active Learning,标注方法,Transportation,用户体验
2.课题背景
随着移动互联网颠覆性的变革,网约车行业在全球兴起。滴滴作为全球领先的网约车以及智慧交通平台,已经在深刻改变着人们的出行乃至生活方式。良好的司乘生态非常重要,以一个普通的约车场景为例,当乘客输入自己的起终点并点击“叫车”时,平台会实时匹配合适的司机,而在匹配完成后和开始计费前,司机或乘客可以随时取消这笔订单,但可能会面临一定的责任判定,因为一方的取消往往会影响另一方的体验。
滴滴的取消判责当前是用机器学习建模方式实现的能在司乘任意一方取消订单时,实时、自动判定司乘双方的取消责任,即时给予反馈,有效保障司乘双方权益。司乘反馈样本的准确标注和机器学习模型算法的提升都可以让取消行为的责任判定更准确,从而使司机和乘客的用户体验进一步提升。
3.研究目标
针对上述关键问题,研究目标包括不限于:
1. 标注方法研究
构建自动或半自动的样本标注能力,为模型训练提供足够多的样本。一般来说,这个过程需要结合人工标注样本,涉及半监督学习、Active Learning等方面的知识。将自动标注的样本达到人工标注的质量是最困难的。需要满足以下两个要求 :
1)准确性
每个样本都要得到准确的判责结果,达到或近似达到人工标注的质量。
2) 自动或半自动
样本的生产是自动或半自动的,可以支撑DNN这种大规模训练数据要求。
2. 模型算法研究
探索合适的机器学习、深度学习、增强学习等方法,持续提高模型判责效果。 详细来说,评估的指标和方面包括:
1) AUC
2) 准确率
3) 召回率
4) 工程架构
六.乘客个性化出行需求预测模型研究
1.技术方向
用户画像,机器学习,深度学习,个体出行需求预测
2.课题背景
滴滴致力于满足用户的出行需求,目前用户出行需求表达一般在打开滴滴出行之后,此时用户的需求决策(从A至B,打车出行)已基本确定,出行服务目标主要为对需求表达后的高效满足。
对用户未来短期的个性化的需求预测研究,对于后续通过运营手段引导和促进用户共享出行,具有重要意义。例如,通过算法准确预测个体用户未来24小时从A到B的概率,则可以结合行程特点(典型的,出行概率高还是低,出行目的地是商场还是饭店),提前对用户进行个性化运营和推荐,从而有效增强用户体验,提升运营效果。
通常,用户的出行决策在平台上只得到部分的展示,数据往往呈现出高度稀疏的特点,用户是否从A出行到B又受到天气、需求变动等多方面影响,出行需求预测具有相当难度。但用户出行需求又有一定场景,每一场景都有其特征,如 通勤类(稳定性,固定时间地点),旅游类(异地,热门景点),娱乐类(餐饮,娱乐场所,往返)等,表明用户个体的出行需求,一定程度上是可预测的。通过机器学习算法,挖掘滴滴的用户数据,预测每一个个体用户未来出行的可能性和场景,对于后续通过个性化的运营手段引导和促进用户共享出行,具有重要意义。
3.研究目标
针对上述关键问题,研究目标包括不限于:
1) 乘客未来24小时出行路径预测
通过滴滴收集的海量数据,包括历史行程,用户位置,订单数据,结合POI,天气情况,社会事件(演唱会,春运)等数据,利用机器学习算法,预测个体用户未来24小时的出行路径(从A到B),并相应地计算其概率。
4.性能要求与期待产出
模型预测效果的衡量指标:
1. TOPN预测路径对实际出行路径的准召(典型地,N=1,3)
2. 预测TOP1召回路径上实际是否出行的AUC因不同场景下的预测需求难度和意义不一样(如通勤类易预测,娱乐类相对难),因此上述指标宜依据场景不同而分别衡量。
要求:
1. 在分类场景下,个体用户出行预测的准召等指标方面取得较好效果;
2. 在学术上体现算法先进性和模型的创新性;
3. 算法和模型能够在滴滴业务场景中落地。
注意
更多项目信息
请关注主题研究计划官方主页:
https://outreach.didichuxing.com/RFP
项目组邮件通知:
gaia@didichuxing.com
相关文章: