资源行业动态Google 地图如何采用深度学习预测公交延迟?

Google 地图如何采用深度学习预测公交延迟?

2019-12-19 | |  102 |   0

原标题:Google 地图如何采用深度学习预测公交延迟?

来源:AI 研习社      链接:https://www.yanxishe.com/TextTranslation/1888


用机器学习预测公交延迟


作者:亚历克斯(Alex Fabrikant)

全世界有数亿人的日常通勤依赖于公共交通,而世界上超过一半的公共交通出行都是要乘坐公共汽车。随着全球城市化规模不断扩大,乘客想知道什么时候会出现延误,尤其是公交车,很容易被交通堵塞。虽然谷歌地图提供的公共交通路线是由许多实时数据得来的的,但由于技术和资源的限制,许多机构无法提供这些信息。

今天,谷歌<span lang="EN-USArial",sans-serif;color:black;" mso-color-alt:windowtext'="">Maps为公交车引入了实时交通延迟,预测了全球数百个城市的公交车延迟,从亚特兰大到萨格勒布、伊斯坦布尔到马尼拉等等。这提高了六千多万人通勤时间的准确性。该基于机器学习驱动的预测系统于三周前在印度推出,它将实时的车辆交通预测与公交路线及站点结合起来,以更好地预测一趟公交行程需要多长时间。


模型的准备工作

在许多没有交通运输局实时预测的城市,我们从被调查的用户那里听说,他们使用了一种聪明的方法来粗略估计公交延误:使用谷歌地图的驾驶方向。但是公共汽车不仅仅是大型汽车。他们在公共汽车站停靠;需要更长的时间来加速、减速和转弯;有时甚至有特殊道路的行驶特权,比如公共汽车专用道。


举个例子,让我们来看看周三下午在悉尼乘坐公交车的情况。公共汽车的实际运行时间(蓝色)比公布的时间表(黑色)晚几分钟。汽车交通速度(红色)确实会影响到公交车,比如在2000米时减速,但在800米标志处长时间停车,会使得公交车的速度明显慢于汽车。

01.png

为了开发我们的模型,我们从随时间变化的位置序列中提取训练数据,这些数据来自公交机构实时接收的数据,并将它们与旅途中公交路线上的汽车行驶速度保持一致。该模型分为一系列时间轴单位-访问街区和站点-每个都对应于公交车的时间轴,每个单位都预测持续时间。由于报告的不频繁性,快速移动的公交车以及较短的路段和站点,一对相邻的观测值通常跨越许多单位。


这种结构非常适合于神经序列模型,例如最近已成功应用于语音处理,机器翻译等模型。我们的模型更简单。每个单位独立预测其持续时间,最终输出是每个单位预测的总和。与许多序列模型不同,我们的模型不需要学习组合单元输出,也不需要通过单元序列传递状态。相反,序列结构使我们可以共同(1)训练各个单位持续时间的模型,(2 以及优化“线性系统”,在该系统中,每个观察到的轨迹将总持续时间分配给它所跨越的许多单位的总和。

02.png

为了对从蓝色停靠点开始的公交车出行(a)建模,模型(b)将时间轴单位的延迟预测相加为蓝色停靠点,三个路段,白色停靠点等。


建模“哪里”


除了道路交通延误外,在训练我们的模型时,我们还考虑了有关公交路线的详细信息以及有关行程位置和时间的信号。 即使在很小的社区内,该模型也需要将汽车速度预测转化为不同街道上不同的公交车速度。 在下面的左侧面板中,我们对模型在小汽车速与公交车速度之间的预测比率进行彩色编码。 更红,更慢的部分可能对应于在车站附近公交车会减速。 至于突出显示的方框中的快速绿色延伸,我们从在StreetView(右)中看到的内容得知,我们的模型发现了仅用于公交车的转弯车道。 顺便说一句,这条路线是在澳大利亚,右转弯比左转慢,这在不考虑位置特殊性的模型中可能会丢失的另一个方面。

1576738727264490.png


为了捕获特定街道,邻里和城市的独特属性,我们让模型学习不同大小区域的表示层次,并在模型中用时间轴单位的地理位置(道路或站点的精确位置)来表示 各种规模下其位置嵌入的总和。 我们首先对具有特殊情况的更细粒度位置的模型进行逐渐加重的惩罚训练,然后将结果用于特征选择。 这样可以确保考虑到足够复杂的区域(一百米影响公交车行为)中的细粒度特征,而不是像这样出现的空旷地区的稀疏特征。


在训练时,我们还模拟了以后查询不在训练数据中的区域的可能性。 在每个训练批次中,我们都会随机抽取一些示例,并丢弃低于每个示例随机选择的比例尺的地理特征。 一些示例保留了确切的公交路线和街道,其他示例仅保留了社区或城市级别的位置,而其他示例则完全没有地理背景。 这样可以更好地为模型做准备,以便以后查询我们缺少训练数据的地域。 通过使用匿名推论,我们扩展了训练语料库的范围,该推论来自与Google Maps在企业中普遍使用的时间,停车困难和其他特征相同的数据集。 但是,即使此数据也不包括世界上大多数公交路线,因此我们的模型必须稳健地推广到新区域。


学习当地的特点


不同的城市和街区也有不同的表现,因此我们允许模型将其位置表示与时间信号结合起来。公交车对时间的依赖性很复杂-周二6:30 pm和6:45 pm之间的差异可能是某些地区的高峰时间减少,其他地区是繁忙用餐时间以及其他地方昏昏欲睡的小镇完全安静。我们的模型学习了一天中的本地时间和一周中的一天中的信号的嵌入,将其与位置表示结合使用时,可以捕获无法通过汽车交通观察到的明显的局部变化,例如高峰时段公交车站的人群。


将4维矢量分配给一天中的时间。与大多数神经网络内部结构不同,四个维度几乎不足以可视化,因此让我们通过下面的艺术渲染来看看模型如何在三个维度中安排一天中的时间。该模型确实了解到时间是周期性的,将时间置于“循环”中。但是,这种循环不只是钟面的平面。该模型学习了广泛的转弯,使其他神经元可以组成简单的规则,轻松地将诸如公交车行为变化不大的“午夜”或“早晨”之类的概念分开。另一方面,社区和城市之间的夜间通勤模式差异更大,该模型似乎在下午4点至晚上9点之间创建了更为复杂的“皱缩”模式,从而可以更精确地推断出每个城市的高峰时间。

04.png


模型的时间表示形式(4个维度中的3个)形成一个循环,在此重新定义为手表的周长。 更多与位置相关的时间窗口(例如4 pm-9pm和7 am-9am)会变得更加复杂,而大型无特征的窗口(例如2 am-5am)会弯曲以简化规则。 (Will Cassella的艺术家构想,使用来自textures.com的纹理和来自hdrihaven的HDRI。)


与其他信号一起,即使我们将车速保持恒定,这种时间表示也可以让我们预测复杂的模式。 例如,在经过新泽西州的10公里公共汽车上,我们的模型在午餐时间的人群和工作日的高峰时间上车:

1576738877913367.png

放在一起综合考虑


在对模型进行全面训练之后,让我们看一下它对悉尼公交车的了解。 如果我们根据当天的汽车流量数据运行该模型,可以得到绿色预测。 它不能准确预测到所有内容。 例如,它在800米处停了下来,仅持续10秒,尽管公交车实际停了至少31秒。 但是,真正的公交车行驶只有1.5分钟路程,比起行程表或仅开车时间,我们会得到更多旅行上的细微差别。

06.png 

未来之旅


目前我们模型中还没有做一件事:公交车本身的时间表。到目前为止,在通过官方代理公交车时间表进行的试验中,他们并未显着改善我们的预测。在某些城市,严重的交通波动可能会使计划时间表并不会严格执行。在其他情况下,公交时刻表可能是准确的,但这可能是因为公交机构会仔细考虑交通状况。这些事我们从数据中推断出的。


我们将继续进行实验,以更好地利用日程安排约束和许多其他信号条件来推动更精确的预测,并使用户更轻松地计划行程。希望我们也会对您有所帮助。旅途愉快!


致谢

这项工作是Google Research的James Cook,Alex Fabrikant,Ivan Kuznetsov和Fangzhou Xu的共同努力,以及Anthony Bertuca,Julian Gibbons,Thierry LeBoulengé,Cayden Meyer,Anatoli Plotnikov和Ivan Volosyuk的共同努力。我们感谢Senaka Buthpitiya,Da-Cheng Juan,Reuben Kan,Ramesh Nagarajan,Andrew Tomkins和更大的公交团队的支持和有益的讨论;以及Will Cassella对模型时间嵌入的重新构想。我们还要感谢我们的合作伙伴机构提供培训系统的运输数据提要。

 --------------------------------------------------------------

发起:唐里 校对:望北 审核:唐里

参与翻译(2人):天字一号、QQ我我

英文原文:Predicting Bus Delays with Machine Learning

THE END

免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:深度网络标准化(规范化)技术

下一篇:用于深度学习的模型蒸馏技术

用户评价
全部评价

热门资源

  • 国内人才报告:机...

    近日,BOSS 直聘职业科学实验室 &BOSS 直聘研究院...

  • AI使物联网更智能...

    看到微软对物联网和人工智能的结合感兴趣是一个明...

  • 推荐一批学习自然...

    这里推荐一批学习自然语言处理相关的书籍,当然,...

  • 安防智能化大势下...

    大部分传统安防设备不仅拍摄视野有限,而且无法事...

  • 20亿创业基金、10...

    近日,杭州举办了建设国家新一代人工智能创新发展...