论文中的研究问题来源一般分为两类:一是从现有工作文献中分析它们各自的不足点,总结出尚未解决(或未能提供很好解决办法)的问题;另一类是从真实的数据中分析,从而找出新问题。第二类问题因为有庞大的真实数据作依据,所以问题更具有价值。而这篇文章的问题属于第二类,是根据庞大的真实数据集的合理分析得来,即通过分析大量的视频性能的数据,指出现有的视频传输架构存在的问题。所以这篇文章的问题发现是本篇文章的主要亮点之一。
问题描述:传统基于HTTP视频传输架构追求的是低时延和高吞吐量的目标,而用户现在追求的是更高质量的视频(如较短的播放准备时间,较少的缓冲,以及较高的码率),而供求目标的不匹配,将会导致用户的视频观看体验度下降,进而会导致内容运行商流失用户。
为了分析现在的视频传输架构在提供高质量视频(如low startup delays, low buffering, high bitrates)是否真的存在短板,作者通过分析2亿份的视频会话(video sessions)得到如下结果:
- 40%的视频会话存在1%以上的再缓冲率(rebufferfing ratio),而20%的存在10%以上的再缓冲率;
- 23%的视频的播放启动时间超过5秒,而14%的视频超过10秒;
- 28%的视频的平均码率低于500Kbps,而1%的低于1Mbps.
通过数据分析表明,现有的视频传输架构不能为用户提供更高质量的视频(如在low buffering, low startup delays, high bitrates方面)的问题存在。
而导致上述的问题的原因也主要有三个:
- 不同地域和ISPs的CDN的性能和可利用性不一样;
- 不同时间内CDN性能和基于客户端网络的性能不一样;
- 对于高负载场景的系统响应较差。
那么,本篇文章的目标:
迎合用户的需求,优化视频传输的质量,为用户提供更高质量的视频(low startup delays, low buffering, high bitrates),为达到该目标,本篇文章就围绕3W(what,when,who)进行了方案设计:
- (what)该采用什么参数进行调节,如码率,CDN;
- (when)在什么时候进行优化,如播放开始时,或播放过程中;
- (who)谁来选择这些参数,用户还是服务器
针对第三点(who),作者直接给出了回答,即单纯分别只由客户端或者服务器来选择参数优化系统是远远不够的,这也就直接引出了作者的本篇文章的主要工作,设计一个视频管控平台来优化视频传输,该平台对整个网络和CDN具有全局视野,因此可以能够动态地为用户提供合适的CDN和码率。
视频管控平台(Video Control Plane)设计的三部件:
- 数据收集器(Measurement Engine):主要用来定期在客户端上采集视频质量数据(buffering , join time, average bitrate)还有视频会话的属性(如ISP,位置,所使用的CDN)。收集过程存在的挑战是不好决定合适的收集频率和视频属性的粒度。
- 视频性能外推器(Performance Oracle):在数据收集器收集过来的历史数据和当前数据的前提上,预测在同样的参数(如CDN和码率)和视频会话属性(ISP,地理位置)条件上,未来用户观看到的视频性能。这里的挑战是,要保证外推法的鲁棒性。
- 全局优化器:在传输费用和CDN容量的限制下,为用户提供合适的CDN和码率,使得全局的效用函数值最大化。文章里用到的效用函数为BuffRatio和Bitrate的简单线性组合
本篇文章的主要贡献点:
- 通过大量真实的数据集分析出现有视频传输架构在传输高质量视频上的不足点;
- 通过外推法预测视频传输的潜在提高空间;
- 结合潜在的gain设计一个可操作的模型