多场景联合建模,主要是从算法和效能两方面考虑。算法层面,各个场景独立建模受限于数据量,长尾场景学习不充分,而简单共享模型难以建模场景差异性;效能方面,我们需要考虑系统资源和人力成本限制。
多场景建模的一个难点是,不同场景分布不同,如何同时建模场景共性和差异性。具体来说不同场景具有用户差异,即使是同一用户,在不同场景下的心智也不同,页面呈现的形式和内容,进入页面前的用户状态也有很大的差异。这两点反映在数据里的现象是,同一广告在不同场景下的展现频次、平均点击率等均有较大的差别。也就是说,尽管不同场景之间的共性和关联性可以共享信息,但与此同时,受产品形态和引流方式的影响,各场景也存在一定的差异性。
我们总结了多场景建模的三个挑战:1)场景数多且存在长尾问题;2)不同场景样本分布差异大;3)人力和资源的限制。我们的建模重点是有效利用场景间共性并建模不同场景差异性,同时打造一套兼顾效能,可快速迭代的建模体系。