七、广告交易平台
M 公司作为一家具有独特生态的互联网企业,利用庞大的用户规模开展广告业务是该公司的重要战略。
(一)M 广告平台
M 广告平台是一个涵盖面十分广泛的体系,是支撑 M 公司广告业务运营的基本平台,主要负责应用商店、浏览器、一点资讯、电视等全线软硬件数十个业务,支持应用游戏下载、信息流、搜索、开屏、视频贴片、电视画报等十余种主流和创新的移动广告形式。附图 22为 M 公司广告平台的体系架构。
附图 22 M 公司广告平台的体系架构
从图中可以看出,从上至下广告平台分成接入层、广告服务层、算法数据层和存储层,各层的功能如下:
(1)接入层的接入对象包括用户的手机、服务器、广告主、广告联盟和工程师等,负责流量的接入、管理、配置和运营。
(2)广告服务层包含广告选取、过滤、排序等核心逻辑,主要的服务有广告交易平台、效果广告服务和排期广告服务等,是广告检索的核心。
(3)算法数据层负责点击率预估、预算平滑、精准定向等算法。
(4)存储层负责广告数据的存储,同时也是各种广告和用户数据的访问层。
(二)广告交易平台
M 公司的广告交易平台(MI AD Exchange,MAX)是广告平台的主要组成部分,承担着广告交易的相关服务功能。这一平台的体系架构如附图 23 所示。
附图 23 M 公司广告交易平台的体系架构
从图中可以看出,MAX 提供了一个 DSP(Demand-Side Platform,需求方平台),为广告主、广告代理公司打造了一个综合性的管理平台,让他们能够通过同一个界面管理多个数字广告和数据交换的账户,大幅提升了广告管理的能力和水平。DSP 让广告主通过 MAX 平台以实时竞价的方式获得对广告进行曝光的机会,并对每个曝光进行付费。M 公司的广告交易平台支持的竞价模式包括:
(1)PDB,即 Private Direct Buy,私下直接购买;
(2)PD,即 Prefer Deal,首选交易;
(3)Private Auction,即私下拍卖;
(4)Public Auction,即公开拍卖。
到目前为止,M 公司的广告交易平台已经历了如附图 24 所示的三个阶段。
附图 24 M 公司的广告交易平台的三个发展阶段
(三)点击率预估
广告点击率是评价广告绩效的基本指标,对点击率进行较为准确的预估是提升广告绩效的重要条件。点击率预估是广告算法的核心,重点围绕特征挖掘和模型优化展开。特征挖掘犹如一门艺术,进行特征挖掘不仅需要熟悉业务,而且更需要灵感。M 公司的算法工程师们为此发掘跟用户点击广告相关的各种因素,并优化模型。此外,在线 CTR (Click Through Rate,点击通过率)服务也是 M 公司广告的一项基本业务。
M 公司的广告业务涉及面广泛,点击率预估重点取决于应用分发、搜索和信息流三大类业务。
1. 应用分发
利用各类 App 应用进行推广是广告主的首选需求,M 公司的广告部门依托应用商店、浏览器和视频等 App 进行广告的推广,并通过用户特征值的优化来改进算法。M 公司的广告部门所采用的应用分发的特征主要包括:
(1)用户特征:如人口属性、系统信息等。
(2)广告特征:如用户 ID、类别、位置等。
(3)用户的行为特征:如 App 历史安装、近期下载、近期使用等。
(4)用户的广告行为特征:如 AD 展现点击下载次数等。
(5)组合特征:如用户特征与广告特征组合。
其中,用户的行为特征被证明为最有效,因此被作为点击率预估的首要指标。在模型方面,M 公司的广告部门从最开始的离线模型逐步过渡到小时级的 FTRL(Follow The Regularied Leader,在线学习算法),效果得到了显著提升。
2. 搜 索
搜索是指应用搜索,主要依托于应用商店和浏览器庞大的搜索流量进行广告的投放。其特征方面主要包括:
(1)上下文特征:如搜索关键词、搜索自然结果及分类、搜索来源等。
(2)广告特征:如 ID、类别、广告标题等。
(3)用户特征:如人口属性、系统信息等。
(4)组合特征:如用户特征与广告特征、搜索上下文特征与广告特征组合。在模型选取方面,已从过去选用的相关性模型升级为点击率模型,效果提升明显。
3. 信息流
信息流广告起源于 Facebook,国内的今日头条、微博等也取得了成功。信息流的广告形式有大图、小图及组图等,广告类型包括应用分发、H5 和视频等。M 公司的信息流广告的主要载体是一点资讯和浏览器。信息流广告的素材更新频繁,广告数量也比较多,广告收益也在不断攀升。
除上述三个方面外,M 公司还对浏览器导航引入了个性化算法,把导航入口按照用户切分成多份流量,变过去浏览器的“千人一面”为现在的“千人千面”,使得广告的效果得到了大幅度提升。
(四)大数据反作弊应用
广告流量作弊是常见现象,对广告的真实效果和交易秩序都有极大的影响。M 公司充分利用大数据相关技术手段,主要从以下两个方面来应对相关问题:
1. 设备真伪识别
一般是通过 SDK 的方式采集硬件信息,为每台设备生成唯一的设备 ID,后续即使刷量者对设备的硬件信息进行了修改,唯一的设备 ID 也不能改变。M 公司已经开发了一套基于硬件标识的设备真伪识别方案,实际应用效果良好。
2. 用户行为分析
M 公司利用大数据手段对用户 IP 分布异常、机型分布异常、点击率异常、下载激活时
间间隔异常、留存率和使用时长异常进行分析,并通过加强身份验证等手段进行监控。
M 大数据广告反作弊系统的架构如附图 25 所示。M 大数据广告反作弊系统包括以下三个组成部分:
第一部分是客户端。其核心模块是反作弊 SDK,通过采集系统信息生成设备唯一 ID,
用于机器真伪识别,另外采集其他必要的信息,用于服务端的反作弊模型分析。
第二部分是服务端,包括实时反作弊系统和离线反作弊系统:实时反作弊系统收集实时上报的日志,通过实时流计算框架,快速分析作弊情况,一般用于捕捉短期的作弊行为;离线反作弊系统则是通过收集多维度的数据,经过离线计算和反作弊模型,最大限度地发现各种长期和短期的作弊行为。这两者都牵涉三个模块:
(1)数据收集,包括设备 ID、IP、广告点击/下载/激活时间戳等信息。
(2)特征计算,包括多维度(如 IP、UserAgent 等)、多粒度(周、天、小时、分钟)、多指标(CTR、下载数、时间间隔等)的实时/离线计算。
(3)反作弊模型(实时模型主要是基于规则的模型;离线模型主要是基于规则的模型,将尝试用机器学习模型)。
第三部分是前端。前端主要提供数据报表、异常监控、智能分析等功能。
附图 25 M 大数据广告反作弊系统的架构