侧边栏壁纸
什么是 ads.txt 文件
2023年02月25日 3k阅读 0评论 0点赞

一、什么是 ads.txt 文件?
Google推出的授权数字卖方(ads.txt)是一项旨在提高程序化广告透明度的计划。发布商可以创建自己的ads.txt文件用来指明有权销售其广告资源的卖方。这是一项在程序化购买流程中,保护网络媒体免受未经授权的公司违规售卖广告资源的技术解决方案。
  简单一点说,就是媒体在他们的网络服务器上放置一个文本文件,列出所有通过其授权出售广告位的公司。 同理,平台也集成了ads.txt文件,以确认哪些媒体平台的广告位被授权销售。 这样买家可以检查他们购买的广告位的有效性。
二、添加 ads.txt 文件有什么用?
添加 ads.txt 文件,避免出现无法展示部分广告的情况。ads.txt 文件可以帮助广告主识别仿冒广告资源,同时可以帮助网站发布商获得更多广告客户支出,而这些支出原本可能会流向仿冒广告资源。
三、如何创建ads.txt 文件?
要创建 ads.txt 文件以公开声明 Google 有权销售你的广告资源,请按以下步骤操作:
1.创建 1 个文本 ( .txt ) 文件

  1. 在该文件中添加下面 1 行:
    google.com, pub-xxxxxxxxxxxxxxxx, DIRECT, f08c47fec0942fa0
    重要提示:请务必用你自己的发布商 ID 替换 pub-xxxxxxxxxxxxxxxx
    一般通常会需要系统 72 小时的时间,AdSense才会将后台的警示移除。所以需要确保你网站的 ads.txt 文件可被抓取。
  2. 在你的网站根目录下存放 ads.txt 文件。
    例如 http://3zschool.com/ads.txt
    需要注意的是一定要放在一级域名下,不要放在二级或者三级域名下。例如,“google.co.uk”是“co.uk”的根域,而“maps.google.co.uk”则不是。(域名相关知识大家可以阅读3z学堂之前写得域名基础知识介绍文章)
    四、为什么已经设置好 ads.txt,后台还在提醒?

需要确保已经为AdSense网页列表中所有状态为【就绪】的网站都添加 ads.txt。
需要确保填写的发布商 ID 正确,就是 pub-xxxxxxxxxxxxxxxx 这个ID
在添加 ads.txt 后,Google的系统需要 24 小时去做抓取,抓取后系统需要 2 - 3 天才会在你的账号中撤销警示。因此如果才刚设置,请耐心等待给系统时间处理。
务必将 ads.txt 添加在一级目录下。(设置在 http://3zschool.com/ads.txt 而非 http://www.3zschool.com/ads.txt
五、ads.txt 文件中有哪些信息?
创建一个名为 ads.txt 的文本文件,并为每个有权销售您网站广告资源的广告交易平台或 SSP 添加单独的行。每一行都应包含三项数据(以及第 4 个选填字段),具体格式如下:<字段 1>, <字段 2>, <字段 3>, <字段 4>

<字段 #1>:广告投放系统的域名(必填)
这是出价工具关联到的系统的规范域名。可以使用此类系统的运行域名作为该域名(如果运行域名与父级企业域名不同的话),这样便于进行 WHOIS 查询和反向 IP 查询,进而明确所有权。SSP 或广告交易平台可能会发布要使用的域名。
对于 Google 卖家帐号,该域名始终是 http://google.com

<字段 #2>:发布商帐号 ID(必填)
与字段 # 1 中广告投放系统内的卖方或转销商帐号相关联的标识符。该字段所包含的值必须与 SSP /广告交易平台所指定字段中的交易(例如 OpenRTB 出价请求)所使用的值相同。在 OpenRTB 中,这通常是 publisher.id 字段。对于 OpenDirect,则通常是发布商的组织 ID。
对于 Google 卖家帐号,请使用每个帐号中显示的发布商 ID(例如 pub-0000000000000000)。如果你忘记你的ID,可以登录到你的 AdSense 帐号,然后依次点击帐号 > 帐号信息,即可找到你的主要帐号的发布商 ID。
请注意:只能添加 pub- 前缀和 16 位数字代码。请删除针对特定产品的前缀(例如 ca- 或 ca-video-)。

<字段 #3>:帐号或关系的类型。(必填)
在解读相关数据时,该字段应不区分大小写。
值“DIRECT”表示发布商(内容所有者)会直接控制字段 2 中指出的帐号,并表示发布商和广告系统之间达成了直接的业务合同。直接控制字段 2 中指出的帐号的 Google 发布商应指定“DIRECT”。
值“RESELLER”表示发布商已授权另一实体来控制字段 2 中指出的帐号并通过字段 1 中的系统来转销其广告空间。不直接控制字段 2 中指出的帐号的 Google 发布商应指定“RESELLER”。例如,使用“扩展型合作伙伴管理”功能的 Ad Manager 帐号应为该帐号不直接管理的广告资源指定“RESELLER”。

<字段 4>:(选填)广告系统在认证机构中的专属标识符(与字段 1 中所列的实体对应)。
假设认证机构是 Trustworthy Accountability Group (TAG),那么在这添加的标识符就是 TAG ID。对于 Google 卖方帐号,对应的 TAG ID 为 f08c47fec0942fa0。
六、网站添加完 ads.txt ,Google 会如何处理?
当你把 ads.txt 文件正确放在根域名上,Google 便会使用该文件的内容来确定哪个发布商帐号可以在该网域上投放广告。
如果网站上存在 ads.txt 文件并正确列出了发布商标识符,则 Google 会针对该网站上的请求运行竞价并返回胜出的广告。如果文件中的标识符不正确,则 Google 不会针对请求运行竞价。
系统会自动检测新的和已更新的 ads.txt 文件,但更改可能至少需要 1 周时间才能生效。
七、如何确保ads.txt 文件可被抓取?
一旦你的域名上设置了 ads.txt 文件,Google 抓取工具就会执行以下操作:

每 24 小时尝试 1 次抓取该文件,反应时间大概需要 3 天
解析该文件的内容,以确定有权通过你的广告资源获利的卖家 ID
为确保你的 ads.txt 文件能够被抓取,Google建议大家完成以下排查步骤:

步骤一:确认文件未出现暂时不可用的情况
如果先前看到的 ads.txt 文件在后续重新抓取时不可用,则先前看到的条目将会出现以下情况:

(1)如果响应为硬 404 错误(网页实际不存在;HTTP 404 状态),将被完全清除。

(2)如果响应为软 404 错误(针对实际不存在的网址返回实际网页;HTTP 200 状态)或服务器错误 500,将被保留最多 5 天。

步骤二:确认文件可以通过根域名访问
http://domain.com/ads.txthttp://www.domain.com/ads.txt 的重定向相当常见。Ads.txt 的抓取将从根域开始,而根域需要从 ads.txt 文件返回或重定向到 ads.txt 文件。
http://www.domain.com/ads.txt 上的 ads.txt 文件只有在 http://domain.com/ads.txt 重定向到它时才会被抓取。

步骤三:确保抓取操作不被 robots.txt 禁止
(1)如果某个网域中的 robots.txt 文件不允许以下任意 1 项,则抓取工具可能会忽略该网域的 ads.txt 文件,下面我们一起看一个不允许通过 ads.txt 文件路径进行抓取示例。
ads.txt 文件放置在 http://example1.com/ads.txt 上。
http://example1.com/robots.txt 中包含以下行:
User-agent: *
Disallow: /ads
遵守 robots.txt 标准的抓取工具会忽略 ads.txt 文件。
如果遇到此情况,你可以按如下所示修改 robots.txt 文件以允许抓取文件(当然也可以采用其他方法):

选项 1:修改不允许抓取的路径。
User-agent: *
Disallow: /ads/
选项 2:明确允许 ads.txt;取决于抓取工具对 Allow robots.txt 指令的支持情况。
User-agent: *
Allow: /ads.txt
Disallow: /ads
(2)还有一种情况就是不允许针对用户代理进行抓取,下面我们一起看下示范:
ads.txt 文件发布在http://example2.com/ads.txt 上。
http://example2.com/robots.txt 中包含以下行:
User-agent: Googlebot
Disallow: /
Google 抓取工具会忽略 ads.txt 文件。

步骤四:确保返回的文件具备 HTTP 200 OK 状态代码
虽然对 ads.txt 文件的请求可能会在响应正文中返回文件内容,但是如果响应标头中的状态代码指示未找到该文件(例如状态代码 404),则:系统将会忽略该响应或者该文件将会被视为不存在
所以,请务必确保该文件具备 HTTP 200 OK 状态代码。

步骤五:确保文件中没有格式错误或无效字符
格式错误(例如无效的空白字符)可能难以检测,但却会使 ads.txt 文件难以被抓取工具解析,从而可能导致文件被忽略。请避免从富文本编辑器复制和粘贴 ads.txt 条目;推荐大家使用纯文本编辑器。

步骤六:创建通过 HTTP 和 HTTPS 均可访问的 ads.txt 文件
无论在 HTTP 上还是 HTTPS 上,Google 抓取工具都会尝试抓取所有 ads.txt 文件。但是,即使通过 HTTP 对 ads.txt 文件进行抓取,404(或 40X)响应也会导致先前被抓取的条目被完全清除。因此,如果通过 HTTPS 实施的抓取返回 404(或 40X),那么:之前抓取的条目将会被完全清除。
所以需要确保 ads.txt 通过 HTTP 和 HTTPS 均能够被访问。
八、如果只把 ads.txt 文件放在子域名上,会怎么样?
Google 会抓取并强制执行放置在子网域上的 ads.txt 文件(前提是此类文件存在,并且根网域上的 ads.txt 文件引用了这些文件)。ads.txt 管理工具尚无法显示已抓取子网域的列表。
关于ads.txt的用途及使用方式,3z学堂今天就给大家介绍到这里,很多内容也是节选自Google的官方文档,希望这次的分享能帮助到大家,也希望大家的AdSense收入也能进一步提高~欢迎大家留言,共同学习,一起进步!

0

—— 评论区 ——

昵称
邮箱
网址
取消