等你来——为中访在线代言!
中访在线
当前位置: 首页 > 编辑部 > 正文
中访在线内容审核与推荐“九九八十一难”
2021年5月2日 ⁄ admin ⁄ 评论数 0+ ⁄ 已影响 +

中访在线一切以内容为本,坚持在为读者用户提供优质、可读性高的文章的同时做到内容与读者兴趣的高度匹配,打造出更加健康的内容生态。那么,文章在中访在线后台从申请发布到推荐这一关键环节,经历了怎样的“九九八十一难”才精准地呈现在读者面前?这里为您做详细解答。另,一些其他关注率极高的问题,例如:我的文章为什么没有通过审核?为什么我的文章阅读量这么低?如何提高?如何能做到高曝光?等等……您都可以在这里找到答案。

中访在线内容审核不通过

什么样的文章在中访在线不会被审核通过?

一、标题

标题是一篇文章给读者最直观的印象,也是中访在线文章审核判断的第一步,以下所有情况都会影响到审核与推荐,请各位作者慎重:

① 标题含错别字;

② 标题不完整、不通顺;

③ 标题含特殊符号,例如:、、、□、、★、㊣、、、~\(≧≦)/~等;

④ 标题全部英文/外文、含繁体字;

⑤ 标题与内文无关,用词过于夸张,涉嫌标题党吸引流量;

⑥ 标题涉嫌恶俗。恶俗指含有辱骂性质的口头语,如卧槽(我擦/我操/我艹)、傻逼(B)、尼玛、劳资等。

⑦色情低俗/反动违法标题。

二、正文

标题通过审核后,到了审核第二阶段——正文格式和内容。作为衡量一篇文章质量最重要的因素,中访在线绝不容忍任何以下情况的发生。

1.格式结构:

① 全文繁体字、全文英文

② 全文/大段乱码、未分段或无标点

③ 内容不完整或重复(文字/图片)

④ 特殊符号特别多,大段乱码

2.内容:

①不允许发布任何形式的广告

硬广告

文章含有营销购买信息,且广告的对象为单一的某产品或品牌。

铺垫式广告

前面写一大段内容,后面推出某个产品或品牌。

自我营销

账号发自家产品软文或广告

② 低质抄袭

以图片为主体/图文夹杂的文章,3张以下(不含3张),内容不完整/不丰富;

以文字为主体的文章,内容不完整/不丰富,一段内容/五行以下(不含五行);

全文内容以文字截图组成或者以一张长截图(图解内容除外)

③ 推广

 二维码推广、电话号码(热线、公益、事业单位、政府机关除外)、网盘链接、广告图、购物链接等。

④ 严重广告行为

推广文字中含有原油/期货/现货投资交易/沥青/贵金属/黄金白银铜/天然气等词汇的堆砌;

非财经账号,含有财经类推广和联系方式;

推广里含有关注肾健康、男人困扰、男人问题等敏感关键词;

文章正文/文末以文字或者图片形式推广治疗颈椎腰椎病、治疗关节炎、荨麻疹、缩阴、痛经、咽炎,脚气、灰指甲、耳鼻喉疾病、痔疮等;

文章正文/文末推广教授做微商如何引流、微商加好友、微商如何赚钱等且含有大水印图片推广信息;

在正常文章中夹杂玩微盘赚钱\关注“xx”微信或者公众号赚钱、聚力钱锦、XX粥广告、XX膏广告、XX狗粮(馋比乐狗粮等)、懒推宝(lantuibao)、玖紧(久紧)安全套;或文中文末推广买卖流量类;

文章正文/文末/插图水印推 推广佛牌fopai/推广中带有收购、出手、鉴定、交易、买卖关键词/留有个人联系方式;

文章正文/文末/插图水印推广胎儿性别、基因检测/生男生女偏方推广;

文中/文末以文字或者图片形式推广丰胸/治疗脱发、生发/推荐(护肤、祛痘、祛斑、减肥)方法方案/推荐(护肤、祛痘、祛斑、减肥)老师专家顾问个人微信号的;

文末文字/图片含有推广创业导师、销售经验、销售技巧、直销等推广信息的;

文章正文/文末/插图水印有推广非正规渠道办证/麻将扑克作弊技巧/抢红包作弊软件(红包外挂)/买卖收腹衣等推广信息的;

中访在线内容推荐机制大公开

中访在线作者创作的文章,传输到推荐系统后,就进入到随时待命的状态,被机器推荐分发给用户。推荐系统如何将文章,智能地推荐到各个感兴趣的用户面前呢?打个比方,我们把一篇文章比喻为一个包裹,推荐系统就是一个高效的快递员,快递员之所以能将包裹准确地送到用户手中,就是因为他知道用户的住址,并通过精确识别包裹上的地址,送到用户的手中。

一、推荐系统如何识别文章的“地址”呢?

一篇文章,包含了标题、正文、来源等多种信息,这些信息都是文章的重要组成部分。人看到一篇文章,标题是第一印象,读完文章以后,会通过大脑抽象、归纳、解析后,得到的最有价值、最有代表性的信息,形成对这篇文章的记忆和认知。

推荐系统正是通过深度学习人的大脑认知,对文章进行特征的识别,判断文章是什么分类、属于什么领域,提取出该文章最有价值的信息是什么、最吸引人的是什么。也许你已经猜到了,这就是一篇文章的类别、关键词或者标签,这些信息就构成了文章最基本的“地址”。

二、机器是怎么识别这些“地址信息”呢?

首先是充分利用标题中的有效信息。俗话说“题好文一半”,标题既是一篇文章的包装纸,吸引用户点击打开观看里面的内容,又是一篇文章重要信息的提炼展示。机器会充分提取标题中的实体词,用于文章的分类、关键词等特征提取。所以在创作时,既要注意保证标题的吸引力,又要注意不能有太多的不符合常规用法的词。例如村通网、厉害了我的哥等词,对于机器来说,可能存在一定的识别困难,导致它不能从标题中提取有用信息。

尽可能地在标题中使用有意义的实体词,减少语气助词、虚词、数词等,能够让机器更好地理解文章。例如同样一篇讲述明星时尚的文章,“范冰冰杨幂蒋欣也有画错妆的时候,有点惊悚!”这个标题就比“你见过他们画错妆的样子吗?有点惊悚!”体现出了更多文章中的代表性信息,能够让机器更精确得识别文章特征,获得更多的推荐机会。

其次是文章正文中词的频率和性质。一篇文章在机器识别过程中,会被解析成字、词等粒度的语料,系统根据这些字、词的频率和性质,判断文章的特征。与我们人的经验认知一样,一般而言,我们判断一篇娱乐类文章是关于电影新片的报道,往往从字里行间中出现频率较高的明星名字、电影片名、电影专业术语得出结论的,例如周星驰、朱茵、大话西游、翻拍等词。机器也会从文章出现的高频词中,识别这些词并进行判断。

另外,语气助词、虚词、介词等,尽管出现频率较高,但由于这种词在各类文章中都经常出现,机器对这些词会进行特殊处理,不作为文章的关键词。机器提取出关键词后,会将这些词用分类模型等进行分析,选取命中分类词库比例最大的,作为文章的分类标签。例如一篇文章,提取出的关键词是周星驰、朱茵、大话西游、翻拍,那么该文章很有可能同时被打上娱乐、电影、经典电影等类别或标签。

三、哪些用户会接收到你的文章呢?

文章有自己的特征,用户也有自己的特征。推荐系统要做到把文章推荐给对它感兴趣的用户,不进要识别文章的特征,也要对用户有全方位、动态化的认知,只有这样,才能充分了解用户的阅读兴趣。而用户的特征和阅读兴趣,就是机器从大量的数据中分析出来的。

这些数据包括什么呢?

(1)用户的基本信息

性别、年龄、职业、地理位置等;

机型、品牌、账号(包括第三方登录账号)等;

(2)用户直接表明兴趣的行为

关注的栏目

订阅的中访在线

搜索的话题

用户主动反馈的不感兴趣类别、关键词等

(3)智能分析计算得到的用户兴趣偏好

阅读/分享/收藏过的文章分类、关键词等

相似用户的喜好

机器从这些数据中分析用户的兴趣偏好,数据积累得越多,机器对用户的判断准确性越高。也就是说,一个用户产品使用时间越长、点击等行为越丰富,机器越能建立全面立体的用户兴趣模型。

与文章的特征一样,用户的兴趣偏好也有类别、关键词等标签。一个用户既可能有周星驰、吴孟达、梁家辉、iPhone、马云、阿里巴巴等关键词的阅读兴趣,也可能有电影、港台电影、手机、互联网、科技等分类标签兴趣。没有两个用户的标签是完全一样的。

推荐系统的个性化推荐,可以简单理解为这样一个实现过程:当我们识别到某个用户有周星驰、港台电影的兴趣时,我们会在文章中寻找带周星驰或者港台电影标签特征的文章,将这些文章与用户进行智能匹配,实现个性化推荐。

四、其他影响推荐的因素

很容易想到,如果根据上述原理,单纯依赖于文章的分类、关键词标签和用户的分类、关键词标签匹配进行推荐,那么每天在中访在线有数万篇文章被生产,其中相同的分类、关键词标签的文章肯定不少,这些文章难道最终都被推荐给相同的用户、拥有相同的推荐量吗?

当然不是!

我们希望优质的、受欢迎的内容能够被更多用户看到,对于不优质、不受用户欢迎的内容,则尽可能避免推荐资源浪费。因此,在文章生产后,机器会有一个初始投放的过程。在初始投放时,我们将文章推荐给与这篇文章特征最匹配的用户,这些用户由于对文章所在分类、领域等关注度高、感兴趣,他们对文章的质量判断相对而言也具有较好的可信度。这些用户的行为数据反馈,包括点击率、分享数、收藏数、阅读进度、读完率等,对后续的推荐起了非常重要的作用,数据表现越好,被认为文章越受用户欢迎,越有机会获得更多的曝光。

此外,文章还会具有一定的时效性。一篇文章的时效性有24小时、48小时、72小时、一周等。文章的时效性也会影响到推荐的周期和顺序。举个例子,一篇文章刚进入推荐系统时,系统会通过类别、关键词等找最感兴趣的用户1000个,如果这批用户被推荐这篇文章后,点击率很高,系统会认为这篇文章很受用户的欢迎,它将会把文章推荐给更多用户,如果下一轮被推荐的用户仍然表现为对文章很感兴趣、点击率高,那么文章会被再次扩大推荐范围,获得更多的推荐量。

以此类推,只要文章在每一轮扩大推荐保持较好的数据表现,推荐量就会不断扩大,直到过了文章的时效性。

从上述机制,不难发现,想要获得高的推荐量,就必须创作一篇受用户欢迎的文章,来拉动各项数据指标。

(1)好的标题和配图,提升点击率。直接的方法就是创作出吸引人的好标题,设置与文章主旨相符的、引人入胜的好配图。当然,吸引人的标题不能过度创作,变成夸张的标题党,系统对于识别出是标题党的文章,是会打压推荐量的。

(2)文章引人入胜,提高用户阅读时长和读完率。这就要求作者的正文,图文并茂,具有较高的可读性,吸引读者读完文章、较长时间停留在正文阅读页。如果标题很吸引人,用户点击进来发现正文写的不好,会马上跳出页面,这样,用户阅读时间过短,系统会识别为虚假点击,影响文章的数据表现。

(3)观点实用、独到,提高用户的收藏数、分享数、跟贴数。很多用户有分享、收藏的行为,如果文章质量佳、实用性强,用户会自发地收藏或者转发;而文章观点独特、吸引用户跟贴,更能提升文章的数据表现。

(4)内容合规,避免被用户举报投诉、负面评论。我们设置了虚假新闻、低质量、低俗等投诉选项,如果用户投诉达到一定数量,文章将会被系统识别打压;用户评论中如果出现一定数量的负面评论,也会影响文章的推荐量扩大。

(5)保持账号的优质性。我们对账号也会进行质量评级,如果该账号一贯以来,发表的文章产量稳定、质量好、受用户欢迎,那么我们将会在推荐量上给予其下一篇文章的鼓励。当然账号的质量评级是动态进行监控的,如果发现账号最近的文章质量下降了,我们也会取消其原有的质量评定和推荐量激励。

五、文章的数据表现为什么不好?

作者最关心的、同时也是最能影响文章在推荐系统的后续效果的,就是推荐量、点击率这两个数据。有些作者可能对文章的推荐量、点击率表现不好存在疑虑。在这里对这两个数据简单进行解读。

(1)推荐量低

相似文章过多,被去重;同话题文章过多,内容供过于求。很多作者擅长抓住热点加以发挥创作,这样能够吸引主流用户,但由于很多作者都有这个倾向,导致一部分文章集中在某一个话题或者领域,甚至相似度过高,被系统去重。这个很好理解,100篇同话题文章,对应10000个用户,和10篇同话题文章,对应10000个用户,每篇文章的用户获得的推荐量肯定是不一样的。

感兴趣或者潜在用户人数少。推荐系统的机制就是将文章推荐给感兴趣的用户。如果文章涉及的话题、事件过于冷门、晦涩难懂,鲜有用户问津,那么系统能为文章找到的感兴趣用户或者潜在感兴趣用户较少,导致推荐量低。

时效性短。一些文章发布后,受内容或者话题时效性影响,时效性非常短,会影响到推荐量。

内容存在审核和投诉等合规性风险。如果文章不符合审核管控规定,会被审核员认为不可推荐;如果文章过了审核,但推荐过程中被用户投诉或者负面反馈过多,也会被系统下撤停止推荐,影响推荐量。

(2)点击率低

标题吸引力不足。标题对用户无吸引力,文章的点击率自然就不高。

配图不够吸引人。资讯阅读往往是碎片化时间进行,视图表现对吸引用户点击至关重要,如果图片平淡无奇或者图文不符,用户自然失去点击的动力。

文章特征不明显,识别成本高。如果作者发表的文章跟该账号之前的文章类别差别很大,比如一个财经类的账号,发表了一篇体育类文章,对于系统来说,增加了分类的识别成本;如果作者本身发表的文章涉猎广泛,文章的标题和正文能命中类别词库的词也很少,系统提取关键词、识别分类的成本也会很高。这些都会影响推荐效率,从而影响点击率。这就希望作者尽可能地在自己擅长的垂直领域进行专业化创作,保证高水平的点击率。

(来源:中访在线/作者:叶红)

责任编辑:文禾

支付宝

支付宝

微信

微信
中访在线:华语世界互动新媒体

发表留言:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。