们的链接索引的多年项目进行

Learn, share, and connect around europe dataset solutions.
Post Reply
kexej28769@nongnue
Posts: 227
Joined: Tue Jan 07, 2025 4:41 am

们的链接索引的多年项目进行

Post by kexej28769@nongnue »

在这个用主要链接浏览器取代我了大约 6 个月后,我的任务是解决一个开放式问题:“我们如何知道我们的链接索引是否良好?”自从这篇文章于 2015 年发表以来,我一直在思考这个问题,我知道我不会继续使用除了从 Web 模板开始的系统之外的任何东西,Moz 再次告诉我如何才能“做好”,然后他们让我离开了。与它。


随机性有什么大不了的?
好的随机样本的重要性怎么强调都不为过。让我离题一下 加纳 WhatsApp 数据 假设您看到一项调查,显示 90% 的美国人相信地球是平的。这将是一个可怕的统计数据。但后来你发现这项调查是在地平说会议上进行的,而 10% 不同意的人是会议中心的员工。这完全有道理。问题在于,接受调查的人样本并不是随机的美国人,相反,它是有偏见的,因为它是在地平说大会上采集的。

现在,想象一下网络上同样的情况。假设一家机构想要进行测试以确定哪个链接索引更好,因此他们会查看数百个网站进行比较。他们从哪里获得这些网站?过去的客户?那么他们可能会偏向于 SEO 友好的网站,而不是反映整个网络。点击流数据?然后他们会偏向于流行的网站和页面——同样,这并不能反映整个网络!

从不好的样本开始肯定会得到不好的结果。

但情况变得更糟。像 Moz 这样的索引报告我们的总统计数据(索引中的链接或域的数量)。然而,这可能非常具有误导性。想象一下,一家餐厅声称拥有世界上最多的葡萄酒选择,拥有 1,000,000 瓶葡萄酒。他们可以这么说,但如果他们有 1,000,000 个单一类型,或者只有赤霞珠,或者半瓶,那就没有用了。当你只是抛出大数字时很容易产生误导。相反,最好是从世界各地随机选择葡萄酒,并估计该餐厅是否有库存以及有多少。只有这样你才能很好地衡量他们的库存。衡量链接指数也是如此——这就是我的方法论背后的理论。
Post Reply