正如不精确指出的那样

md.a.z.i.z.ulha.kim4 · Thu Jan 16, 2025 2:47 pm

基向量是线性去相关的。正如他引用的资料所指出的那样，试图将源数据表示为这些基向量的线性组合。这就是向我们展示相关性的方式——通过创建可以线性组合以接近原始数据的基向量。然后我们可以查看这些基向量，看看我们的源数据的各个方面是如何一起变化的，但是因为它只是将它们线性组合，所以它只向我们展示了线性相关性。因此，用于提供对线性相关性的洞察——即使对于非线性数据也是如此。）反驳关于小相关性不被公布的说法认为，小的相关性并不有趣，或者至少因为我们的数据集太小而没有意义。他写道：：“在他们衡量的所有因素中，相关性排名没有一个超过。

在大多数科学领域，相关性如此之低甚至不值得发表。” 学术论文经常会发表这种规模的相关性。在谷歌学术搜索“平均相关系数”的第一页上，我看到：我上面引用的用来反驳加西亚的斯坦福神经病学论文报告的平均相贝宁数字数据关系数为。 “一致性与幸福感测量关系的元分析”一篇被引用超过次的论文，其摘要引用的系数分别为、、和。 “两栖动物是否遵循伯格曼规则”，其中指出“总平均相关系数显著为正（）。 ” 这些论文并非从大量论文中精心挑选出来的。与的建议相反，有趣的相关性的大小因问题而异。对于我们的问题，查看搜索结果中的相关性，除非人们相信有一个主要用来对结果进行排名的因素，并且人们只对该因素感兴趣，否则人们不会期望我们所查看的特征具有任何单一的高相关值。

我们不这么认为。曾多次表示，他们在排名算法中使用了多个特征。我们认为，这使得范围内的相关性相当有趣。）反驳“相关性小就需要更大样本量”的说法：“还请注意，他们发现的最负相关性指标是如此小的数据集上如此小的相关性，甚至不值得发表。” 我们的数据集包含多个查询中的多个结果，这对于我们发现的相关性大小来说已经足够了。相关性较小且数据集较小时的风险在于，可能很难判断相关性是否是统计噪声。通常需要个标准差才能认为结果具有统计显著性。对于提出的特定相关性，从标准误差值可以看出，我们有个置信度标准差，相关性具有统计显著性。

正如 不精确指出的那样

正如 不精确指出的那样

正如不精确指出的那样

正如不精确指出的那样