正如 不精确指出的那样

Learn, share, and connect around europe dataset solutions.
Post Reply
md.a.z.i.z.ulha.kim4
Posts: 145
Joined: Tue Dec 24, 2024 8:45 am

正如 不精确指出的那样

Post by md.a.z.i.z.ulha.kim4 »

基向量是线性去相关的。 正如他引用的资料所指出的那样, 试图将源数据表示为这些基向量的线性组合。这就是 向我们展示相关性的方式——通过创建可以线性组合以接近原始数据的基向量。然后我们可以查看这些基向量,看看我们的源数据的各个方面是如何一起变化的,但是因为它只是将它们线性组合,所以它只向我们展示了线性相关性。因此, 用于提供对线性相关性的洞察——即使对于非线性数据也是如此。 )反驳关于小相关性不被公布的说法 认为,小的相关性并不有趣,或者至少因为我们的数据集太小而没有意义。 他写道: :“在他们衡量的所有因素中,相关性排名没有一个超过 。


在大多数科学领域,相关性如此之低甚至不值得发表。” 学术论文经常会发表这种规模的相关性。在谷歌学术搜索“平均相关系数”的第一页上 ,我看到: 我上面引用的用来反驳加西亚的斯坦福神经病学论文报告的平均相 贝宁数字数据 关系数为 。 “一致性与幸福感测量关系的元分析”一篇被引用超过次的论文,其摘要引用的系数分别为、、和。 “两栖动物是否遵循伯格曼规则”,其中指出“总平均相关系数显著为正()。 ” 这些论文并非从大量论文中精心挑选出来的。与 的建议相反,有趣的相关性的大小因问题而异。对于我们的问题,查看 搜索结果中的相关性,除非人们相信 有一个主要用来对结果进行排名的因素,并且人们只对该因素感兴趣,否则人们不会期望我们所查看的特征具有任何单一的高相关值。


我们不这么认为。 曾多次表示,他们在排名算法中使用了 多个特征。我们认为,这使得 范围内的相关性相当有趣。 )反驳“相关性小就需要更大样本量”的说法 :“还请注意,他们发现的最负相关性指标是如此小的数据集上如此小的相关性,甚至不值得发表。” 我们的数据集包含 多个查询中的 多个结果,这对于我们发现的相关性大小来说已经足够了。相关性较小且数据集较小时的风险在于,可能很难判断相关性是否是统计噪声。通常需要 个标准差才能认为结果具有统计显著性。对于 提出的特定相关性,从标准误差值可以看出,我们有 个置信度标准差,相关性具有统计显著性。
Post Reply