政策网页抓取

Learn, share, and connect around europe dataset solutions.
Post Reply
asimj1
Posts: 125
Joined: Tue Jan 07, 2025 4:43 am

政策网页抓取

Post by asimj1 »

总体而言,人文学科可以从网络抓取中获益良多。研究通常受到数据量和无法在其中搜索的严重限制。只要来源已经数字化,抓取就可以解决这两个问题。

然而,网络抓取可以让科学更进一步。经济学家们已经考虑网络抓取一段时间了,正如 的文章“利用互联网数据进行经济研究”发表在《经济展望》杂志上。他甚至提到了抓取数据。

可能性是无穷无尽的。城市经济学家可以通过抓取可用 玻利维亚电话号码数据 的餐馆、酒吧和其他娱乐场所的数据来衡量城市和地区的繁荣程度,并添加每月评论量增量来反映经济活动。

宏观经济学家可以使用大型在线零售商或电子商务网站的数据来衡量对特定国家地区价格的影响。行为经济学家可以从以不同条件(例如,产品价格更高、运费更低)销售同一商品的市场收集数据,以估计特定因素可能对非理性行为者产生的影响。

这些例子甚至还不足以详尽阐述经济学研究。其他社会科学(例如社会学)从网络抓取中获益更多。

网络上散布的信息至少可以揭示有趣的见解。例如, 网络安全公司通常使用网络抓取来查找各种犯罪行为(如在线版权侵权)。另一方面,网络抓取可用于向公众和政府通报系统性滥用行为。美国公共诚信中心使用网络抓取创建了“复制、粘贴、立法”——一款可以揭露有影响力的企业和特殊利益集团可能在哪些地方向立法者施压,要求他们出台不公平立法的工具。一个类似的项目, 马诺洛,追踪访问秘鲁政府实体的游说者。
Post Reply