Web kazıma, örneğin üniversite çalışanlarının adları ve e-posta adresleri veya haber portallarındaki makale başlıkları gibi kamuya açık verileri otomatik bir şekilde toplamaktır. Veriler ne kadar tekdüze bir şekilde sunulursa (örn. sıkı bir şekilde takip edilen bir şablona göre), veri tabanı o kadar "temiz" olur ve bilgiyi düzenlemek için daha az çaba gerektirir.

Veriler genellikle etik olarak şüpheli veya tamamen yasa dışı faaliyetler için kullanıldığından, web kazıma genellikle kaşlarını çattı. Zararlı faaliyetin en basit örneği, e-posta adreslerini kazımak, büyük bir iletişim veritabanı oluşturmak ve ardından spam göndermek (veya daha doğrusu LinkedIn verilerinde olduğu gibi veritabanını ilgili taraflara satmak).