El archivado web es el proceso de recolección de fracciones o partes de la World Wide Web y la garantía de que la información se conserve en un archivo o sistema de información para futuros investigadores, historiadores y el público en general.[1] En este proceso se suelen emplear rastreadores web para la captura automatizada debido al enorme tamaño y cantidad de información en la web. La organización de archivado web más grande es Wayback Machine, la cual se basa en un enfoque de rastreo masivo para tratar de mantener un archivo de toda la web.
Debido a la creciente porción de la cultura humana creada y registrada en la web, las bibliotecas y los archivos reconocen al archivado web como una parte esencial de sus prácticas.[2] Las bibliotecas nacionales, los archivos nacionales y varios consorcios de organizaciones participan en el archivado de contenido web culturalmente importante.
También existe software y servicios comerciales de archivado web para las organizaciones que necesitan archivar su propio contenido web con fines normativos, legales o de herencia corporativa.