El último fallo del noveno círculo de HiQ Labs v. LinkedIn subraya la importancia de sortear los desafíos legales del uso del web scraping para recopilar datos para la investigación académica. Si bien puede estar permitido recopilar información de sitios web disponibles públicamente, los investigadores aún deben tener cuidado con la forma en que diseñan su software de extracción. Por ejemplo, la recopilación de información de perfiles de usuario disponibles públicamente en algunas jurisdicciones puede desencadenar problemas de privacidad, e insta a los investigadores a anonimizar sus datos ya durante la recopilación.

Si bien los aspectos legales de la recopilación de datos web han recibido cierta atención en los últimos tiempos, este no es el único desafío que enfrentan los investigadores y ejecutivos. El uso de interfaces de programación de aplicaciones (API) y raspado para recopilar datos web da lugar a una amplia gama de problemas de validez que, si no se abordan, pueden socavar la calidad de la investigación. Un nuevo artículo en revista de marketing propone un marco metodológico, destinado a mejorar la validez de los datos web, al mismo tiempo que equilibra las cuestiones jurídicas y técnicas.

Si bien los investigadores de mercado utilizan cada vez más los datos web, los desafíos peculiares y, a veces, insidiosos en su recopilación han recibido una atención limitada. ¿Cómo pueden los investigadores asegurarse de que las cantidades de datos generados a través del web scraping y las API sean válidas? Nuestro equipo de investigación desarrolló un nuevo marco que destaca cómo lidiar con problemas de validez requiere una consideración conjunta de cuestiones técnicas y legales/éticas idiosincrásicas.

Nuestro marco cubre la amplia gama de problemas de validez que surgen a lo largo de las tres etapas de la recopilación automática de datos web para uso académico: selección de fuentes de datos, diseño de recopilación de datos y extracción de datos. Cuando discutimos el marco metodológico, ofrecemos un ejemplo de marketing estilizado para ilustración. También brindamos recomendaciones para enfrentar los desafíos que enfrentan los investigadores al recopilar datos web a través de web scraping y API.

Nuestro artículo también proporciona una revisión sistemática de más de 300 artículos que utilizan datos web publicados en las cinco principales revistas de marketing. Con la ayuda de nuestra revisión, desarrollamos una tipología de cómo los datos web han avanzado en el pensamiento de marketing. Comprender la riqueza y la versatilidad de los datos web es invaluable para los investigadores que sienten curiosidad por integrarlos en sus programas de investigación.

Los investigadores interesados ​​pueden acceder a la base de datos desarrollada para esta revisión en nuestro sitio web adjunto en https://web-scraping.org/. Este sitio también contiene recursos y tutoriales útiles adicionales para recopilar datos web a través de web scraping y API.

Finalmente, utilizamos nuestro marco metodológico y tipología para revelar «campos de oro» nuevos y subexplotados asociados con datos web. Nos esforzamos por desmitificar el uso de web scraping y API, facilitando así un uso más amplio de los datos web en toda la disciplina de marketing. Nuestra sección de investigación de futuros destaca formas nuevas y creativas de usar datos web que incluyen la exploración de fuentes infrautilizadas, la creación de conjuntos de datos ricos de múltiples fuentes y el aprovechamiento total de las API más allá de la extracción de datos.

Lee todo el artículo.

De: Johannes Boegershausen, Hannes Datta, Abhishek Borah y Andrew T. Stephen, «Fields of Gold: Scraping Web Data for Marketing Insights» revista de marketing.

Ir revista de marketing

Johannes Boegershausen es Profesor Asistente de Marketing, Universidad Erasmus, Países Bajos.

Hannes Datta es profesor asociado de marketing en la Universidad de Tilburg, Países Bajos.

Abhishek Borah es profesor asistente de marketing en la Universidad de Washington.

Andrew T. Stephen es vicedecano de investigación y profesor de marketing de L’Oreal en la Universidad de Oxford, Reino Unido.



Source link