Est-ce légal de scraper un annuaire ?


#1

Bonjour,

Aucune idée, mais est-ce légal de faire ça ?


Quel langage utiliser pour créer un scrap pour annuaire?
#2

Je vois pas en quoi c’est illégal de récupérer de l’information qu’un annuaire met à disposition en public.
En revanche peut être illégal la façon d’exploiter ces données…


#3

il y a de fortes chances que non. Disons que ca dépend des sites mais la plupart l’interdisent.

Il y a une différence entre parcourir un site en tant qu’humain et le faire via un robot. Beaucoup de sites indiquent dans leurs CGU que vous n’avez pas le droit de crawler leur site. Parfois c’est un peu caché derrière des termes comme “dans les limites d’une utilisation normale” ou des formulations un peu étranges.

Bien souvent les sites restent tolérant, ils se contentent de bannir l’IP. Mais bon, certains peuvent signaler à vos fournisseurs ou aller plus loin.


#4

Il me semble avoir lu que linkedin avait poursuivi des gens pour avoir fait du scraping. C’est l’interdiction est claire chez eux : https://www.linkedin.com/help/linkedin/answer/56347?lang=en

Comme le dit @hlassiege, c’est peut-être bien de d’abord se référer au CGU, et d’y aller molo.


#5

Normalement c’est interdit sauf si c’est explicitement autorisé. Techniquement tu peux toujours mais attention au système de détection du genre ils introduisent de fausses données qui permettent de prouver que ça vient de chez eux. En tout cas en France c’est pas normalement prudent vu que les entreprises font la loi.

Mais récemment aux Etats-Unis une startup a attaqué Linkedin (Microsoft) pour pratique anti-concurrentielle et le juge a jugé en sa faveur : linkedin doit maintenant autoriser le webscraping de ses données en première injonction (linked va faire appel de cette décision) https://www.theverge.com/2017/8/15/16148250/microsoft-linkedin-third-party-data-access-judge-ruling


#6

Google s’en prive pas…