Les données massives : une ressource publique

Plusieurs modèles d’affaires associés aux technologies numériques reposent en tout ou en partie sur l’utilisation généralement sans contrepartie de données circulant dans les espaces connectés. Par exemple, pour développer ses technologies de reconnaissance faciale ClearviewAi a aspiré des milliards d’images disponibles en ligne afin de constituer une base de données. C’est vrai pour les données personnelles mais aussi pour d’autres unités d’information. George R.R. Martin, l’auteur de la saga Game of Thrones, et d’autres écrivains ont lancé des poursuites contre la start-up californienne OpenAI, qu’ils accusent d’avoir utilisé leurs oeuvres pour alimenter ChatGPT au mépris de leurs droits d’auteur. Ils ne sont pas les seuls à s’inquiéter de cet accaparement de la valeur des données qui circulent dans l’espace connecté.
Les réseaux sociaux, les dispositifs de reconnaissance faciale de même que les applications d’intelligence artificielle générative fonctionnent grâce à la disponibilité de gisements de données se retrouvant dans les espaces numériques. Plusieurs de ces données sont licitement dans le domaine public. Par exemple, les textes et images qui circulent légitimement pour informer le public. Ces ressources émanent de l’ensemble des individus connectés. Une fois massifiées (pour devenir des données massives, des « Big Data »), elles révèlent souvent très peu sur un individu en particulier mais elles alimentent des plateformes qui peuvent par exemple, détecter ce qui capte l’attention ou encore l’état de la circulation dans une rue.

Ce contenu a été mis à jour le 10/03/2023 à 9:12 AM.