Qu’est-ce que c’est ?
Le big data représente une telle quantité de données qu’ils dépassent les capacités humaines d’analyses. Pour manipuler des big data il faut donc utiliser des outils informatiques spécialement adapté.
Le but des big data est de récupérer le plus de données possibles.
Quels types de données et qui récupère ces données ? Absolument tout et tout le monde : les mails, les recherches en utilisant un moteur tel que Google, les conversations téléphoniques, les messages…
Dans quel objectif ?
Plusieurs objectifs sont visés. Un objectif simple serait d’éduquer une intelligence artificielle, puisque pour que celle-ci fonctionne il lui faut énormément de données. Par exemple, si on récupère des millions de photos de chat, et qu’on montre ces photos à l’intelligence artificielle en lui disant « ceci est un chat » sans qu’elle n’ai la moindre idée de ce que c’est encore. L’intelligence artificielle va analyser et créer sa propre vision de ce qu’est un chat avec les photos.
Ceci est possible avec n’importe quel type de données : des vidéos, des bandes sons…
Un autre objectif visé est la vente : on peut réussir à situer les goûts d’un potentiel acheteur à l’aide de ces recherches sur Internet. Si par exemple une personne commence à réaliser des recherches concernant un ordinateur, il serait peut-être judicieux de lui proposer une souris.
Certaines données sont publiques (on les appelle « les open data »), et peuvent être consultées directement sur Internet, par exemple sur le site https://www.data.gouv.fr/