11 août 2019 | Revue de Presse | RDP

Revue de presse du 12 aout 2019

Temps de lecture estimé : 4 minutes

Petite lecture de plage 🏖avec cette dernière revue de presse. Toutes les news et les articles que nous nous sommes partagés en interne ce mois-ci sont condensés dans cet article. En bonus, nous vous proposons 2 livres que nous avons retenus. Bonne lecture et bonnes vacances à tous !

> Continuer la lecture
15 novembre 2018 | Big Data | Pascal Gillet

Ingestion de données: État de l'Art

Temps de lecture estimé : 15 minutes

L’ingestion de données consiste à extraire, transformer et charger de grands volumes de données à partir de diverses sources, telles que des bases de données, des API, des serveurs FTP / SFTP, des fichiers, etc., dans un lac de données (Data Lake en anglais).

“Data Lake” est un terme apparu au cours de cette décennie pour décrire un élément important du pipeline d’analyse de données dans le monde du Big Data.

> Continuer la lecture
16 octobre 2018 | Big Data | Nicolas Tiraboschi

Initiation au web scraping avec Scrapy

Temps de lecture estimé : 4 minutes

Le web scraping… Kézako ? Vous en avez sûrement déjà entendu parler (et peut-être fait ?), il s’agit de parcourir des pages web pour récupérer de la data et l’utiliser dans un autre contexte. Les cas d’usages peuvent être nombreux : faire un historique sur les prix de composants informatiques, réaliser un aggrégateur de petites annonces, effectuer du référencement de sites web, etc. Pour ce faire, nous allons utiliser le langage Python ainsi qu’un framework appelé Scrapy. > Continuer la lecture