16 octobre 2018 | Big Data | Nicolas Tiraboschi

Initiation au web scraping avec Scrapy

Le web scraping… Kézako ? Vous en avez sûrement déjà entendu parler (et peut-être fait ?), il s’agit de parcourir des pages web pour récupérer de la data et l’utiliser dans un autre contexte. Les cas d’usages peuvent être nombreux : faire un historique sur les prix de composants informatiques, réaliser un aggrégateur de petites annonces, effectuer du référencement de sites web, etc. Pour ce faire, nous allons utiliser le langage Python ainsi qu’un framework appelé Scrapy. > Continuer la lecture
25 septembre 2018 | DevOps | Kevin Davin

Jib - Construire mon image docker sans docker

banner

Et si on simplifiait la création de container Docker dans la phase de développement ?

Vous en avez assez de lancer la commande docker, on va voir comment s’en passer dans votre travail quotidien en utilisant Jib.

On va partir d’une simple application Spring Boot et configurer Maven pour vous permettre de construire une image compatible Docker (et cela sans Docker !)

> Continuer la lecture
12 août 2018 | UX | Theo Cadoret

Améliorer la « Learnability » en injectant des propriétés physiques dans ses interfaces

En tant qu’UX/UI designer, si nos utilisateurs doivent avoir recours à un manuel ou n’importe quelle sorte de documentation pour interagir avec notre application, la partie est déjà perdue. Sur le web et ailleurs, les solutions concurrentes sont légion, la moindre barrière à l’utilisation de votre produit conduira naturellement les utilisateurs finaux vers celles-ci. Le besoin d’un manuel, tutoriel, didacticiel ou toutre autre documentation est une barrière. C’est pourquoi la « Learnability » est une composante essentielle de toute interface et une attention toute particulière doit lui être donnée si vous voulez vous différencier et fidéliser vos utilisateurs.

> Continuer la lecture
6 juillet 2018 | Kubernetes | Arnaud Tournier

Comment déployer un cluster JBoss hautement disponible sur Kubernetes - partie 1

Il y a des applications vraiment faciles à mettre à l’échelle sur Kubernetes, comme ces serveurs Web très simples qui ne font que se connecter à des bases de données répliquées ou des services externes puis qui ajoutent une fine couche de traitement métier.

Cependant parfois, certains applicatifs sont plus difficiles. Nous allons explorer le déploiement d’un cluster JBoss sur Kubernetes. Nous configurerons notre déploiement afin de bénéficier des fonctionalités de clustering de JBoss (état partagé, distribution des EJB…) et des avantages liés à Kubernetes (élasticité du cluster, auto-healing, monitoring etc).

Grâce à cela, nous obtiendrons un cluster JBoss HA élastique sur Kubernetes. Ceci est parfait pour porter votre applicatif Java EE sur le cloud (qu’il soit public, privé ou même hybride !).

> Continuer la lecture
15 juin 2018 | BigData | Chabane Refes

Les 10 clés pour optimiser vos jobs Spark

(5 min read)

Beaucoup de développeurs passent le plus clair de leur temps à essayer d’optimiser leurs jobs Spark. En effet, on pense parfois qu’augmenter les ressources mémoires/CPU, le nombre de partitions ou mettre en cache les données permet d’améliorer les performances. Si vous faites cela et que ça ne marche pas toujours ou si ça marche mais que vous ne savez pas pourquoi, voici dix clés incontournables pour optimiser vos jobs Spark et comprendre ce qui se passe sous le capot.

> Continuer la lecture
Articles plus anciens