Astronomical measurements for a microscopical humanity


Aujourd’hui, à l’ère du tout numérique, un nouvel objet a fait son entrée dans nos vies, l’algorithme. Ce millénaire avance très vite, tout change constamment. Hier nous percevions le progrès comme linéaire, mais ce n’était que le tout début d’une exponentielle et nous nous retrouvons soudainement au point d’inflexion de la courbe. Au cours des dernières décennies, la révolution numérique a changé presque tous les aspects de notre vie. Le rythme du progrès informatique s’est accéléré et, aujourd’hui, nos cerveaux ont tendance à anticiper le futur de manière linéaire plutôt que de façon exponentielle. Ainsi, les années à venir vont nous fournir des technologies plus puissantes plus rapidement que nous ne le pensons.

[** Qu’est-ce qu’un algorithme dans le monde numérique ?*]

Les chercheurs et les spécialistes définissent un algorithme comme une recette : une suite d’instructions menant à un résultat, qu’il s’agisse d’un chiffre, d’une corrélation, d’un classement page Web à afficher ou de règles à appliquer pour piloter une voiture sans chauffeur. L’algorithme opère un ensemble de calculs à partir de gigantesques masses de données, les [**big data*]. Il hiérarchise l’information, devine ce qui nous intéresse, sélectionne les biens que nous préférons et s’efforce de nous suppléer dans de nombreuses tâches. Nous fabriquons ces programmes mais en retour ils nous construisent.

Olécio partenaire de Wukali

Il ne se passe pas une journée sans que nous n’entrions en interaction avec un algorithme, bien souvent sans que nous en soyons conscients. Il est peu de gestes quotidiens, d’achats, de déplacements, de décisions personnelles ou professionnelles qui ne soient orientés par une infrastructure de calculs. A mesure qu’augmentent l’interconnexion et la capacité de traitement des systèmes informatiques, les algorithmes deviennent de plus en plus importants dans les processus de décision.

Ils permettent de classer des informations (moteur de recherche), fixer un prix de billet d’avion (yield management), répartir des élèves ou des étudiants dans un lycée ou dans une université (Affelnet, APB), identifier les acheteurs potentiels d’un produit (ciblage publicitaire), détecter une fraude bancaire ou encore cerner les mauvais payeurs, etc.

Le point commun de ces différents usages des algorithmes est d’influencer nos vies, nos choix. Ils ont un impact sur nos achats, nos capacités à obtenir un prêt, nos candidatures à un emploi, etc. Les algorithmes chiffrent le monde, le classent et prédisent notre avenir.
Invisibles, ces calculs restent pour nous mystérieux. Ils orientent des décisions, appareillent des processus automatiques et justifient des choix politiques, mais nous nous interrogeons rarement sur la manière dont ils ont été élaborés. Nous regardons leurs effets sans comprendre leur fabrication.

[**L’algorithme de Google, arbitre de la présidentielle américaine ?*]

Si Google le voulait, il pourrait faire élire le président de son choix, juste en modifiant l’algorithme de son moteur de recherche. C’est **Robert Epstein,*] chercheur en psychologie américain au sein de l'[**AIBRT,*] l’institut américain en recherche comportementale et technologie, qui l’écrit dans une tribune publiée par le site Politico. « Jamais une seule entreprise n’a eu autant de pouvoir pour contrôler les opinions et les croyances« , écrit-il. « Le moteur de recherche de Google peut facilement faire changer les préférences de vote de 20% d’électeurs indécis, et même jusqu’à 80% dans certains groupes démographiques, [sans que personne ne puisse s’en rendre compte« .(Cliquer)

Des chercheurs américains ont fait une découverte qui inquiète: il y aurait un « effet de manipulation des moteurs de recherche« . Dans leur étude, ils pointent du doigt l’influence que pourrait avoir l’algorithme de Google sur l’issue de l’élection présidentielle. (Cliquer)

L’algorithme fonctionne comme une boîte noire selon l’expression du professeur de droit américain[** Frank Pasquale*]. On sait ce qui entre dedans : ce sont nos données (nos requêtes, nos informations personnelles), on sait ce qui en sort : c’est une technologie qui nous rend service (un prix, une suggestion, un classement), mais on ignore tout de ce qui se trame à l’intérieur, notamment en raison du secret commercial. Ainsi notre relation avec les gestionnaires de ces programmes, à commencer par les [**GAFA *] [**(Google, Apple, Facebook, Amazon)*], est totalement déséquilibrée car ils connaissent nos moindres faits et gestes, mais personne ne peut savoir ce qui se passe à l’intérieur. Le fonctionnement des algorithmes est un secret bien gardé. Plus les individus sont transparents, plus ceux qui les observent sont opaques.

Ce qui se passe en 1 minute sur Internet dans le monde a de quoi donner le vertige. La preuve en image. Le volume des données double tous les deux ans. Aujourd’hui peu de données sont analysées. D’ici 2020, 33% de ces données seront triées et analysées par des algorithmes

Les algorithmes ont pris le pouvoir depuis longtemps. L’algorithme de [**Google*] nous guide et définit ce que nous pensons, celui de[** Facebook*] choisit nos amis et définit qui nous sommes et l’algorithme d’[**Amazon*] définit ce que nous voulons, il nous propose par exemple, sans que nous n’ayons rien demandé, des livres susceptibles de nous plaire. Nous pouvons aussi inclure les algorithmes de la finance, qui définissent ce que nous possédons. Et que dire de l’algorithme de[** Netflix  *] qui analyse le comportement de plus 80 millions d’utilisateurs, dont la série House of Cards a été la première série créée en partie grâce au big data. Le succès de cette première création originale a prouvé que Netflix “savait avant les téléspectateurs ce qu’ils voulaient regarder”.

[(L’algorithme [**PageRank*] de Google, le plus sollicité avec [**3,45 milliards de requêtes*] chaque jour, administrerait quotidiennement 24 petaoctects de données, soit l’équivalent de mille fois la quantité de documents conservés par la plus grande bibliothèque du monde, celle du Congrès américain. C’est ainsi que [**Google, Apple, Facebook *] et[** Microsoft*] détiennent [**80% des informations personnelles numériques *] de l’humanité. )]

[**À l’heure des objets connectés et des réseaux sociaux, votre comportement est traçable 24h/24, 7j/7. De quelle manière ?*]

Par exemple, lorsque vous affichez une photo sur Facebook sur laquelle vous fumez une cigarette, ou encore envoyez un dernier tweet à 3h du matin en pleine semaine, et même vos pas enregistrés par votre smartphone se comptent sur les doigts d’une main. Toutes ces données constituent un terreau fertile pour les assurances. “La possibilité d’utiliser les données pour développer des algorithmes de prédiction des risques est au cœur de notre business« , a estimé un membre du fonds d’[**Axa *] pour la recherche, lors de la journée « Science of data». Le big data pourrait devenir la clé de voûte du métier de l’assureur qui consiste à évaluer le risque et à optimiser le rapport « rendement-risque ».

[([**Carburant d’internet*]

Selon l’[**ADEME*] (l’Agence de l’Environnement et de la Maîtrise de l’Energie), envoyer un email avec une pièce jointe de 1 Mo nécessite 24 wattheures (c’est-à-dire une ampoule allumée pendant une heure). Sans pièce jointe c’est en moyenne 5 wattheures. Aujourd’hui chaque heure 9 milliards d’emails sont envoyés. C’est-à-dire [**l’équivalent de la production électrique de 15 centrales nucléaires de 300 Mégawatts pendant une heure. *] )]

Avec l’explosion du nombre d’objets connectés, les algorithmes brassent de plus en plus de données, ce qui accroît leur efficacité. Selon le [**cabinet Gartner*], le nombre d’objets connectés en usage dans le monde devrait atteindre[** 6,4 milliards en 2016*] et, d’ici [**2020*], atteindre [**21 milliards.*] Les algorithmes eux-mêmes, conçus par des mathématiciens ultra-pointus, deviennent chaque jour plus sophistiqués au point d’être désormais capables de se perfectionner de manière autonome, c’est ce qu’on appelle en termes techniques «machine learning » ou « intelligence artificielle ».

L’algorithme apprend en comparant un profil à ceux d’autres internautes qui ont effectué la même action que lui. De façon probabiliste, il soupçonne qu’une personne pourrait faire telle ou telle chose qu’elle n’a pas encore faite, à travers le profil de personnes qui lui ressemblent et qui l’ont déjà faite. Le futur de l’internaute est prédit par le passé de ceux qui lui ressemblent. Il s’agit désormais de calculer le profil de l’utilisateur à partir des traces de ses activités, en développant des techniques d’enregistrement qui collent au plus près de ses gestes.

[**Les algorithmes prédictifs *]

Une affaire rapportée par le [**New York Times*] a défrayé la chronique en 2014. Le père d’une adolescente s’en est ouvertement pris à une chaîne de magasins, qui envoyait à sa fille des publicités pour des produits destinés aux jeunes mères. Il leur reprochait de l’inciter ainsi à avoir un enfant. Quelque temps plus tard, il se fend d’un mot d’excuses, sa fille était effectivement enceinte et le magasin l’avait simplement découvert avant elle. Comment ? Sa navigation sur le site du magasin correspondait au profil type des centres d’intérêt d’une femme enceinte tel que l’entreprise l’avait déterminé en analysant les comportements en ligne de ses clientes. Alors qu’elle ne savait pas elle-même qu’elle attendait un enfant, ses besoins montraient qu’elle était enceinte. La marque américaine de distribution [**Target*] cherche à identifier les femmes enceintes, dans l’objectif de leur proposer avant l’accouchement des produits pour nouveau-nés. Un système traite des masses d’informations récoltées via les navigations Internet, l’usage des cartes de crédit ou de fidélité, et repère des corrélations à valeur significative. Par exemple, l’ouverture d’une liste de cadeaux dédiée à la naissance et parallèlement l’achat d’une crème sans parfum conseillée dès le quatrième mois de grossesse, ou de certains compléments alimentaires appropriés aux différents stades, établiront par recoupement un diagnostic automatisé.

Par exemple, les adresses et données d’une femme enceinte se vendent 250€ le pack de 1000 on appelle cela du [**data mining.*]

Ces données sont également le carburant d’un club plus secret, celui des sociétés de reciblage, telles[** Criteo, Meteora, Struq, myThings, AdRoll*]. Ces entreprises connaissent potentiellement tout de nous car elles passent leur temps à brasser statistiquement des milliards de données en ligne qui résument une bonne partie de notre vie. Leur but est de nous comprendre le plus possible afin de nous envoyer le bon message publicitaire au bon moment. Si, un beau un matin, vous regardez une montre en ligne, c’est ce type d’entreprise qui est responsable de la réapparition tout au long de la journée, de cette même montre sur votre écran, jusqu’à ce qu’enfin vous succombiez à la tentation en cliquant sur le lien proposé. Pour être plus efficace dans la manière de nous accrocher, le français Criteo a recruté ces dernières années quatre cents ingénieurs qui conçoivent des algorithmes pour saisir au mieux les signaux faibles de nos comportements.

Les nouveaux systèmes publicitaires sur le web sont des automates qui fonctionnent sur la base d’un système d’enchères en temps réel. Pendant que l’intemaute charge la page web qu’il désire consulter, son profil est mis aux enchères par un automate afin que des robots programmés par les annonceurs se disputent le meilleur prix pour placer leur bandeau publicitaire. L’opération dure moins de [**100 millisecondes*]. Le profil mis aux enchères n’est pas un portrait type du marketing traditionnel. Les informations livrées aux robots des annonceurs sont les traces des navigations antérieures de l’internaute que des cookies ont enregistrées. A la vitesse de l’éclair, les robots des annonceurs vont proposer un prix d’achat en estimant la probabilité que l’internaute clique sur le bandeau publicitaire à partir des données d’activités d’autres internautes.

Certaines des corrélations peuvent être beaucoup plus inattendues et ne sont souvent que des variables cachées, d’autres facteurs qui ne sont pas dans les données. Les assureurs, par exemple, auraient constaté dans les données d’achat de leurs clients que ceux qui achetaient des feutres à placer sous les pieds de table et de chaise, pour ne pas rayer leur parquet, avaient un comportement automobile très prudent et qu’ils pouvaient sans risque leur proposer une réduction de prime. Ce calcul n’est pas individuel. Il n’est possible que parce qu’il existe un très important volume de comportements d’achat.

Les algorithmes orientent la navigation de millions d’internautes et restent souvent bien obscurs pour le commun des mortels. Ils structurent tellement notre environnement qu’ils imposent des espaces que nous ne choisissons pas et que nous ne discutons pas suffisamment. C’est ainsi que nous nous retrouvons prisonniers d’une boîte noire qui nous a capturés.

[**Finance*]

Les programmes de trading haute-fréquence exécutent jusqu’à [**1.000 transactions par seconde*] pour faire gagner de l’argent aux traders. Au risque de provoquer un krach boursier, comme celui du 6 mai 2010, la Bourse de New York s’est effondrée brièvement, faisant disparaître près de 1000 milliards de dollars. Les gendarmes américains de la Bourse ont rendu leur rapport sur cet évènement inédit. En cause, un algorithme.

[([**Le marketing et la publicité axés sur la donnée génèrent plus de 150 milliards $ par an.*]

Depuis 2010 l’humanité produit autant d’information en deux jours qu’elle n’en a fait depuis l’invention de l’écriture il y a 5300 ans et 98% de ces informations sont consignées sous forme numérique. Si 70% des données sont générées par des individus connectés, ces sont les entreprises privées qui les exploitent. C’est ainsi que Google, Apple, Facebook et Microsoft détiennent 80% des infos personnelles numériques de l’humanité. C’est-à-dire le nouvel or noir. Le chiffre d’affaire du Big Data en 2016 devrait dépasser les 24 milliards $. Les GAFA (Google, Apple, Facebook, Amazon), ont réussi en dix à conquérir l’ensemble du monde numérique. On les appelle les sociétés du 7ème continent.
)]

Les algorithmes se proposent d’automatiser ce que nos vies comportent de mécanique, de fonctionnel et de statistique. Dans les activités complexes, les habiletés manuelles ont été transférées vers les machines. Les pilotes d’avion ne conduisent plus vraiment les avions mais les surveillent. Les architectes ne font plus de dessins à la main, mais modélisent directement en 3D. Les algorithmes de détection visuelle sont en train d’apprendre à lire les radiographies et les IRM que valideront ensuite les médecins. [**Face à ces grands systèmes techniques qui capturent nos habiletés, il devient nécessaire d’apprendre à ne pas désapprendre.*]

[**Santé*]

Neuf jours avant que la propagation d’**Ebola*] soit officiellement déclarée par l’OMS le 23 mars 2014 comme étant une épidémie, un groupe de chercheurs et de spécialistes informatiques à Boston avait déjà remarqué la diffusion du virus de la fièvre hémorragique en [**Guinée*]. En épluchant les réseaux sociaux, les bulletins d’information locaux et d’autres bases de données, l’algorithme développé par la société [**Healthmap*] aurait rapidement détecté la propagation d’une « mystérieuse fièvre hémorragique » en [Afrique de l’Ouest.(Cliquer)

Alors que les technologies numériques régissent de plus en plus nos activités et modifient jusqu’au cadre de la cognition humaine, elles n’ont pas fait l’objet, jusqu’à présent, d’examens éthiques à la mesure de leur puissance d’influence indéfiniment croissante.

« Le vieux monde se meurt, le nouveau monde tarde à apparaitre, et dans ce clair-obscur surgissent les monstres »[** Antonio Gramsci*].

Fitzgerald Craigavon


WUKALI 09/07/2016
*Courrier des lecteurs *] : [redaction@wukali.com

Ces articles peuvent aussi vous intéresser