Un article à lire en entier pour bien en retirer toute la substantifique moëlle.
Et hélas, on a de plus en plus de grosses études, avec des gros effectifs et des longues années de recul qui viennent nous mettre sous le nez les unes après les autres ce résultat dérangeant : la plupart de nos stratégies de dépistages précoces des cancers ne sauvent pas de vie.
Et croyez le bien, ça ne me réjouit pas plus que vous.
...
Les failles sont les suivantes :
1/ Les examens préliminaires peuvent se tromper (souvent) et occasionner des complications (rarement).
2/ Les examens de confirmation peuvent se tromper (plus rarement) et occasionner des complications (plus souvent).
3/ Les cancers peuvent guérir tout seul ou évoluer tellement lentement qu’on mourra d’autre chose avant qu’ils ne se manifestent.
4/ Les traitements proposés pour les cancers peuvent occasionner des complications (très souvent), qui peuvent être graves (souvent) voire mortelles (rarement).
5/ Nos outils pour mesurer l’impact et le bénéfice d’un dépistage sont bourrés de failles eux-aussi.
...
La vraie question qui nous intéresse va dans l’autre sens, c’est : « Si le test dit que je suis malade, est-ce qu’il a raison ? ». Et ce n’est pas du tout la même question.
Juste cette illustration résume une bonne partie du problème : http://www.jaddo.fr/wp-content/uploads/2016/03/vpp-vpn1.png
Et encore là, on parle d'un test hypothétique, super balaise, fiable à 90%. Vous voyez les dégâts ? Ben imaginez avec les vrais tests. Moins fiables.
Le solde migratoire (Déf. : http://www.insee.fr/fr/methodes/default.asp?page=definitions/solde-migratoire.htm) a baissé entre 2006 et 2013. Ben alors ? Il est où le grand remplacement ?
Mention spéciale au Figaro, qui réussit à dire juste l'inverse de ce que dit l'INSEE : http://www.lefigaro.fr/vox/societe/2015/10/13/31003-20151013ARTFIG00238-rapport-de-l-insee-21-d-entrees-d-immigres-entre-2009-et-2013.php (en faisant son titre sur l'augmentation des entrées d'immigrés, et passant sous silence le nombre de départs supérieurs)
Un article complémentaire du précédent : les données brutes ne servent à rien, il faut les trier, les contextualiser et les mettre en perspective.
Exemple de piège statistique : le paradoxe de Simpson.
D'oh ! (désolé, je n'ai pas pu m'en empêcher)
Qu'est ce que le paradoxe de Simpson (ou Yule-Simpson, mais c'est moins rigolo) ? C'est lorsque les succès d'un groupe s'inversent une fois ces derniers combinés. (Cf. https://fr.wikipedia.org/wiki/Paradoxe_de_Simpson)
=> "Avant de se creuser la tête pour imaginer d'éventuelles causes [...] le bon réflexe serait peut-être d'essayer de voir si une segmentation des résultats existe." : quand on observe le détail d'un test/sondage, on parle en valeurs absolues, plus en pourcentage. Du coup, les échantillons comparés deviennent inégaux, d'où le paradoxe.
"Quelques conseils pour détecter ces paradoxes :
=> ne jamais s'arrêter aux pourcentages dans les comparaisons, mais prendre également les chiffres bruts, quitte à les demander directement à la source
=> si des échantillons de taille très différente apparaissent, essayer de les segmenter autour d'une variable de confusion (la taille des calculs pour le traitement médical, l'âge des répondants pour l'étude sur les malaises cardiaques, etc...) pour vérifier si oui ou non on est face à un paradoxe de Simpson
=> ne jamais s'interdire une contextualisation des données que l'on traite"
"Hum, croire que les scientifiques sont forcément des gens sérieux expose à beaucoup de déconvenues, et puis on peut être sérieux et se tromper… "
"Ce ne sont pas des vrais morts ; ce sont des morts statistiques."
via Tommy et Seb
EDIT : et je découvre le concept de Biais protopathique : distorsion de l’estimation de l’association entre la prise d’un médicament et la survenue d’un effet indésirable liée au fait que le début de l’exposition à un facteur de risque (par exemple, un traitement médicamenteux) est, en fait, postérieur à la survenue de l’événement ou tout au moins à celle de ses premières manifestations. Dans une forme plus restrictive (biais lié à la maladie, disease confounding), la prise ou la prescription du médicament peut même être motivée par l’apparition des premiers symptômes de la maladie. Par exemple, un médicament cardiovasculaire peut être accusé, à tort, de provoquer des fibroses pulmonaires s’il est fréquemment prescrit dès l’apparition d’une dyspnée d’effort qui constitue, en fait, le premier signe d’une fibrose débutante. voir : biais d’indication.
Source : Dictionnaire de Pharmaco Epidémiologie Bernard Bégaud, Arme-Pharmacovigilance Editions 1998 http://www.arme.u-bordeaux2.fr/armep_doc/livre_dictionnaire_9798.pdf
Ce ne sont pas "que des statistiques" :l'origine sociale influence le prénom donné par les parents, et surtout, les chances de réussite scolaire.
Le site dont il est question : http://coulmont.com/bac/
Excellent complément à ce que je disais ce matin : http://sammyfisherjr.net/Shaarli/?3wu8rw Forcément, quand une industrie veut communiquer, elle prend les chiffres qui l'arrangent, donc biaisés, voire franchement faux.
via http://www.petitetremalfaisant.eu/shaarli/?8jCVRA
Comme lu dans un tweet : "L'essentiel monte le superflu baisse "
Article en relation : http://www.lemonde.fr/les-decodeurs/article/2014/05/03/en-dix-ans-quels-prix-ont-le-plus-augmente_4410761_4355770.html
EDIT : voir aussi http://www.mypersonnaldata.eu/shaarli/?hCB6qA, qui indique au passage les BDD sur le site de l'INSEE http://www.bdm.insee.fr/bdm2/choixCriteres.action?codeGroupe=158
Pas cool, mais pas étonnant. Dans le même genre, j'avais écrit ça au début de l'année : http://chroniques-de-sammy.blogspot.fr/2013/01/rendez-nous-la-fin-du-monde.html
La croissance est un phénomène récent à l'échelle de l'histoire du monde, et le monde a fondamentalement changé avec la révolution industrielle
"Voici un article qui en parle, avec des graphiques qui paraissent stupéfiants de prime abord :
– il n’y avait pas du tout de #croissance par habitant avant 1800 (dans le monde entier)...
– avant 1800, la zone géographique au plus fort PIB était de très loin l’Asie.
– le #PIB par habitant en Chine n’a presque pas augmenté avant 1960"
(je copie-colle @james sur Seenthis : http://seenthis.net/messages/162407)
EDIT : et voilà, Seenthis vient de produire des liens complémentaires pour qui veut fouiller le sujet
http://seenthis.net/messages/61749
http://seenthis.net/messages/77280
Compterus de vitesse, montrant le nombre de tweets à la minutes à Paris, New-York, Londres, Barcelone, Tokyo...