UA-64832042-1

Pourquoi mélanger les types de cancer ?

+4 votes
asked Feb 13, 2016 in Methodology by Bruno
Sur un aspect méthodologique,

Comment remplir les missing value , si on a melanger les types de cancer ?

Ne melange t on pas les choux et les carottes ?
commented Feb 29, 2016 by Camélia
Sur un aspect méthodologique, il y a une orientation vers des "cancers par type de biomarqueur". Par type de cancer, c'est en voie d'être révolu. Ou alors ce serait en 2 temps : par type de cancer puis par type de biomarqueur.

2 Answers

0 votes
answered Feb 13, 2016 by nowami Beginner (250 points)
pour les missing values,  dans le doute vous pouvez vous abstenir. Ceci étant si vous parvenez à estimer des valeurs moyennes , vous pouvez les y substituer
+1 vote
answered Feb 13, 2016 by Edouard Debonneuil

Bonne remarque: il s'agit *justement* de ne pas mélanger choux et carotte! Il faut modéliser les deux! Les risques de cancer du poumon ne sont pas exemple pas ceux du sein. Donc lorsque l'on dit Y = f(X), Y est à considérer comme un vecteur.

Certains facteurs de risque sont communs à un grand nombre de types de cancer, et il est par exemple possible de s'appuyer sur cela pour rendre la modélisation plus robuste, mais pas trop n'en faut car différents cancers sont sensibles de façon différente à différentes variables => à vous de voir (ou à votre programme d'apprentissage) si vous modélisez chacune des 32 familles de cancer de façon totalement disjointe ou non.

commented Feb 13, 2016 by Bruno
merci. En fait de la façon dont est fait le starter kit , on cherche Y comme scalaire.
commented Feb 13, 2016 by anonymous
Ah, c'est pour faire mieux ensuite.

Autre segmentation en lien avec la question éthique (http://qa.epidemium.cc/index.php?qa=2&qa_1=prendre-exemple-sensibilit%C3%A9-cancer-prostate-fonction-ethnies) : il peut être judicieux de spérarer certaines populations et certains cancers:
des sur-risques ont été bien identifiés dans la littérature sur le cancer de la prostate chez les afro-américains, le cancer du sein chez les 'blancs', le cancer du colon en Europe de l'Est: si vous modéliser ces cas de façon séparée (ou partiellement séparée suivant le type de modélisation choisi) cela devrait non seulement permettre théoriquement d'avoir un meilleur score au RAMP (ok) mais peut-être surtout d'un point de vue santé de trouver des facteurs de risques ou prévention pour lesquels ces populations sont plus sensibles: d'un point de vue fondamental épidémiologiste ces populations peuvent être un "magnifier de certains risques" et d'un point de vue santé il y a peut-être des "quick win" (relatifs)
commented Feb 29, 2016 by Marie
Cela marche aussi dans l'autre sens. E.g. : études sur les produits laitiers faites en Suède (qui concluent plus ou moins que les gens qui mangent du fromage sont en meilleure santé globalement que ceux qui ne mangent aucun produit laitier, alors que les scandinaves ont une tolérance des produits laitiers qui est TRÈS LOIN d'être la norme mondiale).
On ne peut pas en conclure que ces produits sont très bon pour la santé.
Edit : Ce n'est pas vraiment que ça "marche dans l'autre sens", mais c'est une remarque qui me semblait-il, pouvait avoir son utilité.
Welcome to Epidemium Q&A, where you can ask questions and receive answers from other members of the community.
...