UA-64832042-1

Qui aimerait maintenir en R ou python sous GitHub la grande matrice [Y|X]?

0 votes
asked Feb 15, 2016 by anonymous
Bonjour, à l'occasion du projet cancer baseline (http://wiki.epidemium.cc/wiki/Baseline) nous avons collecté et assemblé près de 2000 jeux de données, en une grande matrice [Y (risques de cancers) | X (facteurs de risque potentiels)].

Pour l'instant, l'assemblage a été documenté dans des wiki puis assemblé dans des fichiers excel du fait de ce que les participants du projet maitrisent. Cependant, si nous voulons une meilleure traçabilité et une possibilité d'élargissement fort (international) de la communauté derrrière cette matrice, nous avons besoin de mettre cela dans une sructure informatique adéquate -- typiquement R ou python.

Y a-t-il ici des volontaires pour créer la base actuelle en R ou python à partir des sources et mettre ça dans https://github.com/Epidemium/Baseline et s'appuyer sur des communautés R/python existantes pour contribuer à pérenniser les efforts autour de cette matrice?

Egalement, pour l'instant nous avons commencé à collecter et assembler les données à la main pour voir ce qui est faisable mais idéalement des informations viendraient s'y ajouter également automatiquement comme proposé par le projet oncobase, projet qui pourrait relayer les efforts jusqu'à présents manuels.

Merci!

Your answer

Your name to display (optional):
Privacy: Your email address will only be used for sending these notifications.
Welcome to Epidemium Q&A, where you can ask questions and receive answers from other members of the community.
...