Depuis le début des années 2000, un nouveau logiciel gagne en importance et s’impose progressivement comme une référence, au même titre que les trois principaux logiciels d’analyse de données qui dominent le marché.
On peut imaginer que les utilisateurs de logiciels statistiques vont progressivement converger vers R
Licence SPSS Base edition
Logiciel/Système | Windows | MacOS | Linux | BSD | Autres Unix |
---|---|---|---|---|---|
SAS | oui | terminé | oui | non | oui |
SPAD | oui | non | non | non | non |
SPSS | oui | oui | non | non | non |
Stata | oui | oui | oui | non | non |
https://fr.wikipedia.org/wiki/Comparaison_des_logiciels_de_statistiques
Ils offrent peu ou pas d’analyse de réseau, d’analyse de séquence, de léxicométrie (sauf SPAD)… Et très peu de fonctionnalités de valorisation.
La gestion centralisée induit des limites de :
C’est pour cela que l’on préfère R !
Deux langages très utilisés pour l’analyse et le
traitement des données.
Très souvent comparés pour leurs fonctionnalités
semblables…
Le choix entre R et Python dépend
surtout de
Qui je suis et de ce que je veux faire
?
différentes…
R a autant de cerveau…
Pour les utilisateurs moins avancés en
programmation
spécialisés dans l’analyse statistique
…que Python a du muscle !
Pour les utilisateurs avancés en programmation
spécialisés dans la science de données
R se base sur le langage de programmation S, créé en 1988
https://blog.revolutionanalytics.com/2017/10/updated-history-of-r.html
Résultat de 30 années de recherche & développement
Des acteurs économiques importants financent le développement de R : Microsoft, Google, Oracle, Esri…
Logiciel/Sytsème | Windows | MacOS | Linux | BSD | Autres Unix |
---|---|---|---|---|---|
R | oui | oui | oui | oui | oui |
R propose 2954 fonctions standard (primitives)
Sur ce socle commun peut s’ajouter de nombreux
packages, mis à disposition sur le
Comprehensive
R Archive Network (CRAN). Ex :
R a une structure modulaire qui offre toute une gamme d’applications possibles. Son expansion n’est limitée que par les contributions.
Nombre de packages disponibles sur le CRAN
Les packages mises à disposition permettent d’opérer sur l’ensemble de la chaîne de traitement. De la collecte des données à la valorisation des résultats (gaphique, document, site web…)
Cette polyvalence permet à R de compléter, de concurrencer voire de remplacer toute une série de logiciels existants
L’information circule vite dans les communautés des logiciels libres.
La recherche reproductible, c’est le partage et la transparence !
RStudio (aujourd’hui Posit) est une entreprise qui développe et publie des logiciels et des services basés sur R. C’est l’acteur le plus important de la communauté.
Rstudio a développé plusieurs packages de référence. Ex :
Rstudio propose également un Environnement de Développement Intégré (IDE), qui facilite énormément l’utilisation de R.
Interface de R sur Windows
Pas d’interface sur Linux (terminal)
L’IDE Rstudio facilite l’apprentissage de R et son utilisation
Parce que c’est simple, complet et en constante évolution…
Utilisez l’environnement RStudio!
L’installation de R et de l’IDE Rstudio se fait comme n’importe quel logiciel. Connectez-vous au CRAN pour télécharger R.
Téléchargez la version “Desktop” (gratuite) sur le site de Rstudio
Lancez Rstudio (pas R) pour commencer.
De nombreuses ressources sont référencées sur…
R version 4.2.1 (2022-06-23)
https://gitlab.huma-num.fr/elementr/session_1/Presentation_R
https://elementr.gitpages.huma-num.fr/session_1/Presentation_R/#/