-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathbirds_mfa.qmd
More file actions
276 lines (200 loc) · 14.1 KB
/
birds_mfa.qmd
File metadata and controls
276 lines (200 loc) · 14.1 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
---
title: "Communautés d'oiseaux dans les Alpes françaises"
author: "___"
date: "`r Sys.Date()`"
format:
html:
code-fold: true
code-tools: true
toc: true
editor: visual
lang: fr
editor_options:
chunk_output_type: inline
bibliography: references.bib
---
# Introduction et but
Les massifs montagneux des Alpes françaises offrent une diversité d'habitats pour les oiseaux, favorisant ainsi une grande variété d'espèces. La fréquentation humaine, variable selon le relief et l'accessibilité des lieux, joue un rôle important dans la répartition de ces espèces. En effet, les zones plus difficiles d'accès abritent souvent des oiseaux plus farouches qui ne supportent pas la proximité de l'homme.
L'objectif de cette étude est d'identifier les stations alpines et/ou les espèces qui présentent des particularités par rapport aux autres du point de vue de la distribution des oiseaux.
# Matériel et méthodes
Le jeu de données est issu du package {ade4} (`atlas`). Ces données proviennent de l'ouvrage de @lebreton1977. La répartition de 19 espèces aviaires est étudiée dans 23 régions des Alpes françaises. Les températures et les précipitations dans chaque station sont également mesurées pour déterminer l'influence des facteurs environnementaux.
L'analyse est réalisée avec le logiciel R (`r R.version.string`) et en particulier le package {exploreit} version `r packageVersion("exploreit")` dans la [SciViews Box 2025](https://www.sciviews.org/software/svbox/). [Saturn Cloud](https://saturncloud.io/) (Linux Ubuntu 22.04) est utilisé pour exécuter le code et compiler la version HTML de ce bloc-notes.
```{r setup, include=FALSE}
# Ceci est nécessaire pour les tests SDD, ne pas utiliser dans un "vrai" projet
if (!"tools:tests" %in% search())
source(here::here("tests/tools_tests.R"), attach(NULL, name = "tools:tests"))
# Configure Knitr pour utiliser AGG comme périphérique graphique
knitr::opts_chunk$set(dev = "ragg_png")
# Configuration de l'environnement SciViews::R
SciViews::R("___", lang = "fr")
```
<!--% Spécifiez si vous avez employé l'intelligence artificielle dans votre projet. -->
```{r ai_comment, output='asis'}
select_answer(r"-{
[] - Ce document a été rédigé en étant assisté par l'Intelligence Artificielle.
[] - Ce document a été rédigé sans recours à l'Intelligence Artificielle.}-")
```
<!-- Précisez ci-dessous l'utilisation que vous avez faite de l'IA. Citez le modèle utilisé. -->
# Résultats
## Description des données météorologiques
Les températures minimales et maximales en janvier et en juillet, ainsi que les précipitations en millimètres pour ces deux mois et sur l'ensemble de l'année sont recensées. Ces données sont collectées et analysées dans les 23 stations étudiées.
<!--% Importez le jeu de données `meteo` se trouvant dans le dossier `data` sous le nom de `alps_meteo.csv`. Décrivez-le à l'aide de skimr::skim(). -->
```{r importmeteo, record='RODFS', object='meteo'}
meteo <- ___
___
```
<!--% Réalisez une matrice de nuages de points pour visualiser la relation entre les variables quantitatives d'intérêt à l'aide de la fonction `ggscatmat()` du package {GGally}. Le triangle supérieur de la matrice affichera les corrélations de Pearson par défaut, ce qui vous permettra d'évaluer la corrélation linéaire entre les variables. -->
```{r scatmat, record='RNP', arg='labels'}
___
```
<!--% Interprétez vos tableaux et votre graphique ci-dessous. -->
```{r descmeteocomment, output='asis'}
select_answer("
[] - Ce jeu de données ne contient aucune valeur manquante.
[] - Certaines valeurs sont manquantes dans ce tableau.
[] - Nous recensons 23 valeurs manquantes dans ce tableau.
[] - Ce tableau inclut uniquement des variables numériques, réparties en deux ensembles : l’un pour les variables de température et l’autre pour les variables de précipitations.
[] - Le tableau comporte une colonne relative aux stations, ainsi que deux ensembles de variables : l’un pour les variables de température et l’autre pour les variables de précipitations.
[] - Les valeurs médianes sont similaires entre les variables numériques.
[] - Les valeurs médianes diffèrent considérablement entre les variables numériques.
[] - Les coefficients de corrélation de Pearson entre les variables quantitatives sont très faibles.
[] - Les coefficients de corrélation de Pearson sont élevés entre les variables de température et entre les variables de précipitations.
[] - Les coefficients de corrélation de Pearson entre les variables quantitatives sont très élevés.
")
```
## Description des recensements des oiseaux
Le tableau et le graphique ci-dessous illustrent les données récoltées lors de l'observation de 19 espèces d'oiseaux dans les 23 stations. Les niveaux d'abondance observés ont été regroupés en 4 catégories :
- 0 : Absent
- 1 : Rare
- 2 : Abondant
- 3 : Très abondant
<!--% Importez le jeu de données `birds` se trouvant dans le dossier `data` sous le nom de `alps_birds.csv`. Décrivez-le avec skimr::skim(). -->
```{r importbirds, record='RODFS', object='birds'}
birds <- ___
___
```
<!--% Visualisez ces données sur un graphique de type raster en utilisant geom_raster(). Remplacez les labels de stations par des nombres de 1 à 23 pour plus de lisibilité sur le graphique. Les labels du graphiques sont "Abondance", "Espèce", "Station".-->
```{r raster, record='RNP', arg='labels'}
birds %>.%
smutate(., station = 1:nrow(birds)) %>.%
spivot_longer(., ___) %>.%
chart(___) +
___ +
labs(___)
```
<!--# Comme ce graphique est identique à celui traité dans le module précédent, l’interprétation est reprise du projet correspondant. -->
- Dans notre jeu de données, nous avons 19 variables qualitatives ordonnées.
- Ce jeu de données est complet, sans aucune valeur manquante.
- Les données sont déjà encodées de manière appropriée, ce qui signifie qu'elles ne nécessitent pas de transformation supplémentaire.
- Les stations 15 à 23 ont tendance à accueillir davantage d'oiseaux.
- Parmi les espèces observées, la fauvette mélanocéphale est la moins abondante.
## Ordination
<!--% Fusionnez les deux tableaux `meteo` et `birds` en un seul tableau nommé `alps`. Transformez ensuite la colonne station en noms de ligne en utilisant la fonction `column_to_rownames()`.-->
```{r bind, record='RODFS', object='alps'}
# Fusion des deux tableaux
alps <- ___
# Nom de lignes
alps <- ___
```
<!--% Effectuez une analyse factorielle multiple (AFM) sur `alps` et stockez l'objet résultant dans la variable `alps_mfa`. Ensuite, affichez le résumé de `alps_mfa`. Lors de l'analyse, traitez les variables de dénombrement comme des variables destinées à l'analyse de fréquence. -->
```{r mfa, record='ROP', object='alps_mfa'}
alps_mfa <- ___
___
```
<!--% Tracez le graphique des éboulis de votre AFM. -->
```{r screemfa, record='RNP', arg='labels'}
___
```
<!--% Interprétez le résumé de l'AFM et de son graphique des éboulis. -->
```{r screemfacomment, output='asis'}
select_answer(r"-{
[] - Le premier axe de l'AFM représente la quasi totalité de la variance. Il y a un effet saturant marqué.
[] - Le premier axe de l'AFM reprend un peu plus de la moitié de la variance.
[] - Le second axe de l'AFM couvre 0.566 % la variance.
[] - Le second axe de l'AFM couvre 16 % la variance.
[] - Le second axe de l'AFM couvre 64 % de la variance.
[] - Le premier plan de l'AFC couvre presque les 7/10 de la variance totale, mais cela est totalement insuffisant.
[] - Le premier plan de l'AFM couvre presque les 7/10 de la variance totale, ce qui est parfait pour notre analyse.
[] - Le premier plan de l'AFC couvre presque les 7/10 de la variance totale, et nous nous en contenterons.}-")
```
<!--% Créez un graphique représentant la répartition des variables dans le premier plan de l'analyse factorielle multiple (AFM). -->
```{r loadingsmfa, record='RNP', arg='labels'}
___
```
<!--% Interprétez le graphique représentant la répartition des variables dans le premier plan de l'AFM. -->
```{r loadingsmfacomment, output='asis'}
select_answer(r"-{
[] - Toutes les variables sont bien représentées dans le plan de l’AFM.
[] - Toutes les variables sont mal représentées dans le plan de l’AFM.
[] - Les précipitations en janvier sont corrélées avec les précipitations en juillet.
[] - Les précipitations en janvier ne sont pas corrélées avec les précipitations en juillet.
[] - Les précipitations en janvier sont inversement corrélées avec les précipitations en juillet.
[] - Les maximums de températures sont fortement corrélés avec le premier axe de l’AFM.
[] - Les maximums de températures sont fortement corrélés avec le second axe de l’AFM.
[] - Les maximums de températures ne sont corrélés avec aucun des deux axes, en particulier de l’AFM.
[] - Globalement, les variables de températures sont inversement corrélées avec les variables de précipitations.
[] - Globalement, les variables de températures sont corrélées avec les variables de précipitations.
[] - Globalement, les variables de températures ne sont pas corrélées avec les variables de précipitations.
}-")
```
<!--% Tracez un graphique représentant la répartition des axes dans le premier plan de l'AFM. -->
```{r axesmfa, record='RNP', arg='labels'}
___
```
<!--% Visualisez la répartition des groupes dans le premier plan de l'AFM. -->
```{r groupsmfa, record='RNP', arg='labels'}
___
```
<!--% Interprétez les graphiques représentant la répartition des axes et des groupes dans le premier plan de l'AFM. -->
```{r groupsmfacomment, output='asis'}
select_answer(r"-{
[] - Les premiers axes des deux groupes sont corrélés avec le premier axe de l'AFM.
[] - Les premiers axes des deux groupes sont corrélés avec le second axe de l'AFM.
[] - Les seconds axes des deux groupes sont corrélés avec le premier axe de l'AFM.
[] - Les seconds axes des deux groupes sont corrélés avec le second axe de l'AFM.
[] - Le groupe associé aux dénombrements d’oiseaux structure globalement le premier axe de l’AFM.
[] - Le groupe associé aux dénombrements d’oiseaux structure globalement le second axe de l’AFM.
[] - Le groupe associé aux variables environnementales structure globalement le premier axe de l’AFM.
[] - Le groupe associé aux variables environnementales structure globalement le second axe de l’AFM.}-")
```
<!--% Ordinez les stations et les espèces dans le premier plan de l'AFM. -->
```{r contingencymfa, fig.width=10, record='RNP', arg='labels'}
___
```
<!--% Interprétez ce graphique. -->
```{r contingencymfacomment, output='asis'}
select_answer(r"-{
[] - Les stations sont très dispersées.
[] - Les stations sont parfaitement regroupées.
[] - Les stations sont regroupées en 3 groupes. Le premier groupe est composé de la station 7. On retrouve un second groupe avec la station 16 et 22. Le dernier groupe reprend tous les autres.
[] - Les stations sont regroupées en 4 groupes. Le premier groupe est composé de la station 7. On retrouve un second groupe avec les stations 16 et 22. Un troisième groupe avec les stations de 1 à 8 moins la 7. Un quatrième groupe avec les stations 9 à 23 moins la 16 et la 22.
[] - Toutes les espèces d'oiseaux sont regroupées.
[] - Toutes les espèces d'oiseaux sont dispersées.
[] - Plusieurs espèces d'oiseaux sont bien regroupées, mais trois fauvettes se détachent nettement.
[] - Les fauvettes mélanocéphale et pitchou (et dans une moindre mesure la fauvette passerinette) tirent les données à droite et sont abondantes dans les stations 16, 22.
[] - Les fauvettes mélanocéphale et pitchou (et dans une moindre mesure la fauvette passerinette) tirent les données à droite extrémité par leur absence de la quasi-totalité des stations.
[] - Les stations 16, 22 sont caractérisées par les trois fauvettes citées ci-dessus.
[] - Les stations 16, 22 sont caractérisées par la présence importante, entre autres, des fauvettes orphee et passerinette et du hibou petit duc.
[] - Les stations 16 et 22 sont caractérisées par la présence importante de la fauvette orphee et du hibou petit duc.
[] - La station 7 est marquée par des précipitations plus importantes que dans les autres stations.
[] - La station 7 est marquée par des précipitations plus faibles que dans les autres stations.
[] - La station 7 est marquée par des températures minimales et maximales plus marquées que dans les autres stations.}-")
```
# Discussion et conclusions
<!--% En conclusion, l'AFM vous semble-t-elle être un outil adéquat pour atteindre l'objectif de ce travail ? Concluez en deux phrases. Est ce que l'AFM vous donne des résultats plus intéressants que l'AFC (voir projet B07Ia_acp_afc) ? Pourquoi ? -->
```{r conclumfa_comment, output='asis'}
select_answer(r"-{
[] - Par rapport à l’AFC menée sur les seuls dénombrements, l’AFM intègre simultanément les dénombrements d’oiseaux et les variables météorologiques.
[] - Le premier plan de l’AFM (~70 % de variance) explique légèrement plus d’inertie que le premier plan de l’AFC (~65 %).
[] - En AFM et l'AFC permettent d'avoir les mêmes groupements parmi les stations.
[] - En AFM, la station 7 se détache principalement par des précipitations plus élevées ; cet effet n’apparaissait pas dans l’AFC.
[] - Les stations 16 et 22 restent isolées dans les deux analyses.
[] - Les stations 16 et 22 sont regroupées avec les stations 9-23.
[] - Tout comme dans l’AFC, la station 23 est associée aux stations 16 et 22.
[] - Contrairement à l’AFC, la station 23 rejoint le groupe des stations 9–23 (hors 16 et 22).
[] - L'AFM et l'AFC donnent les mêmes résultats. Il n'était pas utile de réaliser un AFM.
[] - L’AFM ne fournit aucune information supplémentaire par rapport à l’AFC.
[] - Pour répondre à l’objectif (identifier stations et espèces particulières), l’AFM est adéquate et complète l’AFC en mettant en relation faune et climat.}-")
```
# Référence
<!--% Ne rien indiquer ici. La référence bibliographique se placera automatiquement ici.-->