Skip to content

Commit dd408a9

Browse files
Fiche_import_fichiers_parquet.qmd - Màj lien page Parquet du cours de Lino Galiana (#556)
Le lien était cassé
1 parent b651b3f commit dd408a9

1 file changed

Lines changed: 1 addition & 1 deletion

File tree

03_Fiches_thematiques/Fiche_import_fichiers_parquet.qmd

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -62,7 +62,7 @@ Inversement, le format Parquet présente deux contraintes inhabituelles pour les
6262
- Il n'est pas possible d'ouvrir un fichier Parquet avec Excel, LibreOffice ou Notepad.
6363

6464
Pour en savoir plus notamment sur la comparaison entre les formats Parquet et csv, consultez
65-
[le chapitre sur le sujet](https://pythonds.linogaliana.fr/reads3/#le-format-parquet) dans le cours de l'ENSAE _"Python pour la data science"_.
65+
[le chapitre sur le sujet](https://pythonds.linogaliana.fr/content/manipulation/05_parquet_s3.html#le-format-parquet) dans le cours de l'ENSAE _"Python pour la data science"_.
6666
Grâce aux travaux du projet Arrow, **les fichiers aux format Parquet sont inter-opérables** c'est-à-dire qu'ils peuvent être lus par plusieurs langages informatiques : [C](https://arrow.apache.org/docs/c_glib/), [C++](https://arrow.apache.org/docs/cpp/), [C#](https://github.com/apache/arrow/blob/main/csharp/README.md), [Go](https://godoc.org/github.com/apache/arrow/go/arrow), [Java](https://arrow.apache.org/docs/java/), [JavaScript](https://arrow.apache.org/docs/js/), [Julia](https://arrow.apache.org/julia/stable/), [MATLAB](https://github.com/apache/arrow/blob/main/matlab/README.md), [Python](https://arrow.apache.org/docs/python/), [Ruby](https://github.com/apache/arrow/blob/main/ruby/README.md), [Rust](https://docs.rs/crate/arrow/) et bien entendu [R](https://arrow.apache.org/docs/r/). Le format Parquet est donc particulièrement adapté aux chaînes de traitement qui font appel à plusieurs langages (exemples: manipulation de données avec `R` puis _machine learning_ avec Python).
6767

6868
S'il est très efficace pour l'analyse de données, **Parquet est en revanche peu adapté à l'ajout de données en continu ou à la modification fréquente de données existantes**.

0 commit comments

Comments
 (0)